🚀 腾讯混元开源5款全新3D生成模型
🗺️ 百度地图推出智能眼镜解决方案:提供AR导航,已接入DeepSeek
💬 钉钉推出AI客服助理,已有700家企业接入
🌟 阿里QwQ-32B大模型集成至国家超算互联网平台
👾 摩尔线程开源MT-MegatronLM和MT-TransformerEngine两大AI框架
🧑🚀 即梦AI发起AI科幻短片征集
📱 ChatGPT Android测试版上线:可设置为手机默认数字助理,替代谷歌Gemini
🆓 谷歌升级Gemini 2.0系列模型,免费开放AI助手深度推理功能
🌠 Roblox发布AI建模工具Cube
国内资讯
3月18日,在腾讯混元3D开源日活动中,腾讯混元宣布推出5个全新3D生成模型,在生成速度、细节和材质表达上均有提升,并且全部开源。
腾讯混元3D生成模型家族
同时,其自研的3D AI创作引擎也迎来升级,新增多视图输入、模型智能减面、格式全兼容等能力,面向C端用户全面开放使用。最新开源模型包括多视角形状模型Hunyuan 3D-2mv和0.6 B形状模型Hunyuan 3D-2mini等。
开源地址:https://github.com/Tencent/Hunyuan3D-2
3月18日,在VisionXAI智能眼镜产业大会上,百度地图宣布推出智能眼镜解决方案。
该方案通过自然语言交互,覆盖用户出行全流程,行程中提供AR导航功能。此外,支撑智能眼镜解决方案的“AI智能体”,现已完成DeepSeek接入,文心+DeepSeek双重加持。
百度地图智能眼镜解决方案号称覆盖用户出行全流程:
出行前,只需通过语音交互,“AI智能体”就能快速为用户规划路线; 行程中提供AR导航功能,将真实街景与导航信息深度融合; 抵达后,“AI智能体”还能根据用户偏好,智能推荐目的地周边地点。
此外,针对用户高频出行的场景,还提供了专属功能:
驾车用户可以智能标记停车位位置并实现一键导航寻车;
公交出行时,提供车辆位置及上下车站点的实时提醒;
外出旅游时,“AI智能体”支持语音问答和景点讲解;
在易迷路的室内场所,室内AR导航可快速定位商场、医院等地点,解决室内寻路难题。
3月17日,钉钉官方宣布推出AI客服助理,支持自动接入企业官网、公众号,直接服务消费者和企业客户。据官方介绍,这项能力推出后,云深处科技、Rokid(乐奇)、瑞德林、艾为电子、精准学等700多家企业已接入。
据介绍,钉钉AI客服助理支持多轮对话理解用户需求,并回复“产品参数对比”等深度问题。用户提问时,客服助理会在知识库里寻找答案,再结合大模型理解能力,给出回答。此外,钉钉还开放了将AI助理部署至微信服务号、订阅号、小程序和企业官网等外部平台的能力。
3月17日,国家超算互联网平台宣布QwQ-32B推理大模型正式集成至Chatbot可视化对话服务与API在线调用服务。
据悉,QwQ-32B是阿里Qwen团队发布的推理模型,基于Qwen2.5-32B+强化学习构建。据官方公示的基准评测结果,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,QwQ-32B表现与DeepSeek-R1相当,胜于o1-mini及相同尺寸的R1蒸馏模型。
现国家超算互联网平台一级栏目新增Chat对话入口,用户可零门槛体验QwQ-32B的多轮交互能力、长文本解析等能力,覆盖学术研究、代码生成、日常咨询等场景需求。目前,平台推出新用户活动,用户注册可获得免费100万Tokens。
3月17日,摩尔线程官方宣布已正式开源MT-MegatronLM与MT-TransformerEngine两大AI框架。这两大框架通过深度融合FP8混合训练策略和高性能算子库,在国产全功能GPU上实现混合并行训练和推理,提升了训练效率与稳定性。
实际应用效果如下:
1. 高效训练:在全功能GPU集群上,Llama38B模型的训练任务,可以利用FP8在loss几乎无损的情况下MFU达到90%以上;
2. 复现DeepSeek满血版训练:摩尔线程已深度集成并开源对DeepSeek并行算法DualPipe的高效支持,MT-DualPipe可以完整接入MT-Megatron框架和MT-TransformerEngine框架,成功实现DeepSeekV3训练流程的完整复现,支持MLA、MTP及多种专家平衡策略;
3. 性能大幅优化:通过多种Transformer算子融合技术,显著提升了内存带宽利用率,有效缓解memorybound瓶颈,进一步释放国产GPU的硬件潜力。
MT-MegatronLM开源地址:https://github.com/MooreThreads/MT-MegatronLM
MT-TransformerEngine开源地址:https://github.com/MooreThreads/MT-TransformerEngine
摩尔线程Simumax开源地址:https://github.com/MooreThreads/SimuMax
3月18日,即梦AI发起“未来制作计划”AI科幻短片征集活动,征集时间为2025年3月17日至4月9日,入选作品将在第78届威尼斯国际电影节期间展映并有机会获得专业评审认可。
作品主题需围绕科技与未来,运用AI工具进行创意表达,时长30秒以内。获奖者不仅可获得未来科幻合作机会,还可加入顶级科幻制作团队进行深度交流。评审团队由科幻电影人、编剧、AI技术专家组成,为创作者提供专业指导。
上下滑动查看更多
海外资讯
近日,ChatGPT发布了最新Android测试版,可在设置中将ChatGPT设置为默认的数字助理。在设置后,长按Home按键、导航条或长按电源键都将默认启动ChatGPT,可替代谷歌Gemini。
ChatGPT用户在将Android版ChatGPT更新到最新测试版(1.2025.070)后,在Android系统设置中的“默认数字助理应用”中,可将默认的数字助理更改为ChatGPT。在通过长按Home按键、导航条或长按电源键唤醒数字助理后,屏幕上会出现ChatGPT的悬浮气泡。但目前该功能并不稳定,有时会直接打开ChatGPT的聊天模式。
目前,用户无法使用唤醒词来激活ChatGPT,必须使用规定的三种按键或手势来激活,因为使用唤醒词激活需要有谷歌信任的API接口且是系统预装的应用,目前ChatGPT并没有该API接口的权限。
3月17日,谷歌公司宣布通过升级Gemini 2.0模型,推出AI概览(AI Overviews)和AI模式(AI Mode)功能。
其中,AI Overviews能通过AI生成搜索结果的智能摘要,覆盖更复杂的查询需求。AI Mode为实验性功能,以Gemini2.0为核心,以自然对话形式提供全AI响应,支持多轮追问与辅助链接跳转。
谷歌本次部署还推出了2.0 Flash、2.0 Pro及Personalisation三个实验性模型,覆盖安卓、iOS和网页端,并免费同步开放AI助手的Deep Research深度推理功能。
据悉,2.0 Flash相比前代,速度和效率更优,适合快速获取简洁答案。2.0 Pro性能更强,但谷歌未披露具体改进细节,需通过Google One AI Premium计划解锁(部分三星设备用户可免费获取)。Personalisation可调用用户Google搜索历史,优化了回答相关性与准确性。原仅限Gemini高级用户的Deep Research功能,现向所有用户开放。
Galaxy S23系列手机及网页端用户可直接免费使用2.0 Flash、Personalisation及Deep Research;Galaxy S25系列用户需绑定Google One AI Premium计划(三星设备附赠免费资格),解锁2.0 Pro。(综合消息)
3月17日,Roblox推出3D模型工具“Cube”的首个版本,旨在帮助创作者利用生成式AI制作3D物体。此外,Roblox还将于本周晚些时候开源该工具,任何非平台用户均可在此基础上进行开发。
Cube的核心功能“网格生成”目前处于测试阶段,创作者可通过简单的提示生成3D物体。例如,用户只需输入“生成一辆橙色带黑条纹的赛车”,即可自动创建该物体,还可以在Roblox Studio中对生成的物品进行进一步调整。Cube的开源版本支持根据需求进行定制、开发插件,或使用个人数据集训练模型。
此外,Roblox还宣布推出三项新AI工具:文本生成、文本转语音和语音转文本。其中,文本生成工具能让开发者为游戏加入AI驱动的文字交互,玩家可以与游戏中的非玩家角色(NPC)展开对话。文本转语音功能使开发者为游戏添加旁白、让NPC发声或加入语音字幕。语音转文本功能则允许玩家通过语音指令控制角色移动等操作。
Roblox还透露,未来还将推出“更复杂”的物体网格生成工具以及全新的场景生成工具。场景生成工具将使创作者能够生成完整的自然场景,例如让AI创建一个秋季森林,自动改变树叶的颜色。(来源:IT之家)
一起研究AI