+关注

手机看

微信扫一扫，随时随地看

腾讯混元开源5款全新3D生成模型；ChatGPT Android测试版上线 | AI日报

AI新榜

2025-03-18 19:01AI新榜官方账号

+关注

欢迎围观“AI新榜”的「AI日报」栏目。AIGC前沿资讯，及时拿捏！

【1分钟速看版】

🚀 腾讯混元开源5款全新3D生成模型

🗺️ 百度地图推出智能眼镜解决方案：提供AR导航，已接入DeepSeek

💬 钉钉推出AI客服助理，已有700家企业接入

🌟 阿里QwQ-32B大模型集成至国家超算互联网平台

👾 摩尔线程开源MT-MegatronLM和MT-TransformerEngine两大AI框架

🧑‍🚀 即梦AI发起AI科幻短片征集

📱 ChatGPT Android测试版上线：可设置为手机默认数字助理，替代谷歌Gemini

🆓 谷歌升级Gemini 2.0系列模型，免费开放AI助手深度推理功能

🌠 Roblox发布AI建模工具Cube

国内资讯

1. 腾讯混元开源5款全新3D生成模型

3月18日，在腾讯混元3D开源日活动中，腾讯混元宣布推出5个全新3D生成模型，在生成速度、细节和材质表达上均有提升，并且全部开源。

腾讯混元3D生成模型家族

同时，其自研的3D AI创作引擎也迎来升级，新增多视图输入、模型智能减面、格式全兼容等能力，面向C端用户全面开放使用。最新开源模型包括多视角形状模型Hunyuan 3D-2mv和0.6 B形状模型Hunyuan 3D-2mini等。‍

开源地址：https://github.com/Tencent/Hunyuan3D-2

2. 百度地图推出智能眼镜解决方案：提供AR导航功能，接入DeepSeek

3月18日，在VisionXAI智能眼镜产业大会上，百度地图宣布推出智能眼镜解决方案。

该方案通过自然语言交互，覆盖用户出行全流程，行程中提供AR导航功能。此外，支撑智能眼镜解决方案的“AI智能体”，现已完成DeepSeek接入，文心+DeepSeek双重加持。

百度地图智能眼镜解决方案号称覆盖用户出行全流程：

出行前，只需通过语音交互，“AI智能体”就能快速为用户规划路线；

行程中提供AR导航功能，将真实街景与导航信息深度融合；

抵达后，“AI智能体”还能根据用户偏好，智能推荐目的地周边地点。

此外，针对用户高频出行的场景，还提供了专属功能：

驾车用户可以智能标记停车位位置并实现一键导航寻车；

公交出行时，提供车辆位置及上下车站点的实时提醒；

外出旅游时，“AI智能体”支持语音问答和景点讲解；

在易迷路的室内场所，室内AR导航可快速定位商场、医院等地点，解决室内寻路难题。

3. 钉钉推出AI客服助理，已有700家企业接入

3月17日，钉钉官方宣布推出AI客服助理，支持自动接入企业官网、公众号，直接服务消费者和企业客户。据官方介绍，这项能力推出后，云深处科技、Rokid（乐奇）、瑞德林、艾为电子、精准学等700多家企业已接入。

据介绍，钉钉AI客服助理支持多轮对话理解用户需求，并回复“产品参数对比”等深度问题。用户提问时，客服助理会在知识库里寻找答案，再结合大模型理解能力，给出回答。此外，钉钉还开放了将AI助理部署至微信服务号、订阅号、小程序和企业官网等外部平台的能力。

4. 阿里QwQ-32B大模型集成至国家超算互联网平台

3月17日，国家超算互联网平台宣布QwQ-32B推理大模型正式集成至Chatbot可视化对话服务与API在线调用服务。

据悉，QwQ-32B是阿里Qwen团队发布的推理模型，基于Qwen2.5-32B+强化学习构建。据官方公示的基准评测结果，在测试数学能力的AIME24评测集上，以及评估代码能力的LiveCodeBench中，QwQ-32B表现与DeepSeek-R1相当，胜于o1-mini及相同尺寸的R1蒸馏模型。

现国家超算互联网平台一级栏目新增Chat对话入口，用户可零门槛体验QwQ-32B的多轮交互能力、长文本解析等能力，覆盖学术研究、代码生成、日常咨询等场景需求。目前，平台推出新用户活动，用户注册可获得免费100万Tokens。

5. 摩尔线程开源MT-MegatronLM和MT-TransformerEngine两大AI框架

3月17日，摩尔线程官方宣布已正式开源MT-MegatronLM与MT-TransformerEngine两大AI框架。这两大框架通过深度融合FP8混合训练策略和高性能算子库，在国产全功能GPU上实现混合并行训练和推理，提升了训练效率与稳定性。

实际应用效果如下：

1. 高效训练：在全功能GPU集群上，Llama38B模型的训练任务，可以利用FP8在loss几乎无损的情况下MFU达到90%以上；

2. 复现DeepSeek满血版训练：摩尔线程已深度集成并开源对DeepSeek并行算法DualPipe的高效支持，MT-DualPipe可以完整接入MT-Megatron框架和MT-TransformerEngine框架，成功实现DeepSeekV3训练流程的完整复现，支持MLA、MTP及多种专家平衡策略；

3. 性能大幅优化：通过多种Transformer算子融合技术，显著提升了内存带宽利用率，有效缓解memorybound瓶颈，进一步释放国产GPU的硬件潜力。

MT-MegatronLM开源地址：https://github.com/MooreThreads/MT-MegatronLM

MT-TransformerEngine开源地址：https://github.com/MooreThreads/MT-TransformerEngine

摩尔线程Simumax开源地址：https://github.com/MooreThreads/SimuMax

6. 即梦AI发起AI科幻短片征集

3月18日，即梦AI发起“未来制作计划”AI科幻短片征集活动，征集时间为2025年3月17日至4月9日，入选作品将在第78届威尼斯国际电影节期间展映并有机会获得专业评审认可。

作品主题需围绕科技与未来，运用AI工具进行创意表达，时长30秒以内。获奖者不仅可获得未来科幻合作机会，还可加入顶级科幻制作团队进行深度交流。评审团队由科幻电影人、编剧、AI技术专家组成，为创作者提供专业指导。

上下滑动查看更多

海外资讯

7. ChatGPT Android测试版上线：可设置为手机默认数字助理，替代谷歌Gemini

近日，ChatGPT发布了最新Android测试版，可在设置中将ChatGPT设置为默认的数字助理。在设置后，长按Home按键、导航条或长按电源键都将默认启动ChatGPT，可替代谷歌Gemini。

ChatGPT用户在将Android版ChatGPT更新到最新测试版（1.2025.070）后，在Android系统设置中的“默认数字助理应用”中，可将默认的数字助理更改为ChatGPT。在通过长按Home按键、导航条或长按电源键唤醒数字助理后，屏幕上会出现ChatGPT的悬浮气泡。但目前该功能并不稳定，有时会直接打开ChatGPT的聊天模式。

目前，用户无法使用唤醒词来激活ChatGPT，必须使用规定的三种按键或手势来激活，因为使用唤醒词激活需要有谷歌信任的API接口且是系统预装的应用，目前ChatGPT并没有该API接口的权限。

8. 谷歌升级Gemini 2.0系列模型，免费开放AI助手深度推理功能

3月17日，谷歌公司宣布通过升级Gemini 2.0模型，推出AI概览（AI Overviews）和AI模式（AI Mode）功能。

其中，AI Overviews能通过AI生成搜索结果的智能摘要，覆盖更复杂的查询需求。AI Mode为实验性功能，以Gemini2.0为核心，以自然对话形式提供全AI响应，支持多轮追问与辅助链接跳转。

谷歌本次部署还推出了2.0 Flash、2.0 Pro及Personalisation三个实验性模型，覆盖安卓、iOS和网页端，并免费同步开放AI助手的Deep Research深度推理功能。

据悉，2.0 Flash相比前代，速度和效率更优，适合快速获取简洁答案。2.0 Pro性能更强，但谷歌未披露具体改进细节，需通过Google One AI Premium计划解锁（部分三星设备用户可免费获取）。Personalisation可调用用户Google搜索历史，优化了回答相关性与准确性。原仅限Gemini高级用户的Deep Research功能，现向所有用户开放。

Galaxy S23系列手机及网页端用户可直接免费使用2.0 Flash、Personalisation及Deep Research；Galaxy S25系列用户需绑定Google One AI Premium计划（三星设备附赠免费资格），解锁2.0 Pro。（综合消息）

9. Roblox发布AI建模工具Cube

3月17日，Roblox推出3D模型工具“Cube”的首个版本，旨在帮助创作者利用生成式AI制作3D物体。此外，Roblox还将于本周晚些时候开源该工具，任何非平台用户均可在此基础上进行开发。

Cube的核心功能“网格生成”目前处于测试阶段，创作者可通过简单的提示生成3D物体。例如，用户只需输入“生成一辆橙色带黑条纹的赛车”，即可自动创建该物体，还可以在Roblox Studio中对生成的物品进行进一步调整。Cube的开源版本支持根据需求进行定制、开发插件，或使用个人数据集训练模型。

此外，Roblox还宣布推出三项新AI工具：文本生成、文本转语音和语音转文本。其中，文本生成工具能让开发者为游戏加入AI驱动的文字交互，玩家可以与游戏中的非玩家角色（NPC）展开对话。文本转语音功能使开发者为游戏添加旁白、让NPC发声或加入语音字幕。语音转文本功能则允许玩家通过语音指令控制角色移动等操作。

Roblox还透露，未来还将推出“更复杂”的物体网格生成工具以及全新的场景生成工具。场景生成工具将使创作者能够生成完整的自然场景，例如让AI创建一个秋季森林，自动改变树叶的颜色。（来源：IT之家）

 一起研究AI

免责声明：本内容来自腾讯平台创作者，不代表腾讯新闻或腾讯网的观点和立场。