客户端
游戏
无障碍

0

评论

收藏

分享

手机看

微信扫一扫,随时随地看

刷屏 | 你的机器人伙伴又又又又进化了!

图片图片

继3月10日发布首个具身基座模型GO-1后,3月11日上午,上海AI企业智元机器人宣布其新款人形机器人灵犀X2上线。该企业首席技术官彭志辉称,创业这两年,目睹了人形机器人行业的悄然爆发。他一直的梦想是,能够造出和人类一样灵活和智能的机器人。


据彭志辉更新的视频显示,除了常规的行走、跑、跳舞外,灵犀X2还会举重、踩滑板车、玩平衡车以及骑自行车。彭志辉称,灵犀X2是一台具备复杂交互能力的“灵动机器人”。灵犀X2可以装配灵巧手等末端,具备精细操作的能力。随着机器人具身大脑的持续迭代,未来智元会赋予机器人更多复杂作业的能力。



图片

会骑自行车的人形机器人


据彭志辉介绍,灵犀X2身高1.3米左右,他在视频中通过与这台机器人的互动交流,展示了其交互反应,以及基于VLM的硅光动语多模态模型所赋予的通过视觉理解和认知世界的能力。

踩滑板车、踩平衡车、骑自行车、还能给葡萄缝针。3月11日,智元机器人正式发布了双足智能交互人形机器人灵犀X2。据悉,灵犀X2融合了运动、交互、作业三大智能。智元机器人联合创始人强调,灵犀X2是第一台真正具备复杂交互能力的 “灵动机器人”。团队还精心设计了诸多细节,使其更具“人味儿”,比如模仿人类呼吸韵律、拥有好奇心和注意力机制,还能通过小动作等肢体语言进行交流。

戳,看更有“人味儿”的机器人↓


图片
灵犀X2骑自行车(视频截图)

彭志辉介绍,灵犀X2的本体设计中融合了大量的创新思考,比如把机器人的硬件系统抽象出了一系列可复用的核心组件,包括小脑控制器Xyber-Edge、域控制器Xyber-DCU、智能电源管理系统Xyber-BMS,以及核心关节模组Powerflow等。通过这些组件,能够使用飞控来快速搭建起一套可靠的人形机器人系统。同时,灵犀X2使用了抗摔的柔性材料,全身拥有28个自由度,未使用任何并联结构。

图片

“借助当前最火热的大语言模型技术,还为X2训练了能定制的多模态交互大模型,所以,X2也是一台具备复杂交互能力的‘灵动机器人’。”彭志辉透露,在语音和视觉之外,他们还把动作模态也集成到了模型当中,让X2有很多可爱的小动作,还有远程裸眼3D交流。“我们正在完善X2的思维模型,结合硅光动语大模型,未来会赋予机器人更多情绪表达的能力。”

同时,灵犀X2采用轻量化设计,可模块化拓展,拥有完备的二次开发接口,以及预训练模型和“采-训-推”一站式方案,用户可根据需求自由探索,为康养、服务、家庭陪伴等各类场景打造应用。

图片

此前发布首个通用具身基座大模型


3月10日上午,智元机器人正式发布首个通用具身基座大模型——智元启元大模型GO-1。


智元提出了Vision-Language-Latent-Action(ViLLA)架构,该架构由VLM(多模态大模型) + MoE(混合专家)组成。智元启元大模型GO-1借助人类和多种机器人数据,让机器人获得了学习能力,可泛化应用到各类环境和物品中,快速适应新任务、学习新技能。同时,它还支持部署到不同的机器人本体,并在实际的使用中持续进化。


图片

智元机器人服务场景


举例来说,用户给出指令告诉机器人要做的事情,比如“挂衣服”,模型就可以根据看到的画面,理解这句话对应的任务要求。然后,模型根据之前训练时看过的挂衣服流程,设想这个过程应该包括哪些操作步骤,最后执行这一连串的步骤,完成整个任务的操作。


在更深层的技术层面,GO-1大模型具备了通用的场景感知和理解能力。在构建和训练阶段,该大模型学习了互联网的大规模纯文本和图文数据,因此能够理解“挂衣服”在此情此景下的含义和要求;学习过人类操作视频和其他机器人的各种操作视频,所以能知道挂衣服这件事通常包括哪些环节;学习过仿真的不同衣服、不同衣柜、不同房间,模拟过挂衣服的操作,所以能理解环节中对应的物体和环境,并打通整个任务过程;最后,因为学习过真机的示教数据,所以机器人能完成整个任务的操作。



图片

图片


点击下方,关注天津经济广播


图片


-END-


综合 | 澎湃新闻  央视财经 

编辑 | 高晶

微信转载须注明来源


民生热点 | 权威信息

温馨提示 | 贴心服务


图片

点亮并分享,让朋友看到

免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部