稚晖君搞了个“好东西”,网上的视频也能拿来训练机器人了 提高复杂任务成功率_网络热点_资讯_微发商务网

稚晖君搞了个“好东西”,网上的视频也能拿来训练机器人了 提高复杂任务成功率

   2025-03-12 09:35:30 差评XPIN微发商务网10
核心提示:上周五,稚晖君在微博预告了一波“好东西”。周一,智元机器人就展示了新产品。这款机器人能够端茶倒水、煮咖啡,还能把面包放进面包机,涂抹果酱,并将面包端到面前。此外,它还可以充当迎宾前台。不过,这些功能在现今的人形机器人视频中已不罕见

稚晖君搞了个“好东西”,网上的视频也能拿来训练机器人了 提高复杂任务成功率!上周五,稚晖君在微博预告了一波“好东西”。周一,智元机器人就展示了新产品。这款机器人能够端茶倒水、煮咖啡,还能把面包放进面包机,涂抹果酱,并将面包端到面前。此外,它还可以充当迎宾前台。

不过,这些功能在现今的人形机器人视频中已不罕见。真正值得关注的是智元机器人发布的基座大模型GO-1(Genie Operator-1)。这个大模型解决了人形机器人长期以来面临的数据匮乏和泛化能力差的问题。

目前,人形机器人表现不佳的一个重要原因就是缺乏高质量数据,而获取这些数据的成本非常高。去年底,智元机器人开源了百万真机数据集AgiBot World,涵盖了超过100万条轨迹、217个任务和106个场景。尽管如此,这些数据仍然不足以解决机器人泛化能力差的问题。

为此,智元机器人提出了新的ViLLA(Vision-Language-Latent-Action)架构,这是GO-1大模型的核心。与传统的VLA架构不同,ViLLA架构不仅依赖于大量标注过的真机数据,还能利用互联网上的大量人类视频数据。这意味着基于GO-1大模型的机器人可以通过观看视频来学习相应动作。

具体来说,ViLLA架构由VLM(多模态大模型)和MoE(混合专家)组成。VLM处理输入的视频数据,潜在动作模型将其拆解成关键步骤,如“抓取”、“移动”和“喝水”。接着,隐式规划器进一步细化这些步骤,生成更详细的指令。最后,动作专家将这些指令转换成机器人可以理解并执行的动作信号。

 
免责声明:以上所展示的信息由网友自行发布,内容的真实性、准确性和合法性由发布者负责。 微发商务网对此不承担任何保证责任, 微发商务网仅提供信息存储空间服务。任何单位或个人如对以上内容有权利主张(包括但不限于侵犯著作权、商业信誉等),请与我们联系并出示相关证据,我们将按国家相关法规即时移除。

本文地址:http://cn.wlchinahc.com/news/wfmy903398.html

收藏 0打赏 0
 
更多>同类资讯
今日资讯
推荐图文
点击排行

网站首页  |  付款方式  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  RSS订阅
免责声明:本站所有信息均来自互联网搜集,产品相关信息的真实性准确性均由发布单位及个人负责,请大家仔细辨认!并不代表本站观点,微发商务网对此不承担任何相关法律责任!如有信息侵犯了您的权益,请告知,本站将立刻删除。
友情提示:买产品需谨慎
网站资讯与建议:3123798995@qq.com 客服QQ:3123798995点击这里给我发消息3123798995点击这里给我发消息