上海发布人形机器人通用“大脑”!国内首个通用具身基座大模型来自张江

张江科学之门

张江科学之门

4元/m².天起

查看房源
如何让人形机器人拥有智慧“大脑”?昨天,上海智元新创技术有限公司发布了自主研发的第一代通用具身智能基座模型——智元启元大模型GO-1(Genie Operator-1)。这是全国首个通用具身基座大模型,已部署到智元研发的多款机器人本体中。

据介绍,GO-1首创ViLLA架构,让人形机器人可以利用人类视频学习各种技能,还能在极少数据甚至零样本下,使机器人适应不同场景和任务,从而降低具身智能研发门槛,让机器人持续进化。

十几年前,机器人就可以“擦桌子”“拉小提琴”,这似乎不是什么新鲜事。但这类机器人只是在完成预设程序,并不代表机器人具备自主完成任务的能力,或者说并不真正具备智能。如今,随着具身智能的不断演化,聪明的机器人已完成“从单一任务到多种任务”“从封闭环境到开放世界”“从预设程序到指令泛化”的三层进化。

“目前,机器人能够在不同场景中执行多种任务,而不需要针对每个新任务重新训练,也不再局限于预设程序,能够理解自然语言指令,并具备一定推理能力。”智元机器人研究院执行院长、具身业务部总裁姚卯青表示,一旦机器人“能听懂人话”,就可以在商业、工业、家庭等多领域发挥更大的作用。

去年底,智元联合上海人工智能实验室、国家地方共建人形机器人创新中心和上海库帕思科技公司,发布了基于全域真实场景的百万真机数据集开源项目“AgiBot世界”。这个数据集覆盖100多种真实场景,其中家居场景占40%,餐饮和工业场景各占20%,商超和办公场景各占10%。基于“AgiBot世界”数据集,智元开发了启元大模型,让人形机器人拥有可不断进化的“大脑”。

姚卯青介绍,为增强机器人“大脑”的泛化能力,智元提出了ViLLA这一创新性架构。启元大模型就是基于ViLLA架构开发,由多模态大模型和混合专家组成。其中,多模态大模型可利用互联网上的海量图文数据,让人形机器人获得通用场景感知和语言理解能力,从而能理解外部世界、周边环境以及用户发出的各种指令。

“通过ViLLA创新性架构,我们在5种不同复杂度的任务上测试了GO-1大模型。与已有最优模型对比,GO-1的成功率处于领先水平,将平均成功率提高了32%。”姚卯青介绍,在这些测试任务中,启元大模型在倒水、清理桌面、补充饮料这3个任务上的表现尤为突出。
作为通用具身基座大模型,GO-1不再被机器人的具体型号、适用场景束缚。姚卯青表示,GO-1大模型可以帮机器人完成全面的“基础教育”和“职业教育”,天然能适应新的场景,快速学习新的操作。


展开展开
热门写字楼:
张江长利园 临港再保险大厦 港城广场(滴水湖AI创新港) 外高桥文化艺术中心 创新魔坊 创芯天地 临港金融湾 海洋科技广场 半岛科技园 华虹科技园 展想中心 创晶科技中心(创新晶体)
区域写字楼:
浦东 闵行 松江
商圈写字楼:
浦江 周浦 新桥镇 颛桥镇 虹桥开发区 张江科学城 临港新片区 陆家嘴 八佰伴 竹园商贸区 世纪公园 源深 花木 前滩 金桥 上南地区/后滩 北蔡 三林 南汇 外高桥 川沙 康桥

选址网,您身边的写字楼专家!

关于我们 - 常见问题 - 联系我们 - 加入我们 - 友情链接 - 投放房源 - 网站地图XML - 网站地图 - 网站热词

Copyright © 选址网 All rights reserved. 沪ICP备2022035212号-1 地址:上海浦东新区张江路725号

-

客服服务:(工作日 早8:00-晚21:00)

021-50935615

选址网公众号

友情链接: