阿里巴巴推出千问具身智能大模型Qwen-Robot系列
刘峰
2026-06-16 17:02
6月16日消息,阿里巴巴正式发布千问具身智能大模型Qwen-Robot系列,这是千问大模型家族首次推出完整的具身智能模型体系。该系列包含VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav和世界模型Qwen-RobotWorld三大模型。这三个模型分别为机器人装上“灵巧的手”、“认路的脚”和“会思考的大脑”,既可单独部署,也能协同运转。

图源:千问
VLA(Vision-Language-Action,视觉-语言-动作)模型是当前具身智能最核心基础模型之一,它能将视觉感知、语言理解和动作决策融合,让机器人看得懂、能动手。
传统VLA模型的核心痛点是迁移能力不足,换机器人、换场景性能就下降。让不同形态的机器人能听懂一个模型指挥,需要解决动作统一和空间统一两个核心问题,Qwen-RobotManip从这两点切入,用一套80维的统一动作表征,为不同硬件定义通用的“肢体语言”,让机器人习得基础物理规律与动作逻辑,动作不再是生硬模仿。搭载在不同的硬件中,Qwen-RobotManip只需数步反馈即可自动适配,性能稳定高效。
VLN(Vision-Language Navigation,视觉语言导航)模型,则是让机器人能认路、会跑腿。Qwen-RobotNav基于Qwen-VL构建,将语言指令导航、目标搜索、自动驾驶等五大任务族统一到同一个框架,遇到复杂任务无需人工切换模型。
Qwen-RobotWorld则基于对物理规律的理解,可推理和模拟出下一个时间点机器人的合理动作和状态,让机器人在现实世界中可按图索骥般地行动。
声明
1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
刘峰
关注人物,保持真实