京东段楠:现在的大语言模型像一个“闭着眼睛的智者”
刘峰
2025-12-07 17:34
12月7日消息,由联办集团、和讯共同主办、财经中国会承办,主题为“寻找中国经济破局之路”的和讯财经中国2025年会暨第23届财经风云榜今日在北京举行。京东集团副总裁段楠出席,并在大会演讲中表示:“目前,AI的多模态技术方向处在方兴未艾的阶段,涉及到端到端的场景,随着多模态对于视觉、语言的理解,推理和生成的结果越来越佳,并产生颠覆性影响。例如在推荐系统上,更加千人千面,教育将变得更为因材施教,娱乐则更开放有趣。”

图源:和讯网
不过,段楠也认为,当下的多模态综合研究还存在一些挑战。首先,语言文字仍是当下的载体和核心,基于语言的学习速度快。但在视觉智能方向,还处于爬坡山上坎的阶段,视觉要理解世界以及背后的常识和规律,还需要进一步地对齐。因此现如今世界模型很火,如果哪个企业可以做到,就是小小的“上帝”。
此外,现在的大语言模型像一个“闭着眼睛的智者”,想让其睁开眼睛的时刻,会有跷跷板效应,语言输出会出现部分“降智”,因此加强其逻辑推理能力,是未来多模态的重要研究方向。最后,未来人工智能将从数字世界走向物理世界,一定要基于辅助硬件和真实的环境产生交互,如何持续不断提供辅助,完成危险和重复的任务,解放人类,这也是目前研究的关键。
近期,京东云正式对外发布了企业级一站式AIGC内容生成平台——京东云灵境,聚合Vidu、拍我AI、Hailuo AI、可灵AI等多家大模型的最新服务,支持文生图、图生图、文生视频、图生视频等全场景AIGC能力,用户可一站式选择适合的模型与服务进行内容创作,同时更依托京东在零售、物流、金融、健康等领域的长期实践沉淀,将持续丰富大量商业验证级的内容模板,助力创作者快速将创意转化为落地成果。

图源:京东云灵境
声明
1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
刘峰
关注人物,保持真实