京东段楠：现在的大语言模型像一个“闭着眼睛的智者”

刘峰

2025-12-07 17:34

12月7日消息，由联办集团、和讯共同主办、财经中国会承办，主题为“寻找中国经济破局之路”的和讯财经中国2025年会暨第23届财经风云榜今日在北京举行。京东集团副总裁段楠出席，并在大会演讲中表示：“目前，AI的多模态技术方向处在方兴未艾的阶段，涉及到端到端的场景，随着多模态对于视觉、语言的理解，推理和生成的结果越来越佳，并产生颠覆性影响。例如在推荐系统上，更加千人千面，教育将变得更为因材施教，娱乐则更开放有趣。”

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源：和讯网

不过，段楠也认为，当下的多模态综合研究还存在一些挑战。首先，语言文字仍是当下的载体和核心，基于语言的学习速度快。但在视觉智能方向，还处于爬坡山上坎的阶段，视觉要理解世界以及背后的常识和规律，还需要进一步地对齐。因此现如今世界模型很火，如果哪个企业可以做到，就是小小的“上帝”。

此外，现在的大语言模型像一个“闭着眼睛的智者”，想让其睁开眼睛的时刻，会有跷跷板效应，语言输出会出现部分“降智”，因此加强其逻辑推理能力，是未来多模态的重要研究方向。最后，未来人工智能将从数字世界走向物理世界，一定要基于辅助硬件和真实的环境产生交互，如何持续不断提供辅助，完成危险和重复的任务，解放人类，这也是目前研究的关键。

近期，京东云正式对外发布了企业级一站式AIGC内容生成平台——京东云灵境，聚合Vidu、拍我AI、Hailuo AI、可灵AI等多家大模型的最新服务，支持文生图、图生图、文生视频、图生视频等全场景AIGC能力，用户可一站式选择适合的模型与服务进行内容创作，同时更依托京东在零售、物流、金融、健康等领域的长期实践沉淀，将持续丰富大量商业验证级的内容模板，助力创作者快速将创意转化为落地成果。

图源：京东云灵境

声明

1、该内容为作者独立观点，不代表电商派观点或立场，文章为作者本人上传，版权归原作者所有，未经允许不得转载。
2、电商号平台仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。
3、如对本稿件有异议或投诉，请联系：info@dsb.cn