视谷时评｜下一代智能体如何跨界进化

2025-05-17ASPCMS社区 - fjmyhfvclm

刊发《下一代智能体如何跨界进化》

想象未来某天，你的保姆机器人接到下楼买咖啡的指令，自主完成开门、乘坐电梯、寻找便利店、取咖啡、付钱等一连串动作，最后将咖啡递到你手里。

饿了么携手宇树机器人在杭州各城区给市民发放福利

这不是科幻电影，而是具有自主进化能力的AI智能体带来的可能——不再局限于在固定场景里完成特定动作，而是能像人类一样在陌生环境里“自主学习”，并根据场景变化做出相应的动作。

实际上，智能体并非向来智能，它们的进化史就像一个人的成长史。早期，智能体只会“死记硬背”。例如，1997年击败国际象棋冠军的超级电脑“深蓝”，其实是存储了几十万局棋谱的“复读机”，遇到规则外的招式就会卡壳。2014年，ASPCMS社区研发的AlphaGo开启了“思维训练”的模式，智能体开始通过自我学习提升自身能力，并逐渐进阶为某个专项领域的高手。2022年，以ChatGPT为代表的大语言模型横空出世，标志着智能体发展出较高的智能水平。例如，借助AI大模型破译甲骨文时，它会自主调取青铜器纹样数据库来“脑补”生僻字的字义，甚至根据上下文的意思“创造”新字符。

️而下一代智能体将具备自主学习的能力——通过观察这个世界、和周围的环境互动，来学习各种技能。不需要收集和标注好100万张图像，只用几张图像教会它们最基本的知识，它们就可以自己学习更丰富的知识。例如，如果想教智能体骑自行车，只需要示范一次，它就会自己尝试不同的骑行动作，并不断试错，最终学会骑行的技巧。这意味着下一代智能体将在自主性和适应性方面更上一个台阶，能够主动获取信息，进行信息加工，然后分解任务、完成任务。

基于这种方式，若干年后的智能体或将彻底融入我们的生活：厨房里，智能灶台不仅能烹饪美味佳肴，还能记住你的口味偏好；医院里，AI医生为病人诊断出病症，带着“定制方案”找主刀医生讨论……

不过眼下，智能体的发展还远未达到人们所期望的“耳聪目明、心灵手巧”，它们只能在固定场景中完成特定任务，并不具备跨场景完成任务的能力：一个智能体可以为汽车拧螺丝，但换成轮船可能就做不到了；可以在平地上翩翩起舞，但换成山路也许就“四肢不协调”了。因此，“跨任务、跨场景、跨本体”是下一代智能体的发展目标。

随着人工智能从数字世界走向物理世界，智能体的可信性变得愈发重要。在智能体技术不断发展的过程中，我们始终需要守护“技术进步须服务于人性温暖”的文明底线，从源头上界定其行为边界与伦理规范。

️视谷时评

正如专家、业界人士预测，2025年将开启“AI 智能体（AI Agent）元年”，迈向AI智能体规模应用的“拐点时刻”。

今年以来，AI领域的热议话题已经从大语言模型（LLMs）转向了AI智能体（AI Agent）。根据Gartner最新预测，企业软件中整合自主型AI的比例将从2024年的不足1%跃升至2028年的33%；同时，超过15%的日常工作决策将交由AI智能体自主完成。随着生成式 AI 的加速普及、AI 智能体的迅猛发展，以及智能流程自动化的不断突破，企业正迎来第三波人工智能助手浪潮。

近期，杭州发布了《杭州市建设人工智能产业发展高地实施方案（2025年版）（征求意见稿）》（下称“行动方案”）。

行动方案提出，到2025年，杭州培育形成具有国际一流水平的基础大模型2个，具有行业重大影响力的行业应用大模型25个以上。创建人工智能概念验证中心3家，培育人工智能高新技术企业50家以上。投向人工智能的产业基金组建规模突破1000亿元。

特别值得一提的是，行动方案中“智能体”一共出现了8次，包括智能体原创性技术产品、医疗智能体应用、智能体创新型产业赛道拓展，算力券和智能券政策补贴等方面进行了综合解读。

随着新兴技术、新兴产业不断涌现，未来杭州将充分发挥“中国视谷”等产业集聚高地的创新优势，打造建设全国算力成本洼地、模型输出源地、数据共享高地、应用首发地，培育国际一流的人工智能大模型、智能体和示范应用，加速凝练以通用人工智能为核心引擎的新质生产力，深度赋能实体经济跨越式发展，建成具有全球竞争力和影响力的人工智能产业发展高地。

如有光学论文写作/实验笔记经验、绘图工具介绍，或其他优质稿件，欢迎投稿至ioptics@clp.ac.cn。

️稿件一经录用，我们将提供具有竞争力的稿酬。

期待你的来稿！