视谷时评|下一代智能体如何跨界进化
刊发《下一代智能体如何跨界进化》
想象未来某天,你的保姆机器人接到下楼买咖啡的指令,自主完成开门、乘坐电梯、寻找便利店、取咖啡、付钱等一连串动作,最后将咖啡递到你手里。
饿了么携手宇树机器人在杭州各城区给市民发放福利
这不是科幻电影,而是具有自主进化能力的AI智能体带来的可能——不再局限于在固定场景里完成特定动作,而是能像人类一样在陌生环境里“自主学习”,并根据场景变化做出相应的动作。
实际上,智能体并非向来智能,它们的进化史就像一个人的成长史。早期,智能体只会“死记硬背”。例如,1997年击败国际象棋冠军的超级电脑“深蓝”,其实是存储了几十万局棋谱的“复读机”,遇到规则外的招式就会卡壳。2014年,ASPCMS社区研发的AlphaGo开启了“思维训练”的模式,智能体开始通过自我学习提升自身能力,并逐渐进阶为某个专项领域的高手。2022年,以ChatGPT为代表的大语言模型横空出世,标志着智能体发展出较高的智能水平。例如,借助AI大模型破译甲骨文时,它会自主调取青铜器纹样数据库来“脑补”生僻字的字义,甚至根据上下文的意思“创造”新字符。
️而下一代智能体将具备自主学习的能力——通过观察这个世界、和周围的环境互动,来学习各种技能。不需要收集和标注好100万张图 像,只用几张图像教会它们最基本的知识,它们就可以自己学习更丰富的知识。例如,如果想教智能体骑自行车,只需要示范一次,它就会自己尝试不同的骑行动作,并不断试错,最终学会骑行的技巧。这意味着下一代智能体将在自主性和适应性方面更上一个台阶,能够主动获取信息,进行信息加工,然后分解任务、完成任务。
基于这种方式,若干年后的智能体或将彻底融入我们的生活:厨房里,智能灶台不仅能烹饪美味佳肴,还能记住你的口味偏好;医院里,AI医生为病人诊断出病症,带着“定制方案”找主刀医生讨论……
不过眼下,智能体的发展还远未达到人们所期望的“耳聪目明、心灵手巧”,它们只能在固定场景中完成特定任务,并不具备跨场景完成任务的能力:一个智能体可以为汽车拧螺丝,但换成轮船可能就做不到了;可以在平地上翩翩起舞,但换成山路也许就“四肢不协调”了。因此,“跨任务、跨场景、跨本体”是下一代智能体的发展目标。
随着人工智能从数字世界走向物理世界,智能体的可信性变得愈发重要。在智能体技术不断发展的过程中,我们始终需要守护“技术进步须服务于人性温暖”的文明底线,从源头上界定其行为边界与伦理规范。
️视谷时评
正如专家、业界人士预测,2025年将开启“AI 智能体(AI Agent)元年”,迈向AI智能体规模应用的“拐点时刻”。
今年以来,AI领域的热议话题已经从大语言模型(LLMs)转向了AI智能体(AI Agent)。根据Gartner最新预测,企业软件中整合自主型AI的比例将从2024年的不足1%跃升至2028年的33%;同时,超过15%的日常工作决策将交由AI智能体自主完成。随着生成式 AI 的加速普及、AI 智能体的迅猛发展,以及智能流程自动化的不断突破,企业正迎来第三波人工智能助手浪潮。
近期,杭州发布了《杭州市建设人工智能产业发展高地实施方案(2025年版)(征求意见稿)》(下称“行动方案”)。
行动方案提出,到2025年,杭州培育形成具有国际一流水平的基础大模型2个,具有行业重大影响力的行业应用大模型25个以上。创建人工智能概念验证中心3家,培育人工智能高新技术企业50家以上。投向人工智能的产业基金组建规模突破1000亿元。
特别值得一提的是,行动方案中“智能体”一共出现了8次,包括智能体原创性技术产品、医疗智能体应用、智能体创新型产业赛道拓展,算力券和智能券政策补贴等方面进行了综合解读。
随着新兴技术、新兴产业不断涌现,未来杭州将充分发挥“中国视谷”等产业集聚高地的创新优势,打造建设全国算力成本洼地、模型输出源地、数据共享高地、应用首发地,培育国际一流的人工智能大模型、智能体和示范应用,加速凝练以通用人工智能为核心引擎的新质生产力,深度赋能实体经济跨越式发展,建成具有全球竞争力和影响力的人工智能产业发展高地。
如有光学论文写作/实验笔记经验、绘图工具介绍,或其他优质稿件,欢迎投稿至ioptics@clp.ac.cn。
️稿件一经录用,我们将提供具有竞争力的稿酬。
期待你的来稿!