人的智能有三个方面:信息的收集、信息的处理产生认知、基于认知的行动。大语言模型目前主要的应用形态是ChatGPT这样的聊天机器人(Chatbot),能力集中在前两个方面。但更加有用的机器智能不只停留在“理解”和“说话”,如果能像一个或一群优秀的人才那样帮我们“做事”,显然能创造更大的价值。这就需要AI智能体(Agent)。
智能体是能做事的AI。LLM是近几年AI领域最重要的发展。已经在语言理解与生成、对话交互以及知识整合等方面展示出超凡能力,但它是“缸中大脑”——擅长思考、分析与回答问题,却并不能真正地做事情。而在真实世界,大多数认知活动并不止于“给出答案”,而是要有完整的“认知-行动”闭环:我们要求AI得能够自主的拆解复杂需求,规划流程,调用工具和资源,实现从感知到决策再到执行的完整循环;进一步我们还希望AI的行动能够超出计算机和互联网领域,在物理世界中为我们做事情,则需要AI能够感知物理世界的信号,进行匹配具身的思考,通过设备/机器人把决策转化为执行,对现实环境产生直接影响。
打个比方,LLM像是“未出山前的诸葛亮”,善于分析,以“隆中对”和刘备对谈,出谋划策,但限于“纸上谈兵”;智能体则是“出山后的诸葛亮”,掌握全局情报,运筹帷幄,组织资源、调兵遣将,亲自率军北伐。
您已阅读9%(543字),剩余91%(5234字)包含更多重要信息,订阅以继续探索完整内容,并享受更多专属服务。