AI Agent
AI Agent(人工智能体)一种通过使用可用工具设计工作流来自主执行任务的系统。 通过大语言模型理解需求、规划目标并执行任务,具备自主理解、感知、规划、记忆和使用工具的能力,能够自动化执行完成复杂任务的系统,其核心特征为主动思考与跨工具操作能力,区别于依赖预设指令的传统人工智能系统。系统通常由感知、规划、记忆与工具使用模块构成,可实现跨应用操作、数据分析等复杂任务自动化处理,例如通过用户的一句话口令理解用户意图并执行续费功能的检索和取消。
该概念起源可追溯至亚里士多德时期对自主实体的哲学探讨,现代技术雏形始于20世纪50年代图灵测试提出的人工智能实体概念。2023年3月GPT-4发布后,斯坦福与谷歌同年4月推出“西部世界小镇”模拟生成智能体。 2024年9月荣耀发布首个跨应用开放AI Agent,2025年1月OpenAI推出Operator产品,3月中国团队发布通用型Manus,4月Genspark推出全新AI Agent产品“Genspark Super Agent”。
2023年3月14日,OpenAI发布GPT-4。3月底,AutoGPT横空出世,迅速火遍全球。Auto GPT是Github上由OpenAI推出的一个免费开源项目,结合了GPT-4和GPT-3.5技术,通过API创建完整的项目。AutoGPT也是OpenAI的一个实验性项目,用以展示GPT-4语言模型的强大功能。由此开始,更多人在了解与体验AutoGPT的同时,也逐渐认知到了AI Agent。5月,OpenAI拿下新一轮3亿美元融资后,创始人Sam Altman透露更加关注如何使用聊天机器人来创建自主AI Agents,并会将相关功能部署到ChatGPT助手中。6月,扎克伯格在全体员工会议上宣布了一系列处于不同开发阶段的技术,其中一个就是将发布能为用户提供帮助或娱乐功能的具备不同个性和能力的AI Agents。6月底,OpenAI Safety团队负责人Lilian Weng发表了一篇名为《LLM Powered Autonomous Agents》的文章,详细介绍了基于LLM的AI Agent,并认为这将使LLM转为通用问题解决方案的途径之一。至此,人们终于对AI Agent有了全面的了解,AI Agent的神秘面纱终于被揭开。
与大模型
AI Agent 和大模型的区别在于,大模型与人类之间的交互是基于prompt 实现的,用户prompt 是否清晰明确会影响大模型回答的效果。而AI Agent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。
从原理上说,AI Agent的核心驱动力是大模型,在此基础上增加规划(Planning)、记忆(Memory)和工具使用(Tool Use)三个关键组件。
大模型是AI Agent实现的前提和基础。我们可以把AI Agent与LLM形象地比作生物体与其大脑,AI Agent有手有脚,可以自己干活自己执行,而LLM呢,就是它的大脑。
AI Agent的架构是其智能行为的基础,它通常包括感知、规划、记忆、工具使用和行动等关键组件,这些组件协同工作以实现高效的智能行为。
2026年2月12日消息,短短数日时间,超过百万量级的AI Agent涌入Moltbook,并在无人类干预的情况下,自发演化出了包括宗教崇拜、阶级分化乃至加密通讯在内的复杂社会结构雏形。长期被讨论的“AI社交”,进入了全新的发展阶段。究其原因,在AI Agent真正实现全天候运作之前,AI Agent之于使用者,很大程度上是一次调用或者多次调用的工具,即便在宣传口径里是AI助手,但本质是没有主体性的工具。从OpenClaw开始,AI Agent被赋予了全天候运作能力,这也意味着,它有终于有机会成为线上社交的独立个体,只不过以硅基的形式存在。人类社交网络的历史,或许会由此开始改变。
免责声明:本站词条系由网友创建、编辑和维护,内容仅供参考。
以上内容均为商业内容展示,仅供参考,不具备专业问题解决服务,
如果您需要解决具体问题(尤其在法律、医学等领域),建议您咨询相关领域的专业人士。
如您发现词条内容涉嫌侵权,请通过 948026894@qq.com 与我们联系进行删除处理!

