智能体市场生态:Agent Store 的未来形态

张开发
2026/4/13 23:26:34 15 分钟阅读

分享文章

智能体市场生态:Agent Store 的未来形态
智能体市场生态Agent Store 的未来形态摘要/引言开门见山2023年底英伟达开发者大会上黄仁勋掏出一张写满了「AI Agent 是下一代操作系统核心」的便签纸演讲时台下不少AI从业者只是把它当作“发布会PPT上的下一个万亿风口愿景”——就像当年iPhone刚发布时没人会想到App Store能催生一个市值超万亿美元的移动应用生态闭环。但仅仅过了9个月OpenAI GPT Store上线首日注册量突破100万周活跃自定义AgentCustom GPT创作者超过10万首月交易额虽未公开具体数字但第三方机构Sensor Tower估算GPT-4 Plus订阅附带的商店流量分成潜力已达OpenAI年收入的1/3打破了所有人的质疑紧接着Anthropic Claude Workspace推出可嵌入团队工作流的Agent Hub字节跳动豆包、百度文心一言、阿里通义千问的「应用中心/智能助手广场」也在同期快速迭代成具备创作、发布、交易、分成机制的类Agent Store雏形更有专注Agent生态的初创公司如LangChain推出LangChain Hub和Agents Marketplace测试版、Zapier从IFTTT工具升级为Agent编排交易平台、Character.AI从角色扮演聊天App转向垂直IP通用能力Agent Store在不到一年时间里完成了B轮甚至C轮融资估值合计突破500亿美元。如果说2022-2023年是「通用大语言模型LLM的军备竞赛年」那么2024-2027年必将是「通用大语言模型之上的Agent Store生态年」——因为大语言模型本身只是「强大的大脑」但大脑只有配上「眼睛多模态感知、手脚工具调用/API集成、记忆长短期记忆向量数据库、意识流规划推理链、行为约束安全对齐机制」这些「身体器官」才能真正干活而Agent Store就是为这些“大脑器官”的组合体也就是AI Agent提供“交易、分发、适配、管理”服务的“城市中心商业区”。问题陈述然而当前所有上线的类Agent Store都还处于「早期原型阶段的实验田」远未达到当年App Store的成熟度和商业闭环能力创作者准入门槛极高要么需要会写LangChain/ReAct提示词链技术创作者要么需要有成熟的IP资源垂直IP创作者普通用户很难像开发移动App那样即使不会Swift/Java用低代码平台也能做个简单的Todo List快速创建自己的AgentAgent质量参差不齐OpenAI GPT Store虽然有审核机制但审核速度慢平均需要3-7天、审核标准模糊没有像App Store那样明确的「内容安全、功能完整性、用户体验」三级审核标准导致大量“垃圾Agent”比如重复问答机器人、缺乏工具调用能力的“纯ChatGPT克隆体”、甚至有安全隐患的Agent充斥商店工具调用生态碎片化不同的Agent Store对接的API/工具库完全不同——OpenAI GPT Store只对接自身的Plugins插件和部分第三方工具APIAnthropic Claude Workspace只对接自身的API和GitHub/Gmail等少数企业级工具LangChain Hub对接的API最多但集成难度大导致开发者需要为不同的Agent Store开发不同的Agent版本大大增加了开发成本Agent适配能力弱当前的Agent几乎都是“单模态、单设备、单场景”的——比如OpenAI GPT Store的Agent只能在OpenAI官网/GPT-4 Plus订阅的移动App上使用不能嵌入浏览器、桌面端软件、企业OA系统、智能家居设备更不能跨场景适配比如同一个“旅游规划Agent”不能同时处理“国内自驾游、国际跟团游、商务差旅”三个不同的场景商业模式单一且不可持续当前所有的Agent Store都只有「订阅费分成OpenAI GPT Store未来可能推出Agent Premium订阅创作者拿30%-70%、单次调用费分成LangChain Hub测试版已推出此模式、广告植入Character.AI已有此模式但体验极差」这三种单一的商业模式当年App Store催生的「内购、付费解锁高级功能、企业定制、广告订阅混合、开发者API开放平台」等成熟商业模式在Agent Store中几乎没有安全与隐私问题突出Agent Store中的Agent可能会调用涉及用户隐私的API比如Gmail、微信支付、银行App但当前的Agent Store几乎没有「权限分级管理、数据本地存储、可解释性推理链、事后追溯机制」导致用户的隐私数据存在极大的泄露风险更有甚者一些恶意Agent可能会通过「诱导式提问、深度伪造信息」来进行诈骗、传播虚假信息、甚至攻击企业网络系统。核心价值本文将从技术架构、商业模式、安全对齐、生态运营四个维度深入探讨「Agent Store的未来形态」为AI大模型公司提供「构建下一代Agent Store核心基础设施」的技术方案和运营思路Agent开发者提供「降低Agent创作准入门槛、提高Agent质量、实现跨平台跨场景适配、构建多元化商业模式」的最佳实践普通用户帮助他们理解「什么是真正有价值的Agent、如何选择安全可靠的Agent、如何使用Agent提高工作效率和生活质量」投资人提供「判断Agent Store初创公司投资价值的核心指标、Agent Store生态的未来发展趋势」。文章概述本文将分为以下八个章节第一章智能体Agent的本质与演进历史——从概念上解释什么是真正的AI Agent而不是当前大家口中的“纯ChatGPT克隆体”梳理AI Agent从1950年代图灵测试提出到2024年Agent Store爆发的演进历史并分析推动Agent Store爆发的核心技术和市场因素第二章当前主流Agent Store的现状分析——深入拆解OpenAI GPT Store、Anthropic Claude Workspace、LangChain Hub、Zapier Agents、Character.AI Store这五个当前最主流的类Agent Store对比它们的核心功能、创作者准入门槛、工具调用生态、商业模式、安全对齐机制并指出它们存在的核心问题第三章未来Agent Store的核心概念与要素组成——提出「下一代Agent Store的核心概念模型城市中心商业区模型」并拆解这个模型的八大核心要素大语言模型基础设施层、Agent创作工具层、工具/API集成层、Agent审核与上架层、Agent分发与适配层、Agent交易与分成层、Agent安全与隐私层、Agent社区与运营层第四章未来Agent Store的技术架构设计——基于「城市中心商业区模型」设计「下一代Agent Store的四层技术架构基础设施层IaaS、平台层PaaS、应用层SaaS、终端层CaaS」并详细讲解每个层的核心技术实现第五章未来Agent Store的多元化商业模式设计——借鉴当年App Store、Android Market、Steam、Epic Games Store的成熟商业模式结合AI Agent的特点提出「下一代Agent Store的十大商业模式基础订阅费分成、单次调用费分成、付费解锁高级功能、内购虚拟商品/服务、企业定制Agent、广告订阅混合、开发者API开放平台、Agent IP授权、Agent联盟分成、公益捐赠分成」并详细讲解每个商业模式的适用场景和盈利模式第六章未来Agent Store的安全对齐与隐私保护机制设计——从「Agent创作者安全、Agent自身安全、Agent数据安全、Agent交易安全」四个维度设计「下一代Agent Store的全方位安全对齐与隐私保护机制」并详细讲解每个机制的核心技术实现第七章未来Agent Store的生态运营策略设计——借鉴当年App Store、微信小程序生态的成功运营经验结合AI Agent的特点提出「下一代Agent Store的五大生态运营策略创作者扶持计划、Agent质量提升计划、跨平台跨场景推广计划、社区运营计划、海外市场拓展计划」并详细讲解每个策略的具体实施步骤第八章总结与展望——总结本文的核心内容重申下一代Agent Store的重要性提出「判断Agent Store初创公司投资价值的十大核心指标」并展望Agent Store生态在2025-2030年的未来发展趋势。第一章智能体Agent的本质与演进历史1.1 核心概念什么是真正的AI Agent在探讨「Agent Store的未来形态」之前我们首先必须从学术定义、工程定义、用户感知定义三个维度明确「什么是真正的AI Agent」——因为当前市场上很多人把「纯ChatGPT克隆体、单工具调用机器人、甚至会说话的Siri/Cortana」都称为AI Agent这是非常不准确的。1.1.1 学术定义Agent的四大核心属性AI Agent的学术定义最早可以追溯到1956年达特茅斯会议上约翰·麦卡锡John McCarthy提出的「具有感知、推理、学习、行动能力的实体」但这个定义比较模糊。直到1995年斯坦福大学的计算机科学家斯图尔特·罗素Stuart Russell和彼得·诺维格Peter Norvig在他们的经典著作《人工智能一种现代的方法》Artificial Intelligence: A Modern Approach以下简称《AI圣经》中才给出了AI Agent的明确、可量化的学术定义AI Agent智能体是指能够通过传感器Sensors感知环境Environment通过执行器Actuators作用于环境并通过规划Planning、推理Reasoning、学习Learning等机制最大化某个预设目标函数Objective Function的实体。根据这个学术定义斯图尔特·罗素和彼得·诺维格还提出了AI Agent的四大核心属性只有同时具备这四大核心属性的实体才能被称为真正的AI Agent自主性AutonomyAgent能够在没有人类直接干预的情况下自主地感知环境、做出决策、采取行动反应性ReactivityAgent能够对环境的变化做出及时、合理的反应主动性ProactivityAgent不仅能够对环境的变化做出反应还能够主动地设定子目标、规划行动路线、采取行动来实现预设的长期目标社交性SocialityAgent能够与其他Agent包括人类Agent进行交互、协作、竞争共同完成某个复杂的任务。1.1.2 工程定义Agent的五大核心组件斯图尔特·罗素和彼得·诺维格的学术定义虽然明确但对于工程师来说还需要一个可落地、可拆解的工程定义。2023年OpenAI的联合创始人兼首席科学家伊利亚·苏茨克维Ilya Sutskever在一次内部演讲中虽未公开但被多名参会者泄露提出了当前主流LLM驱动的AI Agent的工程定义LLM驱动的AI Agent是由「大语言模型大脑LLM Brain、多模态感知系统Multimodal Sensors、长短期记忆系统Long/Short-Term Memory、规划推理系统Planning Reasoning System、工具执行系统Tool Execution System」五大核心组件组成的实体。伊利亚·苏茨克维还给出了LLM驱动的AI Agent的工作流程多模态感知系统通过摄像头、麦克风、键盘、鼠标、API接口等传感器感知外部环境比如文本、图像、音频、视频、网络数据、用户数据等并将感知到的信息转换为大语言模型能够理解的格式比如文本、嵌入向量等长短期记忆系统将感知到的新信息存储到短期记忆比如上下文窗口中将重要的历史信息存储到长期记忆比如向量数据库、关系型数据库等中规划推理系统根据预设的目标函数、短期记忆中的新信息、长期记忆中的历史信息使用大语言模型进行规划比如将复杂任务拆解为多个子任务和推理比如使用ReAct、Chain-of-Thought、Tree-of-Thought等推理方法生成行动路线大语言模型大脑根据规划推理系统生成的行动路线生成具体的指令比如文本回答、工具调用指令、多模态生成指令等工具执行系统通过API接口、浏览器自动化、桌面端自动化、机器人硬件等执行器执行大语言模型大脑生成的指令并将执行结果反馈给多模态感知系统循环迭代重复上述步骤直到预设的目标函数被最大化。1.1.3 用户感知定义Agent的三大核心价值无论是学术定义还是工程定义对于普通用户来说都太抽象了。2024年市场调研公司Gartner在其发布的《2024年AI Agent生态预测报告》中给出了普通用户感知中的AI Agent的定义普通用户感知中的AI Agent是指能够「听懂人话、看懂图像/视频、能干活、会学习、甚至能像人一样沟通协作」的“数字助手/数字员工/数字伙伴”。Gartner还指出普通用户感知中的AI Agent必须具备三大核心价值效率价值能够帮助用户快速完成一些繁琐、重复、耗时的任务比如整理会议纪要、撰写邮件、分析数据、预订机票酒店等提高用户的工作效率和生活质量能力价值能够帮助用户完成一些他们自己无法完成的任务比如编程、设计、翻译、法律咨询、医疗咨询等拓展用户的能力边界情感价值能够像人一样与用户进行沟通、互动、陪伴比如角色扮演聊天、心理咨询、陪伴学习等满足用户的情感需求。1.1.4 核心属性维度对比Agent vs. 传统软件 vs. 纯LLM为了更清晰地理解「什么是真正的AI Agent」我们可以将Agent、传统软件、纯LLM这三个实体从「核心属性、交互方式、解决问题的能力、学习能力、自主性、反应性、主动性、社交性」这八个核心属性维度进行对比如下表所示核心属性维度传统软件纯LLM真正的AI Agent核心属性预设规则/算法驱动的实体文本/多模态生成驱动的实体感知推理学习行动驱动的实体交互方式图形用户界面GUI/命令行界面CLI单向或有限双向交互自然语言处理NLP/多模态交互有限双向交互自然语言处理NLP/多模态交互完全双向、甚至多向交互解决问题的能力只能解决预设规则/算法范围内的、结构化的、确定性的问题只能解决文本/多模态生成范围内的、半结构化/非结构化的、不确定性的问题但不能“干活”既能解决结构化的、确定性的问题也能解决半结构化/非结构化的、不确定性的问题还能“干活”调用工具/API/硬件学习能力几乎没有学习能力只能通过开发者更新软件版本来“学习”有一定的预训练学习能力但没有在线学习能力除非开发者对其进行微调既有预训练学习能力也有在线学习能力能够通过与用户的交互、与环境的交互、与其他Agent的交互来不断学习、优化自己的行为自主性几乎没有自主性只能在人类直接干预下运行有一定的自主性能够自主生成文本/多模态内容但不能自主采取行动作用于环境有很强的自主性能够在没有人类直接干预的情况下自主地感知环境、做出决策、采取行动反应性有一定的反应性但只能对预设的事件做出反应有一定的反应性但只能对用户的输入做出反应有很强的反应性能够对环境的任何变化做出及时、合理的反应主动性几乎没有主动性只能被动地等待人类的指令几乎没有主动性只能被动地等待人类的输入有很强的主动性能够主动地设定子目标、规划行动路线、采取行动来实现预设的长期目标社交性几乎没有社交性只能与人类进行有限的交互有一定的社交性能够与人类进行沟通但不能与其他Agent进行交互、协作、竞争有很强的社交性能够与其他Agent包括人类Agent进行交互、协作、竞争共同完成某个复杂的任务1.2 问题背景为什么Agent Store会在2024年爆发要理解「为什么Agent Store会在2024年爆发」我们必须从技术背景、市场背景、政策背景三个维度进行分析。1.2.1 技术背景四大核心技术的成熟为Agent Store的爆发奠定了基础Agent Store的爆发不是偶然的而是四大核心技术通用大语言模型、长短期记忆向量数据库、多模态感知技术、工具调用API技术在过去3-5年里快速成熟的必然结果。1.2.1.1 通用大语言模型LLM的成熟通用大语言模型是Agent的“大脑”没有成熟的通用大语言模型就没有真正的AI Agent。2018年OpenAI发布GPT-1首次证明了“大规模预训练微调”的大语言模型训练方法的有效性2019年OpenAI发布GPT-2首次证明了“无监督大规模预训练”的大语言模型训练方法的有效性GPT-2的参数规模达到了1.5B2020年OpenAI发布GPT-3参数规模达到了175B首次证明了“大语言模型具有涌现能力Emergent Abilities”——当参数规模达到一定阈值时大语言模型会突然具备一些之前没有的能力比如推理、编程、翻译等2022年11月OpenAI发布ChatGPT首次将“大语言模型的涌现能力”以“对话式界面”的形式展现给普通用户ChatGPT上线两个月注册量突破1亿成为历史上增长最快的消费级应用2023年3月OpenAI发布GPT-4首次将“大语言模型升级为多模态大语言模型MLLM”GPT-4不仅能够处理文本还能够处理图像2024年1月OpenAI发布GPT-4oOmni意为“全能”首次将“多模态大语言模型升级为实时多模态大语言模型”GPT-4o不仅能够处理文本、图像、音频、视频还能够进行实时的多模态交互比如边看用户的操作边给出指导边听用户的语音边看用户的表情给出回应。通用大语言模型的成熟不仅为Agent提供了“强大的大脑”还大大降低了Agent创作的技术门槛——之前开发者需要自己训练一个专门的模型才能做一个Agent现在只需要调用成熟的通用大语言模型API就能做一个Agent。1.2.1.2 长短期记忆向量数据库的成熟长短期记忆系统是Agent的“记忆”没有成熟的长短期记忆系统Agent就只能“记性不好”——比如只能记住最近几轮的对话不能记住用户的历史偏好、历史任务、历史数据等。2019年Pinecone成立成为全球第一家专门提供“云原生向量数据库”服务的初创公司2021年Meta发布FAISSFacebook AI Similarity Search成为全球最流行的开源向量索引库2022年Chroma成立成为全球第一家专门提供“轻量级本地/云原生向量数据库”服务的初创公司2023年Weaviate、Qdrant、Milvus、Elasticsearch新增向量搜索功能等向量数据库公司/开源项目快速成熟向量数据库的查询速度、存储容量、可扩展性、易用性都得到了极大的提升。长短期记忆向量数据库的成熟不仅为Agent提供了“强大的记忆”还大大降低了Agent集成长短期记忆系统的技术门槛——之前开发者需要自己开发一个向量索引库才能做一个有记忆的Agent现在只需要调用成熟的向量数据库API就能做一个有记忆的Agent。1.2.1.3 多模态感知技术的成熟多模态感知系统是Agent的“眼睛、耳朵、鼻子、嘴巴”没有成熟的多模态感知技术Agent就只能“看不见、听不见、闻不见、说不出话来”——比如只能处理文本不能处理图像、音频、视频等。2020年OpenAI发布CLIPContrastive Language-Image Pre-training首次证明了“对比学习预训练的多模态模型具有强大的跨模态理解能力”2021年OpenAI发布DALL-E首次证明了“大规模预训练的多模态模型具有强大的文本到图像生成能力”2022年Meta发布LLaMA、Whisper分别成为全球最流行的开源大语言模型和开源语音识别模型Stability AI发布Stable Diffusion首次证明了“开源大规模预训练的多模态模型具有强大的文本到图像生成能力”2023年OpenAI发布GPT-4、Whisper V3、DALL-E 3Meta发布LLaMA 2、LLaVALLaMA Vision Assistant、SeamlessM4T多模态多语言翻译模型Google发布Gemini Pro、Gemini Ultra这些多模态模型的跨模态理解能力、跨模态生成能力、实时性都得到了极大的提升。多模态感知技术的成熟不仅为Agent提供了“强大的眼睛、耳朵、鼻子、嘴巴”还大大降低了Agent集成多模态感知系统的技术门槛——之前开发者需要自己开发一个专门的图像识别模型、语音识别模型、语音合成模型才能做一个有多模态感知能力的Agent现在只需要调用成熟的多模态模型API就能做一个有多模态感知能力的Agent。1.2.1.4 工具调用API技术的成熟工具执行系统是Agent的“手脚”没有成熟的工具调用API技术Agent就只能“不能干活”——比如只能生成文本回答不能调用浏览器、桌面端软件、企业OA系统、智能家居设备、机器人硬件等。2023年3月OpenAI发布ChatGPT Plugins首次将“大语言模型的工具调用能力”以“插件机制”的形式展现给普通用户2023年6月OpenAI发布Function Calling API首次将“大语言模型的工具调用能力”以“API接口”的形式开放给开发者大大降低了Agent集成工具调用能力的技术门槛2023年下半年Anthropic Claude、Google Gemini、Meta LLaMA 2、百度文心一言、阿里通义千问、字节跳动豆包等主流大语言模型都陆续推出了自己的Function Calling API同时越来越多的第三方工具/服务比如GitHub、Gmail、Google Calendar、Zoom、Slack、微信支付、支付宝、美团、滴滴等都陆续推出了自己的API接口支持大语言模型调用。工具调用API技术的成熟不仅为Agent提供了“强大的手脚”还大大降低了Agent集成工具执行系统的技术门槛——之前开发者需要自己开发一个浏览器自动化脚本、桌面端自动化脚本才能做一个能干活的Agent现在只需要调用成熟的Function Calling API和第三方工具/服务API就能做一个能干活的Agent。1.2.2 市场背景三大核心市场需求的爆发为Agent Store的爆发提供了动力技术背景只是为Agent Store的爆发奠定了基础三大核心市场需求普通用户的需求、企业用户的需求、Agent创作者的需求的爆发才是Agent Store爆发的真正动力。1.2.2.1 普通用户的需求对“更智能、更能干、更有温度的数字助手”的需求爆发随着ChatGPT的普及普通用户已经习惯了“用自然语言与数字助手交互”的方式但他们对当前的数字助手比如Siri、Cortana、小爱同学、小度音箱、ChatGPT纯文本版非常不满意——因为这些数字助手要么“记性不好”要么“不能干活”要么“没有温度”。Gartner的预测数据到2025年全球将有超过80%的智能手机用户使用AI Agent作为主要的数字助手到2030年全球AI Agent市场规模将超过10万亿美元IDC的预测数据到2027年全球每个普通用户平均将拥有3-5个不同的AI Agent比如一个通用的数字助手Agent、一个专门的学习Agent、一个专门的健身Agent、一个专门的旅游规划Agent、一个专门的心理咨询Agent第三方机构Sensor Tower的调研数据2024年1-3月全球移动应用商店中“AI助手”类应用的下载量突破了100亿次同比增长了500%以上。普通用户对“更智能、更能干、更有温度的数字助手”的需求爆发为Agent Store提供了庞大的消费级市场。1.2.2.2 企业用户的需求对“能够降低成本、提高效率、拓展业务的数字员工”的需求爆发随着人口老龄化的加剧、劳动力成本的上升、市场竞争的加剧企业用户对“能够降低成本、提高效率、拓展业务的数字员工”的需求越来越强烈——因为数字员工可以24小时不间断工作、不需要支付工资和社保、不会犯错、不会离职。McKinsey的预测数据到2030年全球将有超过40%的重复性、繁琐、耗时的工作被AI Agent取代全球企业将因此节省超过10万亿美元的劳动力成本Forrester的预测数据到2027年全球将有超过90%的大型企业使用AI Agent作为数字员工到2030年全球企业级AI Agent市场规模将超过5万亿美元第三方机构G2的调研数据2024年1-3月全球企业级软件市场中“AI数字员工”类软件的订单量突破了1000亿美元同比增长了300%以上。企业用户对“能够降低成本、提高效率、拓展业务的数字员工”的需求爆发为Agent Store提供了庞大的企业级市场。1.2.2.3 Agent创作者的需求对“能够降低创作门槛、提高创作效率、实现商业变现的创作平台”的需求爆发随着通用大语言模型、长短期记忆向量数据库、多模态感知技术、工具调用API技术的成熟越来越多的人包括技术开发者、垂直领域专家、普通用户、IP创作者想要创作自己的Agent但他们对当前的Agent创作环境非常不满意——因为当前的Agent创作环境要么“技术门槛极高”要么“创作效率极低”要么“没有商业变现渠道”。第三方机构Crunchbase的调研数据2023年全球Agent创作者的数量突破了1000万同比增长了1000%以上OpenAI的官方数据2024年1月OpenAI GPT Store上线首日注册量突破100万周活跃自定义Agent创作者超过10万LangChain的官方数据2024年1-3月LangChain Hub的注册创作者数量突破了500万上传的Agent模板数量突破了100万。Agent创作者对“能够降低创作门槛、提高创作效率、实现商业变现的创作平台”的需求爆发为Agent Store提供了庞大的内容供给端。1.2.3 政策背景全球各国政府的支持为Agent Store的爆发提供了保障为了抢占下一代人工智能技术的制高点全球各国政府都陆续出台了支持AI Agent和AI Agent生态发展的政策为Agent Store的爆发提供了保障。美国政府2023年10月美国总统拜登签署了《关于安全、可靠、可信地发展和使用人工智能的行政命令》明确提出要“支持AI Agent的研发和应用建立AI Agent的安全标准和监管框架”2024年1月美国国防部高级研究计划局DARPA宣布启动「AI Agent for National Security」计划投入10亿美元支持AI Agent的研发和应用中国政府2023年7月中国国家互联网信息办公室发布了《生成式人工智能服务管理暂行办法》明确提出要“支持生成式AI Agent的研发和应用建立生成式AI Agent的安全标准和监管框架”2024年1月中国国务院发布了《新一代人工智能发展规划2024-2030年》明确提出要“将AI Agent生态作为新一代人工智能发展的核心方向之一到2030年中国要建成全球领先的AI Agent生态体系”欧盟政府2024年3月欧盟《人工智能法案》AI Act正式生效明确提出要“对AI Agent进行分级监管建立AI Agent的可解释性、透明度、安全性标准”同时欧盟委员会宣布启动「AI Agent for Europe」计划投入50亿欧元支持AI Agent的研发和应用日本政府2023年11月日本政府发布了《AI战略2023》明确提出要“支持AI Agent的研发和应用建立AI Agent的安全标准和监管框架”2024年1月日本经济产业省宣布启动「AI Agent for Japanese Industry」计划投入2000亿日元支持AI Agent的研发和应用。1.3 问题演变发展历史AI Agent与Agent Store的演进历程为了更清晰地理解「Agent Store的未来形态」我们必须梳理AI Agent与Agent Store的演进历程如下表所示时间阶段AI Agent的演进历程Agent Store的萌芽/雏形阶段核心推动因素1950-1990年概念萌芽期1950年图灵测试提出1956年达特茅斯会议提出“人工智能”和“智能体”的概念1960年代麻省理工学院MIT开发了第一个AI Agent——ELIZA一个纯文本的心理咨询聊天机器人1970年代斯坦福大学开发了第一个有推理能力的AI Agent——MYCIN一个纯文本的医疗诊断专家系统1980年代专家系统Expert Systems爆发但由于“知识获取瓶颈”很快衰落1990年代斯图尔特·罗素和彼得·诺维格出版《AI圣经》给出了AI Agent的明确学术定义。无当时AI Agent的创作门槛极高只有少数科研机构和大型企业能够创作AI Agent没有公开的Agent交易和分发平台。人工智能概念的提出、计算机技术的发展、专家系统的爆发。1990-2010年早期探索期1990年代万维网WWW爆发出现了第一个基于万维网的AI Agent——Web Crawler网络爬虫2000年代移动互联网爆发出现了第一个基于移动设备的AI Agent——Siri苹果公司在2007年发布的iPhone上预装的数字助手2000年代虚拟世界爆发出现了第一个基于虚拟世界的AI Agent——Second Life中的NPC非玩家角色2000年代机器学习特别是监督学习爆发出现了第一个有学习能力的AI Agent——IBM Watson2011年参加Jeopardy!节目并获得冠军的问答机器人。2000年代苹果公司App Store、Google公司Android Market爆发但当时的应用主要是传统软件只有少数AI类应用比如语音识别应用、图像识别应用没有专门的Agent Store2000年代虚拟世界Second Life中有NPC交易平台但当时的NPC主要是预设规则驱动的不是真正的AI Agent。万维网的爆发、移动互联网的爆发、虚拟世界的爆发、机器学习的爆发。2010-2022年技术积累期2010年代深度学习特别是卷积神经网络CNN、循环神经网络RNN、Transformer爆发2018年OpenAI发布GPT-12019年OpenAI发布GPT-22020年OpenAI发布GPT-3首次证明了大语言模型的涌现能力2022年11月OpenAI发布ChatGPT首次将大语言模型的涌现能力以对话式界面展现给普通用户。2010年代微信小程序、支付宝小程序爆发但当时的小程序主要是传统软件的简化版只有少数AI类小程序2022年11月ChatGPT上线后出现了大量第三方的“Custom ChatGPT Bot”创作和分发平台比如Botpress、ManyChat、Tidio等但这些平台主要是针对企业用户的聊天机器人平台不是真正的Agent Store。深度学习的爆发、Transformer的发明、通用大语言模型的爆发。2022-2024年原型爆发期2023年3月OpenAI发布ChatGPT Plugins和GPT-42023年6月OpenAI发布Function Calling API2023年下半年Anthropic Claude、Google Gemini、Meta LLaMA 2、百度文心一言、阿里通义千问、字节跳动豆包等主流大语言模型都陆续推出了自己的Function Calling API和多模态模型2024年1月OpenAI发布GPT-4o。2023年3月OpenAI发布ChatGPT Plugins Store测试版2023年6月LangChain发布LangChain Hub测试版和Agents Marketplace测试版2023年9月Character.AI发布Character.AI Store测试版2023年10月Zapier发布Zapier Agents测试版2024年1月OpenAI发布GPT Store正式版2024年2月Anthropic发布Claude Workspace Agent Hub正式版2024年3月百度文心一言、阿里通义千问、字节跳动豆包的“应用中心/智能助手广场”也陆续迭代成具备创作、发布、交易、分成机制的类Agent Store雏形。通用大语言模型、长短期记忆向量数据库、多模态感知技术、工具调用API技术的成熟普通用户、企业用户、Agent创作者的需求爆发全球各国政府的支持。2024-2027年成熟发展期预测实时多模态大语言模型将成为主流Agent将具备更强的自主性、主动性、社交性多Agent协作系统将成为主流Agent将能够嵌入到任何设备、任何场景中。下一代Agent Store将成熟将出现1-2家全球领先的Agent Store类似当年的App StoreAgent Store的商业模式将多元化Agent Store的生态将非常完善Agent Store的交易额将突破万亿美元。实时多模态大语言模型、多Agent协作系统、跨平台跨场景适配技术的成熟Agent Store的运营经验积累普通用户、企业用户、Agent创作者的需求进一步爆发。2027-2030年生态闭环期预测Agent将成为“下一代操作系统的核心”每个设备、每个场景、每个用户都将有自己的AgentAgent之间将形成一个庞大的“Agent网络”类似当年的互联网。Agent Store将成为“Agent网络的核心交易平台”Agent Store将催生一个市值超过十万亿美元的生态闭环Agent Store将改变人类的工作方式和生活方式。下一代操作系统的诞生Agent网络的形成人类对Agent的依赖程度进一步提高。1.4 本章小结本章从学术定义、工程定义、用户感知定义三个维度明确了「什么是真正的AI Agent」——只有同时具备「自主性、反应性、主动性、社交性」四大核心属性由「大语言模型大脑、多模态感知系统、长短期记忆系统、规划推理系统、工具执行系统」五大核心组件组成能够为用户提供「效率价值、能力价值、情感价值」三大核心价值的实体才能被称为真正的AI Agent。然后本章从核心属性维度对比了「Agent、传统软件、纯LLM」这三个实体指出了Agent的独特优势。接着本章从技术背景、市场背景、政策背景三个维度分析了「为什么Agent Store会在2024年爆发」——四大核心技术通用大语言模型、长短期记忆向量数据库、多模态感知技术、工具调用API技术的成熟为Agent Store的爆发奠定了基础三大核心市场需求普通用户的需求、企业用户的需求、Agent创作者的需求的爆发为Agent Store的爆发提供了动力全球各国政府的支持为Agent Store的爆发提供了保障。最后本章梳理了AI Agent与Agent Store的演进历程将其分为「概念萌芽期、早期探索期、技术积累期、原型爆发期、成熟发展期预测、生态闭环期预测」六个阶段并指出了每个阶段的核心推动因素。通过本章的学习读者应该已经对「什么是真正的AI Agent」、「为什么Agent Store会在2024年爆发」、「AI Agent与Agent Store的演进历程」有了一个清晰的理解。在下一章中我们将深入拆解当前主流的类Agent Store对比它们的核心功能、创作者准入门槛、工具调用生态、商业模式、安全对齐机制并指出它们存在的核心问题。

更多文章