首页 > 新闻 > 一财号

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

GPT之后下一个热点!硅谷大佬为啥追捧AI Agent?

2023-08-28 16:28:08

作者:王煜全    责编:蔡嘉诚

AI聊天机器人主要靠“说”来回答你的问题,而AI Agent则会“动”起来完成具体的任务,就像人类助理一样。

今天说说最近比较热门的人工智能模式创新方面一个新概念:AI Agent,中文的说法是人工智能体。

现如今,各种大模型扎堆出现,似乎只要与科技沾边儿的公司都在做大模型,有人说“百模大战”已经进入白热化阶段,然而,硅谷已经涌现出一股新的潮流,那就是AI Agent。

近两三个月不断出现各种AI Agent项目,谷歌Deepmind推出了robotic agent,利用机械臂自动执行各种工作;亚马逊推出了Amazon Bedrock Agents,可以自动分解企业AI应用开发任务;AI独角兽Inflection也在开发私人AI助理,可以帮助你完成订酒店等私人任务;哥伦比亚大学最近也公布了用于科研的AI Agent项目GPT Researcher。

有人说,至少有100个项目正致力于将AI代理商业化,近10万名开发人员正在构建自主Agent这一轮的热潮离不开OpenAI,有两位关键人物发挥了重要作用。

其中一位是OpenAI联合创始人、前特斯拉AI负责人Andrej Karpathy,他在6月份的一次开发者活动中表示,即使有论文提出了新的大模型训练方法,同事们也都不感兴趣,因为他们已经花了5年时间尝试过各种方法,说白了就是他们玩剩下的。

但是,如果有论文提出AI Agent的新思路,就会引起公司内部的热烈讨论,虽然OpenAI在大模型上比别人快一步,但在AI Agent领域大家都处在同一条起跑线上。

Karpathy的说法为AI Agent增加了热度,然而,AI Agent到底是什么呢?

OpenAI安全系统负责人Lilian Weng撰写了一篇关于AI Agent的博客,详细描述了AI Agent的基本概念与核心原理。

简单说,AI聊天机器人主要靠来回答你的问题,而AI Agent则会起来完成具体的任务,就像人类助理一样,在你忙不过来的时候替你完成一些工作,区别就是用AI来驱动而不是人脑驱动。

从原理上说,AI Agent的核心驱动力是大模型,在此基础上增加规划(Planning)、记忆(Memory)和工具使用(Tool Use)三个关键组件。

大模型已经很聪明了,为什么还要增加三个组件呢?

这是因为,大模型仍然有一些缺陷,不仅能力固化,还记不住新信息,难以完成相对复杂的任务,而这三个组件是为了让大模型能够执行更加复杂的任务。

首先,复杂任务往往难以一步到位,所以需要“规划”组件来负责任务分解,将总任务拆分为各项子任务,也就是“分活儿”。

在这之后就是执行,但GPT-4等大模型记不住多次对话,这就需要增加“记忆”组件,就像给它装上人类的海马体,让它时刻记着任务内容,防止跑偏。

另外,当任务需求超出大模型自身的能力范围时,就需要“工具使用”组件,调用其他软件工具来执行。

你会发现,这与人类执行任务时的原理非常相似,将大项目拆分成小项目,超出人力范围的时候就借助工具来完成。所以,大模型加上三大组件,就有潜力成为人类的得力助手,也就有了巨大的想象空间。

但这只是原理,有哪些已经做出尝试的AI Agent应用呢?

今年4月,AutoGPT让AI Agent进入人们的视野,原本使用GPT-4时需要持续输入prompt提示词,但是使用AutoGPT时,只需提供一个AI名称、描述和五个目标,AutoGPT就可以自己拆解任务并分步执行,直到完成项目,比如创建简单的网站等等,这让人们更加方便的使用大模型,AutoGPT应用也红极一时。

不过,AutoGPT后续出现了执行速度慢、陷入死循环、开销过大等问题,即便如此,它也让人们看到了AI Agent的巨大潜力。

最近,有人推出了MetaGPT,相当于软件开发领域加强版的AutoGPT,能够模拟多种角色,如工程师、产品经理、架构师和项目经理,10分钟内可以制作完成Flappy Bird这样的小游戏,也就是AutoGPT的定制化调优版本。

另一家初创公司Adept与AutoGPT的路线不同,他们开发了自己的大模型ACT-1,经过这个大模型训练后的Adept AI可以直接与浏览器和各种软件交互,比如你想买一台冰箱,只需告诉Adept AI你的预算,它就会自动在网上筛选,还能自动发送邮件给卖家。虽然Adept AI仍处于测试阶段,却收获了4.15亿美元投资,估值超过10亿美元。

那么,AI Agent的真正可贵之处是什么呢?我一直倡导,这一轮AI变革中最大的机会不是大模型本身,而是能够发挥技术优势的应用。技术是坦克,但关键是打出闪电战来。所以要摸清大模型的能力边界,在它的基础上做应用模式创新。未来不是AIGC,而是AIGS

而AI Agent的三大组件就是在大模型边界之外进行能力拓展,就像是给一个困在盒子里的大脑装上了行动的翅膀,使AI可以做为专家级的、个性化的、连续的普遍服务推出,使大家都可以真正用上AI。

可以预见,未来会有更多公司推出AI Agent项目,无论是在前人基础上做技术调优,还是另辟蹊径,都有巨大的创新空间。

不过,既然科技大佬这么重视,投资方也很追捧,可为什么还未出现AI时代的BAT呢?

一方面,AI Agent才刚刚起步,需要大量的创新、试错和调优,另一方面,我曾提出AI时代的应用模式创新,不是简单的内容生成,而是规模化的服务,需要满足高端化、个性化、持续化和普惠化这四大特征,这样的服务规模化应用,才能最大程度地发挥增量价值。

虽然大家都在探索,但现阶段大部分应用还只是停留在功能优化和效率提升上,比如,Adept AI能够完成基础性的软件操作,却并不是专家级的高端服务,也没有根据每个人的需求提供个性化服务。但有了AI Agent,开发高端服务所需的技术就已经完备了,剩下的就是对市场真正需求的挖掘和满足。我相信很快就会有面向公众的规模化的AI服务推出。

正如Karpathy所说,大家都站在AI Agent的同一起跑线上,AI时代的下一个BAT也许就隐藏其中,懂得了坦克和闪电战的道理,下一个把握住BAT级别机会的人可能就是你。

(王煜全为海银资本创始合伙人)

举报

文章作者

相关阅读

中兴通讯发布数字星云3.0 持续探索大模型产业应用

04-15 12:57

连麦硅谷丨大厂AI竞争有多卷?知名科技投资人这么说

一场人工智能军备竞赛,让原本崇尚工作生活平衡的硅谷一夜之间“卷”了起来。第一财经记者于近期实地探访位于美国加利福尼亚州的硅谷,并独家专访硅谷知名科技投资人,听听她如何形容目前的人工智能创业热潮。

03-29 12:22

Sora出世 人工智能将引领新一轮行业变革丨焦点资讯

2月16日凌晨,OpenAI公司发布最新“文生视频”大模型Sora,并附带发布了多条由Sora生成的视频,相较于目前“文生视频”业内主流的数秒钟版本,此次发布的Sora可以一次性生成一分钟的视频。Sora的发布毫无悬念地再次引发了整个市场的高度关注。有人认为Sora创新的模型架构为大模型的发展开辟了新道路,也有人认为Sora的推出让通用人工智能到来的日期大大提前,还有市场人士表示Sora的爆红与OpenAI高超的营销密不可分。可以预见的是,Sora的横空出世,无疑将促使人工智能引领新一轮行业变革。

02-19 12:38

出货量重回全球第一!晶科能源预计2023年组件出货超过75GW

1月12日,第一财经记者从晶科能源(688223.SH)获悉,截至2023年底,晶科能源的光伏组件预计实现年度销量超过75GW,出货量位列全球第一。第一财经记者注意到,晶科能源上次组件出货量位列全球第一在2019年,此后的三年间(2020年至2022年),隆基绿能(601012.SH)的光伏组件出货量位列全球第一。

01-12 19:26

光伏组件产能过剩价格“腰斩”,市场何时能回暖?

因年底交易惨淡,光伏组件价格中枢再次下移,明年一季度会回暖吗?

2023-12-25 18:31
一财最热
点击关闭