AI自主智能體盤點(diǎn),構(gòu)建、應(yīng)用全覆蓋,人大高瓴文繼榮等32頁綜述
機(jī)器之心報(bào)道
(資料圖片)
編輯:杜偉、陳萍
本文全面介紹了基于大語言模型(LLM)的智能體的構(gòu)建、潛在應(yīng)用和評估,為全面了解該領(lǐng)域的發(fā)展以及啟發(fā)未來的研究具有重要意義。
在當(dāng)今的 AI 時(shí)代,自主智能體被認(rèn)為是通向通用人工智能(AGI)的一條有前途的道路。所謂自主智能體,即能夠通過自主規(guī)劃和指令來完成任務(wù)。在早期的開發(fā)范式中,決定智能體行動的策略功能是以啟發(fā)式為主的,并在環(huán)境交互中逐步得到完善。
不過,在不受約束的開放域環(huán)境中,自主智能體的行動往往很難企及人類水平的熟練程度。
隨著近年來大語言模型(LLM)取得了巨大成功,并展現(xiàn)出了實(shí)現(xiàn)類人智能的潛力。因而得益于強(qiáng)大的能力,LLM 越來越多地被用作創(chuàng)建自主智能體的核心協(xié)調(diào)者,并先后出現(xiàn)花樣繁多的 AI 智能體。這些智能體通過模仿類人的決策過程,為更復(fù)雜和適應(yīng)性更強(qiáng)的 AI 系統(tǒng)提供了一條可行性路徑。
基于 LLM 的自主智能體一覽,包括工具智能體、模擬智能體、通用智能體和領(lǐng)域智能體。
在現(xiàn)階段,對已經(jīng)出現(xiàn)的基于 LLM 的自主智能體進(jìn)行整體分析非常重要,并對全面了解該領(lǐng)域的發(fā)展現(xiàn)狀以及啟發(fā)未來的研究具有重要意義。
本文中,來自中國人民大學(xué)高瓴人工智能學(xué)院的研究者對基于 LLM 的自主智能體展開了全面調(diào)研,并著眼于它們的構(gòu)建、應(yīng)用和評估三個(gè)方面。
論文地址:/pdf/
對于智能體的構(gòu)建,他們提出了一個(gè)由四部分組成的統(tǒng)一框架,分別是表示智能體屬性的配置模塊、存儲歷史信息的記憶模塊、制定未來行動策略的規(guī)劃模塊和執(zhí)行規(guī)劃決定的行動模塊。在介紹了典型的智能體模塊之后,研究者還總結(jié)了常用的微調(diào)策略,通過這些策略來增強(qiáng)智能體對不同應(yīng)用場景的適應(yīng)性。
接下來研究者概述了自主智能體的潛在應(yīng)用,探討它們?nèi)绾螌ι鐣茖W(xué)、自然科學(xué)和工程學(xué)領(lǐng)域產(chǎn)生增益。最后討論了自主智能體的評估方法,包括主觀和客觀評估策略。下圖為文章整體架構(gòu)。
圖源:/Paitesanshi/LLM-Agent-Survey
基于 LLM 的自主智能體構(gòu)建
為了讓基于 LLM 的自主智能體更加高效,有兩個(gè)方面需要考慮:首先是應(yīng)該設(shè)計(jì)怎樣的架構(gòu)使得智能體能更好的利用 LLM;其次是如何有效地學(xué)習(xí)參數(shù)。
智能體架構(gòu)設(shè)計(jì):本文提出了一個(gè)統(tǒng)一的框架來總結(jié)之前研究中提出的架構(gòu),整體結(jié)構(gòu)如圖 2 所示,它由分析(profiling)模塊、記憶模塊、規(guī)劃模塊以及動作模塊組成。
總結(jié)而言,分析模塊旨在識別智能體是什么角色;記憶和規(guī)劃模塊可將智能體置于動態(tài)環(huán)境中,使智能體能夠回憶過去的行為并計(jì)劃未來的行動;動作模塊負(fù)責(zé)將智能體的決策轉(zhuǎn)化為具體的輸出。在這些模塊中,分析模塊影響記憶和規(guī)劃模塊,這三個(gè)模塊共同影響動作模塊。
分析模塊
自主智能體通過特定角色來執(zhí)行任務(wù),例如程序員、教師和領(lǐng)域?qū)<摇7治瞿K旨在表明智能體的角色是什么,這些信息通常被寫入輸入提示中以影響 LLM 行為。在現(xiàn)有的工作中,有三種常用的策略來生成智能體配置文件:手工制作方法;LLM-generation 方法;數(shù)據(jù)集對齊方法。
記憶模塊
記憶模塊在 AI 智能體的構(gòu)建中起著非常重要的作用。它記憶從環(huán)境中感知到的信息,并利用記錄的記憶來促進(jìn)智能體未來的動作。記憶模塊可以幫助智能體積累經(jīng)驗(yàn)、實(shí)現(xiàn)自我進(jìn)化,并以更加一致、合理、有效的方式完成任務(wù)。
規(guī)劃模塊
當(dāng)人類面臨復(fù)雜任務(wù)時(shí),他們首先將其分解為簡單的子任務(wù),然后逐一解決每個(gè)子任務(wù)。規(guī)劃模塊賦予基于 LLM 的智能體解決復(fù)雜任務(wù)時(shí)需要的思考和規(guī)劃能力,使智能體更加全面、強(qiáng)大、可靠。本文介紹了兩種規(guī)劃模塊:沒有反饋的規(guī)劃以及有反饋的規(guī)劃。
動作模塊
動作模塊旨在將智能體的決策轉(zhuǎn)化為具體的結(jié)果輸出。它直接與環(huán)境交互,決定智能體完成任務(wù)的有效性。本節(jié)從動作目標(biāo)、策略、動作空間和動作影響來介紹。
除了上述 4 個(gè)部分外,本章還介紹了智能體的學(xué)習(xí)策略,包括從示例中學(xué)習(xí)、從環(huán)境反饋中學(xué)習(xí)、從交互的人類反饋中學(xué)習(xí)。
表 1 列出了之前的工作和本文的分類法之間的對應(yīng)關(guān)系:
基于 LLM 的自主智能體應(yīng)用
本章探討了基于 LLM 的自主智能體在三個(gè)不同領(lǐng)域的變革性影響:社會科學(xué)、自然科學(xué)和工程。
例如基于 LLM 的智能體可用于設(shè)計(jì)和優(yōu)化復(fù)雜結(jié)構(gòu),如建筑物、橋梁、水壩、道路等。此前,有研究者提出了一個(gè)交互式框架,人類建筑師和 AI 智能體協(xié)同辦公在 3D 模擬中構(gòu)建結(jié)構(gòu)環(huán)境。交互式智能體可以理解自然語言指令、放置模塊、尋求建議并結(jié)合人類反饋,顯示出工程設(shè)計(jì)中人機(jī)協(xié)作的潛力。
又比如在計(jì)算機(jī)科學(xué)和軟件工程領(lǐng)域,基于 LLM 的智能體提供了自動化編碼、測試、調(diào)試和文檔生成的潛力。有研究者提出了 ChatDev ,這是一個(gè)端到端的框架,其中多個(gè)智能體通過自然語言對話進(jìn)行溝通和協(xié)作,以完成軟件開發(fā)生命周期;ToolBench 可以用于代碼自動補(bǔ)全和代碼推薦等任務(wù);MetaGPT 可以扮演產(chǎn)品經(jīng)理、架構(gòu)師、項(xiàng)目經(jīng)理和工程師等角色,內(nèi)部監(jiān)督代碼生成并提高最終輸出代碼的質(zhì)量等等。
下表為基于 LLM 的自主智能體的代表性應(yīng)用:
基于 LLM 的自主智能體評估
本文介紹了兩種常用的評估策略:主觀評估和客觀評估。
主觀評估是指人類通過交互、評分等多種手段對基于 LLM 的智能體的能力進(jìn)行測試。在這種情況下,參與評估的人員往往是通過眾包平臺招募的;而一些研究者認(rèn)為眾包人員由于個(gè)體能力差異而不穩(wěn)定,因而也會使用專家注釋來進(jìn)行評估。
除此以外,在當(dāng)前的一些研究中,我們可以使用 LLM 智能體作為主觀評估者。例如在 ChemCrow 研究中,EvaluatorGPT 通過指定等級來評估實(shí)驗(yàn)結(jié)果,該等級既考慮任務(wù)的成功完成,又考慮基本思維過程的準(zhǔn)確性。又比如 ChatEval 組建了一個(gè)基于 LLM 的多智能體裁判小組,通過辯論來評估模型的生成結(jié)果。
與主觀評估相比,客觀評估具有多種優(yōu)勢,客觀評估是指使用定量指標(biāo)來評估基于 LLM 自主智能體的能力。本節(jié)從指標(biāo)、策略和基準(zhǔn)的角度回顧和綜合客觀評估方法。
在使用評估過程中,我們可以將這兩種方法結(jié)合使用。
表 3 總結(jié)了以前的工作與這些評估策略之間的對應(yīng)關(guān)系:
了解更多內(nèi)容,請參考原論文。
關(guān)鍵詞:
相關(guān)文章
AI自主智能體盤點(diǎn),構(gòu)建、應(yīng)用全覆蓋,人大高瓴文繼榮等32頁綜述
機(jī)器之心報(bào)道編輯:杜偉、陳萍本文全面介紹了基于大語言模型(LLM)的
深交所:經(jīng)緯紡機(jī)擬披露重大事項(xiàng)臨時(shí)停牌
深交所公告,經(jīng)緯紡織機(jī)械股份有限公司擬披露重大事項(xiàng),公司股票于8月2
紅米Note 11T Pro手機(jī)特價(jià)1298元
紅米Note11TPro5G手機(jī),現(xiàn)在京東自營特價(jià)1298元,優(yōu)惠力度大,好價(jià)可入
歐派家居股東戶數(shù)增加54.81%,戶均持股363.68萬元
歐派家居2023年8月30日在半年度報(bào)告中披露,截至2023年6月30日公司股東
小米集團(tuán)上半年經(jīng)調(diào)整凈利潤83.7億元 同比增長69.5%
小米集團(tuán)8月29日晚間發(fā)布二季度及半年報(bào),第二季度營收億元人民幣,同
精彩推送
AI自主智能體盤點(diǎn),構(gòu)建、應(yīng)用全覆蓋,人大高瓴文繼榮等32頁綜述
機(jī)器之心報(bào)道編輯:杜偉、陳萍本文全面介紹了基于大語言模型(LLM)的
中密控股(300470.SZ):上半年凈利增6.92%至1.61億元 擬10派5元
格隆匯8月29日丨中密控股(300470 SZ)公布2023年半年度報(bào)告,報(bào)告期營業(yè)
2023年龍崗區(qū)致美學(xué)校錄取分?jǐn)?shù)線(小學(xué)+初中)
龍崗區(qū)外國語學(xué)校(集團(tuán))致美學(xué)校2023年新生錄取分?jǐn)?shù)線龍外(集團(tuán))致
消息稱聯(lián)想 Legion Go 游戲掌機(jī)售價(jià) 799 美元, 9 月 1 日發(fā)布
IT之家8月28日消息,Windowsreport報(bào)道稱,聯(lián)想的LegionGo游戲掌機(jī)將于
阿爾卡拉斯衛(wèi)冕美網(wǎng)不是夢(續(xù))
2023年美網(wǎng)將于8月28日拉開大幕,衛(wèi)冕冠軍阿爾卡拉斯鐵定會在美網(wǎng)之后
「世界說」美國移民危機(jī)引發(fā)突發(fā)公共衛(wèi)生事件 美媒督促政府盡快行動
中國日報(bào)網(wǎng)8月29日電《今日美國報(bào)》(USAToday)刊文稱,從美國邊境涌
萬達(dá)電影:上半年凈利潤4.2億元,上年同期凈虧損5.8億元
萬達(dá)電影(002739)公布了上半年的財(cái)務(wù)數(shù)據(jù),顯示公司凈利潤為4 2億元,
胡歌深夜曬大胡子照,發(fā)文稱對不起好多人:希望對得起短暫一生
8月29日凌晨,胡歌發(fā)文稱:“我盡量我盡量我盡量保持冷靜我對不起好多
大參林股東戶數(shù)增加5.67%,戶均持股114.97萬元
大參林最新股東戶數(shù)2 77萬戶,低于行業(yè)平均水平。公司戶均持有流通股份
卡姆丹克太陽能(00712)公布中期業(yè)績 股東應(yīng)占純利4930萬元 同比扭虧為盈
智通財(cái)經(jīng)APP訊,卡姆丹克太陽能(00712)公布2023年中期業(yè)績,收益約為人
正商實(shí)業(yè)就尚未償還的2023年到期優(yōu)先票據(jù)展開交換要約
有關(guān)尚未償還的2023年到期12 5厘優(yōu)先票據(jù)的交換要約,于2023年8月29日
電報(bào)解讀|推動電子處方在更大范圍通行 DRG/DIP信息系統(tǒng)受關(guān)注
精品VIP投研內(nèi)容 當(dāng)前內(nèi)容僅限訂閱用戶查看
意媒:迪巴拉經(jīng)檢查后排除了受傷的可能性,但不太可能出戰(zhàn)米蘭
直播吧8月28日訊PazzidiFanta報(bào)道,迪巴拉經(jīng)檢查后排除了受傷的可能,
網(wǎng)友稱想正常討論《星空》很難 應(yīng)該客觀來談?wù)撍?/a>
《星空》即將于9月6日正式發(fā)售,這款B社二十多年來的首個(gè)全新IP毫無疑
京山輕機(jī):請您關(guān)注公司2023年4月22日披露的《2022年度利潤分配預(yù)案公告》
京山輕機(jī)(000821)08月29日在投資者關(guān)系平臺上答復(fù)了投資者關(guān)心的問題。
蘇常柴A中報(bào):營收增長14.62%,凈利潤正增長【BT財(cái)報(bào)快閃】
(相關(guān)資料圖)(相關(guān)資料圖)(相關(guān)資料圖)(相關(guān)資料圖)邀您觀看:蘇常柴A
SMM熱卷區(qū)域庫存:基本面矛盾累積 本周張家港庫存繼續(xù)上升
本周張家港熱卷庫存46 4萬噸,環(huán)比上周+4 1萬噸,增幅9 69%;陽歷同比-
新華全媒+丨安置點(diǎn)里的心理輔導(dǎo):暖心關(guān)懷 撫慰心靈
作為汛情臨時(shí)安置點(diǎn),自8月4日起,河北省涿州市西丁市口學(xué)校就為這里的
金力泰(300225.SZ)發(fā)布上半年業(yè)績,凈虧損92.79萬元,收窄98.35%
智通財(cái)經(jīng)訊,金力泰(300225 SZ)發(fā)布2023年半年度報(bào)告,該公司營業(yè)收入
南漳:特種養(yǎng)殖 “鴕”起致富希望
南漳:特種養(yǎng)殖“鴕”起致富希望---初秋時(shí)節(jié),走進(jìn)南漳縣肖堰鎮(zhèn)陳家榜
廣西百色:“金葉子”串起大產(chǎn)業(yè)
廣西百色茶葉種植歷史悠久,茶葉在全市多個(gè)縣(市、區(qū))均有種植。一片
中糧科工:公司不涉及鹽堿水養(yǎng)魚項(xiàng)目
每經(jīng)AI快訊,有投資者在投資者互動平臺提問:公司有無鹽堿水養(yǎng)魚項(xiàng)目?
尋找下一個(gè)百億丨睿藍(lán)換電換來一片天 北碚造新能源車駛向新賽道
編者按產(chǎn)業(yè)強(qiáng)則經(jīng)濟(jì)強(qiáng),產(chǎn)業(yè)興則百業(yè)興。著眼成渝地區(qū)雙城經(jīng)濟(jì)圈,錨定
迪哲醫(yī)藥(688192.SH)發(fā)布上半年業(yè)績,凈虧損5.14億元,同比虧損擴(kuò)大
智通財(cái)經(jīng)訊,迪哲醫(yī)藥(688192 SH)發(fā)布2023年半年度報(bào)告,報(bào)告期內(nèi),公
美網(wǎng)首日中國選手綜述:王曦雨逆轉(zhuǎn)+王欣瑜首勝,4人出戰(zhàn)全部晉級
在美網(wǎng)首日有4位中國選手出戰(zhàn),分別是張之臻、王欣瑜、朱琳和王曦雨,4
野馬電池:聘任胡陳波為公司副總經(jīng)理 不再擔(dān)任公司總工程師職務(wù)
野馬電池(SH605378,收盤價(jià):21 96元)8月29日晚間發(fā)布公告稱,綜合考
大元泵業(yè)披露2023半年度分配預(yù)案:擬10派2元
8月27日大元泵業(yè)發(fā)布2023半年度分配預(yù)案,擬10派2元(含稅),預(yù)計(jì)派現(xiàn)
康龍化成:目前英國利物浦CGTCDMO服務(wù),在手訂單初具規(guī)模
康龍化成日前在接受調(diào)研時(shí)表示,CGT作為公司中長期的戰(zhàn)略業(yè)務(wù),未來三
皮阿諾:接受招商證券等機(jī)構(gòu)調(diào)研
皮阿諾(SZ002853,收盤價(jià):17 93元)發(fā)布公告稱,2023年8月26日10:00-
小學(xué)語文電子課本下載安裝 小學(xué)語文電子課本下載
1、找人教版官方網(wǎng)站,可能不是免費(fèi)的。2、你還可以登陸語文學(xué)習(xí)網(wǎng)。相
SMM鈷鋰晨會紀(jì)要:7月全球新能源汽車銷量下滑 本周鈷鋰材料價(jià)格有穩(wěn)有跌
7月全球新能源汽車銷量近期出爐,據(jù)數(shù)據(jù)顯示,2023年7月全球乘用車總銷
深交所:經(jīng)緯紡機(jī)擬披露重大事項(xiàng)臨時(shí)停牌
深交所公告,經(jīng)緯紡織機(jī)械股份有限公司擬披露重大事項(xiàng),公司股票于8月2
RPG《星之海》發(fā)布媒體贊譽(yù)圖 游戲正式解鎖發(fā)售
RPG《星之海》發(fā)布媒體贊譽(yù)圖游戲正式解鎖發(fā)售,發(fā)售,游戲,星之海,xbox,
安徽省蕭縣市場監(jiān)督管理局發(fā)布2023年第25期食品監(jiān)督抽檢信息
中國質(zhì)量新聞網(wǎng)訊據(jù)安徽省蕭縣人民政府網(wǎng)站2023年8月29日消息,蕭縣市
杭州銀行上半年凈利潤同比增超26%,不良率創(chuàng)歷史新低
杭州銀行上半年凈利潤同比增超26%,不良率創(chuàng)歷史新低,貸款率,凈收入,杭
河口區(qū)稅務(wù)局開展“紅柳悅讀會”活動 持續(xù)推進(jìn)“書香稅務(wù)”建設(shè)
近年來,國家稅務(wù)總局東營市河口區(qū)稅務(wù)局高度重視稅務(wù)文化建設(shè),堅(jiān)持以
新征程上看應(yīng)急丨看“浙”里如何繪就安全底色
新華網(wǎng)8月29日電安全生產(chǎn)作為民生大事,事關(guān)人民福祉及經(jīng)濟(jì)社會發(fā)展大
梁山縣館驛鎮(zhèn)退役軍人服務(wù)站開展“大走訪大調(diào)查”活動
服務(wù)站工作人員向退役軍人宣傳各項(xiàng)政策大眾網(wǎng)見習(xí)記者崔麗麗通訊員史彤
易事特:上半年凈利2.81億元 光儲業(yè)務(wù)營收增幅較大
8月29日晚間,易事特()披露2023年中報(bào)。2023年上半年公司實(shí)現(xiàn)營收億
紅米Note 11T Pro手機(jī)特價(jià)1298元
紅米Note11TPro5G手機(jī),現(xiàn)在京東自營特價(jià)1298元,優(yōu)惠力度大,好價(jià)可入
最新減持要求力度超預(yù)期 將有效改善資本市場投資環(huán)境
8月27日,證監(jiān)會對股份減持行為作出新要求,進(jìn)一步規(guī)范控股股東、實(shí)際
關(guān)于領(lǐng)克08,你需要知道什么?
根據(jù)相關(guān)統(tǒng)計(jì)數(shù)據(jù)顯示,在過去的一年中20~30萬元中高端細(xì)分市場的新能
四川省甘孜藏族自治州稻城縣2023-08-29 17:24發(fā)布雷電黃色預(yù)警
一、四川省甘孜藏族自治州稻城縣天氣預(yù)報(bào)1、稻城縣氣象臺2023年08月29
