快手Kwai Agents系統(tǒng)、模型、數(shù)據(jù)全部開源
7B的模型也能玩轉(zhuǎn)AI Agents了?近期,快手開源了Kwai Agents,親測發(fā)現(xiàn),問它周末滑雪問題,它不但能幫你找到場地,連當(dāng)天的天氣都幫你考慮周到了。 大語言模型(LLM)通過對語言的建模而掌握了大量知識,并具備一定認(rèn)知和推理能力。但由于無法跟世界保持實時的交互,在單獨使用的情況下,常會出現(xiàn)一本正經(jīng)地胡說八道的現(xiàn)象。而AI Agents就是解決這個問題的道路之一,它通過激發(fā)大模型任
2024-01-04 19:15:36
來源:丁科技網(wǎng)??

7B的模型也能玩轉(zhuǎn)AI Agents了?近期,快手開源了Kwai Agents,親測發(fā)現(xiàn),問它周末滑雪問題,它不但能幫你找到場地,連當(dāng)天的天氣都幫你考慮周到了。

大語言模型(LLM)通過對語言的建模而掌握了大量知識,并具備一定認(rèn)知和推理能力。但由于無法跟世界保持實時的交互,在單獨使用的情況下,常會出現(xiàn)一本正經(jīng)地胡說八道的現(xiàn)象。而AI Agents就是解決這個問題的道路之一,它通過激發(fā)大模型任務(wù)規(guī)劃、反思、調(diào)用工具等能力,使大模型能夠借助現(xiàn)實世界工具提升生成內(nèi)容的準(zhǔn)確性,甚至有能力解決復(fù)雜問題。

據(jù)了解,KwaiAgents是一個先進(jìn)的AI智能體系統(tǒng),由快手聯(lián)合哈爾濱工業(yè)大學(xué)研發(fā),通過使用大型語言模型來模仿人類認(rèn)知技能,可應(yīng)用于自然語言處理、語音識別等領(lǐng)域。Kwai Agents可以使7B/13B的“小”大模型也能達(dá)到超越GPT-3.5的效果,目前該項目已將系統(tǒng)、模型、數(shù)據(jù)、評測全部開源,使得更多的研究人員可以參與其中。

技術(shù)報告:https://arxiv.org/abs/2312.04889

項目主頁:https://github.com/KwaiKEG/KwaiAgents

從「KwaiAgents」的Github主頁中可以看到,本次開源內(nèi)容包含:

1.系統(tǒng)(KAgentSys-Lite):輕量級AI Agents系統(tǒng),并配備事實、時效性工具集;

2.模型(KAgentLMs):Meta-Agent Tuning后,具有Agents通用能力的系列大模型及其訓(xùn)練數(shù)據(jù);

3.評測(KAgentBench):開箱即用的Agent能力自動化評測Benchmark與人工評測結(jié)果。

KAgentBench通過人工精細(xì)化標(biāo)注的上千條數(shù)據(jù),做到了開箱即用,讓大家能夠用一行命令評測一個大模型在不同模板下,各方面的Agents能力。下表顯示了經(jīng)過快手團(tuán)隊調(diào)優(yōu)后,7B-13B模型各項能力的提升,且超越了GPT-3.5的效果:

同時,作者們還請人類標(biāo)注者在200個事實性和時效性的問題(如“劉德華今年幾歲了”),對不同的大模型和Agent系統(tǒng)進(jìn)行了交叉評估,可以看到KAgentSys系統(tǒng)和MAT之后模型提升顯著(百分號前為正確率,括號內(nèi)為5分制均分)。

通常僅依賴網(wǎng)頁搜索對一些長尾問題和熱門問題返回結(jié)果不佳。比如問到“安東內(nèi)拉比梅西大多少天?”這類長尾問題,往往搜索結(jié)果返回的都是一些兩者的八卦新聞,而返回不了一些關(guān)鍵信息。而KAgentSys 通過調(diào)用百科搜索工具獲取精準(zhǔn)的出生日期,再調(diào)用time_delta時間差工具算出年齡差,就能精準(zhǔn)回答這個問題了。

快手技術(shù)人員表示,AI Agents是一條非常有潛力的道路,未來一方面會在這個方向持之以恒地沉淀核心技術(shù),并為整個社區(qū)不斷地注入新的活力;另一方面,也會積極探索Agents技術(shù)與快手業(yè)務(wù)的結(jié)合,嘗試更多有趣、有價值的創(chuàng)新應(yīng)用落地。

最新文章
1
海信羅馬假日mini斬獲CES 2025創(chuàng)新獎,引領(lǐng)精致健康洗護(hù)潮流
2
CES觀察:科技品牌兩翼齊飛,九號公司的“智造未來”
3
極米攜全新概念產(chǎn)品XGIMI Ascend亮相CES 2025
4
CES2025:全球最大RGB-Mini LED電視亮相,海信讓液晶電視首次發(fā)出彩色光源
5
BOE(京東方)全新概念級“AI視聽中心”亮相CES 2025 攜手高通引領(lǐng)智慧家居娛樂新圖景
6
趨勢2025 | 投資產(chǎn)出雙向奔赴,算力布局不斷優(yōu)化
7
空調(diào)最多補3臺,補貼擴(kuò)容至12類,2025家電國補繼續(xù)“賞飯吃”
8
過去一年手機(jī)圈除了華為三折疊,其他都在原地打怪升級?
9
手機(jī)滿電復(fù)活只要幾秒鐘?CES上這個“烤面包機(jī)”太神奇了
10
CES2025高通推出驍龍X平臺,將在2026年適配超100款終端設(shè)備
11
2025年國補政策一文看懂:國四車、家電、手機(jī)/平板都有補貼
12
市面上哪些手機(jī)不能參與國補 6000元以上沒戲!專家:這是掀蘋果華為飯碗
13
2025年家電“國補”,這些企業(yè)將迎重大利好
14
2024冰箱行業(yè)十大事件:保鮮養(yǎng)鮮創(chuàng)新深化、AI雙系統(tǒng)日漸走火
15
2024洗衣機(jī)十大事件:產(chǎn)品更強更漂亮,品牌年末擴(kuò)產(chǎn)忙
16
CES觀察:電視“新百年”,海信開啟RGB-Mini LED時代
17
TCL實業(yè)CES 2025:屏顯科技引領(lǐng),全品類智能終端展現(xiàn)頂尖科技力
18
亮相2025CES 海信“AI+智慧城市”大步走上世界舞臺
19
杜比在 CES 2025 上展現(xiàn)車載娛樂創(chuàng)新加速度
20
BOE(京東方)前沿技術(shù)亮相CES 2025 “HERO”計劃描繪多場景智慧新藍(lán)圖
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512