最新AI:無需被告知規(guī)則就能自己玩轉游戲?
2016年,Alphabet的DeepMind與AlphaGo一起問世,該AI一直領先于人類最好的棋手。一年后,工作繼續(xù)完善,AlphaGo Zero創(chuàng)建。AlphaGo通過觀察業(yè)余比賽和專業(yè)比賽學會了圍棋,而AlphaGo Zero能通過簡單地與自己對戰(zhàn)來掌握游戲。然后,DeepMind創(chuàng)建了AlphaZero,該AlphaZero可以使用單一算法玩圍棋、國際象棋和將棋。這些AI的共同特點是,它
原創(chuàng)
2020-12-25 08:00:24
來源:釘科技??

2016年,Alphabet的DeepMind與AlphaGo一起問世,該AI一直領先于人類最好的棋手。一年后,工作繼續(xù)完善,AlphaGo Zero創(chuàng)建。AlphaGo通過觀察業(yè)余比賽和專業(yè)比賽學會了圍棋,而AlphaGo Zero能通過簡單地與自己對戰(zhàn)來掌握游戲。然后,DeepMind創(chuàng)建了AlphaZero,該AlphaZero可以使用單一算法玩圍棋、國際象棋和將棋。

image.png

這些AI的共同特點是,它們必須掌握游戲規(guī)則然后再進行培訓。DeepMind的最新AI MuZero不需要游戲的規(guī)則即可掌握游戲。與DeepMind之前的AI算法一樣,MuZero具有相同甚至更好的能力。  

MuZero沒有嘗試對所有模型進行建模,而只是嘗試考慮那些對決策至關重要的因素。正如DeepMind所指出的,這是作為人類所做的事情。當大多數(shù)人看著窗外,看到地平線上形成烏云時,他們通常不會陷入烏云是如何形成之類的問題。相反,它們思考的是如果出門應該穿什么以防止被淋濕。MuZero就是做類似這樣的事情。

MuZero在做決定時會考慮三件事。首先,它會考慮上一次行動的結果、當前所處的位置以及下一次行動的最佳方案。這種看似簡單的方法使MuZero成為迄今為止DeepMind最有效的算法。在測試中DeepMind發(fā)現(xiàn),MuZero與之前的AI算法表現(xiàn)都一樣好。而且,給它的時間越多,它提供的解決方案就越好。即使加入了時間限制,比如在行動前限制吃豆人女士的模擬次數(shù),MuZero也取得了不錯的效果。

該公司表示,MuZero的學習能力有一天可以幫助解決沒有簡單規(guī)則領域的復雜問題。(釘科技根據(jù)《engadget》消息編譯)

最新文章
1
磁力引擎及快手電商斬獲第十六屆虎嘯獎七項大獎 全域AI提效打造品牌營銷新解法
2
讓私信小窗口爆發(fā)大生意!快手商業(yè)私信大會將于6月10日召開
3
彩電618前半程“高增”:MiniLED最暢銷,98寸、100寸價格“倒掛”
4
華為Pura 80標準版價格預測:比上代最高優(yōu)惠300元 將推動鴻蒙5普及
5
WWDC 25前瞻:除了系統(tǒng),可能有哪些新品發(fā)布?
6
國補政策大調(diào)整 家電行業(yè)應未雨綢繆
7
告別價格戰(zhàn),中國智能電視行業(yè)正在從價格戰(zhàn)轉向價值戰(zhàn)
8
GPT-5即將發(fā)布,OpenAI能否再創(chuàng)輝煌?
9
告別價格戰(zhàn),中國智能電視行業(yè)正在從價格戰(zhàn)轉向價值戰(zhàn)
10
愛仕達擬1.5億元在越南建廠,小家電出海是風口還是虎口?
11
微星新款24寸顯示器上市:FHD 600Hz屏首發(fā)7999元
12
蘋果終極大招!20周年紀念版iPhone曝光:全玻璃機身
13
曝iOS 26是半成品:蘋果把兩項重要功能留到了iOS 27
14
智能電視僅需399元!價格戰(zhàn)是策略還是毒藥?
15
凱度《用心煥新廚》首期上線,袁姍姍見證潘長江父女“廚房戰(zhàn)爭”大和解
16
快手顏廷貴的鐵牛江湖:賣得是中國制造,更是中國驕傲
17
新秀賽段主播也能撬動百萬銷量?快手達人佳佳以強信任關系引爆護膚專場
18
自然場景植入構建品牌心智,快手短劇聯(lián)合美團打開品牌營銷新藍海
19
可靈AI與《逆水寒》手游達成深度合作 AI技術賦能游戲內(nèi)容創(chuàng)新
20
盛夏爆品全域熱銷,快手磁力引擎“清涼一夏煥新計劃”引爆消暑經(jīng)濟
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512