【世界第一高手】微軟開發食鬼AI,成全球首名滿分「玩家」

【世界第一高手】微軟開發食鬼AI,成全球首名滿分「玩家」

Tech News 科技熱話
By Presslogic on 16 Jun 2017

經典遊戲《食鬼》自在1980年推出以來一直都未有人成功以滿分姿態完成遊戲,而這壯舉則由微軟的AI做到了。

berkeley
Photo by berkeley

一隊最近被微軟收購的機器深度學習團隊Maluuba開發出一個AI系統,並自我學習了如何完美打爆機。它成功以999,900分的滿分姿態完成Atari2600版本的遊戲。AI所用的不是一般的機器學習技術,而是結合了分治法(divide-and-conquer)以及強化學習,學習如何征服這遊戲。

Microsoft
Photo by Microsoft

具體來說,Maluuba將遊戲的不同部分劃分為不同責任,並分配予超過150個單位。團隊隨後就用了一個名為Hybrid Reward Architecture的技術去訓練AI。AI内的每個小單位就會自行完成剛才被分配到的任務。團隊亦把其中一個單位指派成領導角色,整合其他單位的回饋而決定如何控制角色。

wikipedia
Photo by wikipedia

領導單位會按照小單位所建議的方向以及建議的重要性去決定最後行走的方向。團隊解釋指,小單位必需在決定自己答案的同時考慮其他人的答案,再交由領導決定,形成了一個微妙的相互作用。

雖然電子遊戲一般都是AI研究的其中一個熱門實驗地方,但由於食鬼缺乏多變性,所以一般都被人員忽視。但對人類來說,迄今最高分的紀錄為266,330分,比達到滿分有一大段距離。

通關影片可到這觀看:

資料來源:Microsoft


Share to Facebook