打敗前輩 新版AlphaGo棋力飛漲
(中央社台北19日電)谷歌旗下公司打造的人工智慧軟體AlphaGo在學習人類經驗後橫掃圍棋高手,據報導,新一代AlphaGo似乎更讓人驚訝,能在無任何人類經驗情況下迅速自學,並以100比零的戰績擊敗「前輩」。
上海澎湃新聞報導,谷歌(Google)旗下DeepMind 公司打造的AlphaGo是在大量學習人類棋譜後才慢慢「封神」,但這一認知目前也被改寫。
據報導,Deepmind在最近一期國際學術期刊「自然」(Nature)發表研究論文說,新一代AlphaGo Zero從空白狀態學起,在無任何人類輸入的條件下,能迅速自學圍棋,並以100比零的戰績擊敗「前輩」。
報導引述專家說,「拋棄人類經驗」和「自我訓練」並非AlphaGo Zero的最大亮點,關鍵在於採用了新的強化學習算法(reinforcement learning),並帶來了新的發展。
論文指出,在數百萬局自我對弈及訓練後,AlphaGo Zero獨立發現了人類花費數千年才總結出的圍棋規則,還建立了新戰略,為這個古老的遊戲帶來新見解。
世界頂尖棋手的養成,動輒需要數十年的訓練、磨礪,但論文透露,AlphaGo Zero創造了一個紀錄:3天。
上海紐約大學電腦科學教授張崢表示,從算法來說,AlphaGo Zero比它的「前輩」更簡潔、漂亮。AlphaGo Zero擺脫了人為的大數據,在人類所定的規則下,自主發現新知識,並糾正人類的錯誤知識,並以驚人速度達到這一點。
張崢說:「有趣的是,AlphaGo Zero卻無法解釋(它是如何完成這一切),只能demo(樣本)給人類。」
上海復旦大學電腦科學技術學院教授危輝將圍棋盤面上各種變化比作星辰,透過人類智力、直覺,人類可能已經觸及其中百萬分之一的情況,AlphaGo Zero則可能觸及了其中百萬分之5,「比人類多,但肯定沒有窮盡。」
AlphaGo Zero的前一代AlphaGo Lee在參考大量人類棋譜並自我對弈約3000萬盤、訓練數月後,於2016年3年月以4比1的戰績擊敗南韓九段棋手李世石,引發關注。1061019
本網站之文字、圖片及影音,非經授權,不得轉載、公開播送或公開傳輸及利用。