
由英國倫敦Google DeepMind所開發的人工智慧圍棋程式AlphaGo,不僅擊敗頂尖職業棋士李世乭,也在今年五月擊敗中國棋王柯潔,而在沒有人類對手後,Deepmind 創辦人也宣布AlphaGo退役;不過DeepMind在圍棋上的探索尚未停止。
今年十月,AlphaGo的團隊推出以零自學的AlphaGo Zero,並以 100:0 擊敗了之前版本的 AlphaGo。而不到五十天,該團隊又再度發表論文,提出通用棋類人工智慧程式的AlphaZero。
去掉了「GO」
最新推出的AlphaZero拿掉了原先AlphaGo Zero的代表圍棋的「GO」,就是因為AlphaZero不僅圍棋下得比之前的版本都好,連國際象棋、日本將棋它也能下;而名字中的「Zero」則同樣代表從零自學。
從零開始進行強化學習
AlphaZero是AlphaGo Zero的通用進化版本,不僅保持了AlphaGo Zero利用深度網絡從零開始進行強化學習的特點,它也會過更新網路參數,減少網路估計比賽結果與實際結果間的誤差。
8小時擊敗第一代AlphaGo
AlphaZero在除了基本規則下從零開始訓練,驚人的是,AlphaZero不僅在4小時打敗國際象棋最強程序Stockfish,在8小時也擊敗了曾大勝南韓棋王李世乭的AlphaGo,此外,AlphaZero在訓練34小時後,也勝過了訓練72小時的AlphaGo Zero。
盼能利用在重大醫療問題
AlphaZero的出現代表著AI 技術不僅只能為玩遊戲而設定,根據《蘋果日報》報導,DeepMind希望最終能利用AlphaZero運算法解決重大醫療問題,他們相信,人們數百年都研究不出的疾病療法,該程式可能在數日或數周內研究出來。



留言評論