-
陳經(jīng):人類智能堡壘圍棋突然被谷歌智能攻破了,靠的是策略判斷和暴力搜索兩手都硬
關(guān)鍵字: 谷歌人工智能職業(yè)二段圍棋圍棋AI人工智能AlphaGoAlphaGo電腦圍棋樊麾從人工智能技術(shù)發(fā)展上看,DeepMind使用了“深度學習”技術(shù),而非象俞斌估計的和職業(yè)高手合作。電腦通過海量學習人類高手的棋譜,用深度神經(jīng)網(wǎng)絡快速模擬出人的招法,下出來的棋就很象人了。樊麾二段說:“如果沒人告訴我,我會想對手下得有一點怪,但肯定是個很強的棋手,一個真正的人”。
樊麾二段
Facebook的圍棋人工智能程序Darkforest就是用這種辦法,不靠搜索,只用深度學習這一招就很快達到了之前研究者多年無法實現(xiàn)的棋力,扎克伯格1月27號正好發(fā)文介紹了這個進展。由于棋力還略低于Zen、Crazystone,所以不算是巨大的突破。
而DeepMind小組在搜索技術(shù)上取得了更大突破。跟Darkforest相似,AlphaGo用一個深度神經(jīng)網(wǎng)絡(policy network,“策略網(wǎng)絡”)減少搜索的選點,象人類高手一樣,只考慮少數(shù)幾個可能的選點。此外,他們還建立了另一個深度神經(jīng)網(wǎng)絡(value network,“值網(wǎng)絡”),象人類高手一樣,思考到某個局面就有了結(jié)論,不必象之前的蒙特卡洛模擬那樣下到終局,極大地減小了搜索的深度。
DeepMind引入的另一個逆天的高招是,讓圍棋人工智能自己和自己下,總結(jié)經(jīng)驗,自我不斷提高!這個技術(shù)2015年2月就在Nature上發(fā)表了,標題是《玩游戲的軟件從神經(jīng)科學中吸取經(jīng)驗》(Game-playing software holds lessons for neuroscience)。
這個人工智能自學習的要點是,不需要告訴電腦人類的經(jīng)驗,就讓它自己玩這些電腦游戲,只是給出玩的分數(shù)。電腦看著分數(shù)不斷糾正自己的策略,最后就發(fā)展出比人類還強的電游技術(shù)。這次的AlphaGo也用了這個技術(shù),這又是比其它電腦圍棋程序強的地方。從Nature的文章看,DeepMind的絕招是,用50臺電腦讓AlphaGo不斷和自己對弈,下了3000萬盤棋!然后每盤棋選取一個局面(不多選,以避免同一盤棋中不同局面之間的相關(guān)性),根據(jù)這盤棋的最終結(jié)果判斷局勢優(yōu)劣。這樣獲得了3000萬個訓練數(shù)據(jù),用于訓練生成“值網(wǎng)絡”。暴力生成這么多數(shù)據(jù)需要海量的計算資源和投入,確實只有谷歌這樣的大公司敢想敢做。可以看出他們的戰(zhàn)略是智能和蠻力兩手抓,兩手都要硬,哪個合適就用哪個,并且互相幫助。
通過這樣三招,DeepMind小組確實在圍棋人工智能上取得了巨大突破。而且研究方法的潛力很大,從這個方向上走,最終象“更深的藍”一樣戰(zhàn)勝人類最高手是完全可以想象的。一個月前,DeepMind小組就報告說圍棋人工智能取得了巨大突破,會戰(zhàn)勝人類,但當時棋迷與職業(yè)棋手并未留意。現(xiàn)在有了棋譜,又有了技術(shù)細節(jié),就顯得可信多了。
職業(yè)棋手李喆在微博上說:
“Google的圍棋AI已具有職業(yè)水準。從棋譜初步判斷是頂尖棋手讓先-讓先倒貼的水平,離戰(zhàn)勝人類還有一小段距離。但這是三個月前的棋譜...以Google機器學習堆數(shù)據(jù)的速度,今年三月對決李世石相當值得期待。”
如果象報道的那樣,2016年三月AlphaGo真的挑戰(zhàn)韓國棋手李世石(過去十年獲得世界冠軍最多的棋手),這說明Google對AlphaGo非常有信心,認為三個月的時間就能進步到戰(zhàn)勝頂尖高手了。DeepMind小組認為,電腦圍棋的優(yōu)勢在于一天可以下100萬盤棋,而且一直保持水平穩(wěn)定,而人類能下的棋和能打的棋譜很有限,時間長了還會疲勞出錯。
圍棋世界冠軍李世石九段
我認為這次電腦是真的有可能在圍棋上戰(zhàn)勝人類。樊麾在非正式對局中兩次中盤勝AlphaGo,可見AlphaGo也是會認輸?shù)模皇怯肋h纏斗到終局,而且樊麾是有擊敗AlphaGo的棋力的,在正式比賽中可能是太緊張技術(shù)變形了。如果李世石象樊麾二段一樣心態(tài)失衡露出大破綻,肯定會被電腦抓住輸?shù)簟<词剐⌒膽叮娔X也會有勝機。即使只贏李世石一盤,也是了不起的成就。最終,電腦以穩(wěn)定的概率戰(zhàn)勝職業(yè)棋手將在一二年內(nèi)實現(xiàn)。
這無疑是人工智能領(lǐng)域的巨大突破,預示著機器將在棋類這項“智力運動”上徹底戰(zhàn)勝人類。圍棋這個人類自以為還能堅固防守五十年以上的堡壘,在引發(fā)了人工智能研究領(lǐng)域的巨大興趣后,被機器出人意料地迅速突破了。
當然正如深度學習技術(shù)的發(fā)明人、DeepMind小組的Hassabis所言,人工智能真正的挑戰(zhàn)是“泛化”的能力。人工智能在圍棋上達到的超高能力,并不能轉(zhuǎn)移到其它任務上去。
Demis Hassabis,深度學習技術(shù)發(fā)明人,Google DeepMind 的CEO,AlphaGo的20位作者之一
但是從目前達到的成就來看,人工智能帶來的社會革命也許真的快來了。對于人工智能“奇點革命”有興趣的可以參考:
對于我個人,會象許多業(yè)余棋迷一樣,非常希望Google能把AlphaGo商業(yè)化推向市場。這會是圍棋學習的一個革命:隨時隨地有最高等級的選手教你下棋。所以,暫時歡呼吧!
致謝:感謝風云學會會長袁嵐峰博士(@中科大胡不歸 )的寶貴意見。
本文系觀察者網(wǎng)獨家稿件,文章內(nèi)容純屬作者個人觀點,不代表平臺觀點,未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
-
本文僅代表作者個人觀點。
- 請支持獨立網(wǎng)站,轉(zhuǎn)發(fā)請注明本文鏈接:
- 責任編輯:李楚悅
-
外媒緊盯:中方又要出手? 評論 18馬上走人了,還要對中國無人機動手 評論 97促消費為什么沒有起色?這與搞創(chuàng)新不矛盾 評論 17515死!新年首日,“恐襲”疑云籠罩美國 評論 174最新聞 Hot
-
外媒緊盯:中方又要出手?
-
拜登給前共和黨眾議員切尼授勛,還打算提前赦免她
-
FBI改口:嫌犯是單獨行動
-
時隔40年,美國遺留的毒垃圾終于處理了
-
沙特處決6名伊朗人,伊方:不可接受!
-
馬上走人了,還要對中國無人機動手
-
馬斯克:拜登,100%叛國
-
“美歐經(jīng)濟學家們集體搖頭”
-
“流入中國的主權(quán)基金激增21%”
-
中國首次實現(xiàn)!“領(lǐng)先馬斯克的星鏈”
-
“我倆聊吧,氣瘋他們”
-
以防長放話:如果哈馬斯不放人,加沙將遭到久違的猛烈打擊
-
《經(jīng)濟學人》“勉強”承認:中國量子發(fā)展模式“也許”更好
-
15死!新年首日,“恐襲”疑云籠罩美國
-
“美國農(nóng)民買中國貨,原因很簡單”
-
美國首席大法官:那誰試圖恐嚇法官
-