超国产人碰人摸人爱视频,国产精品天天看特色大片,国产18禁无遮挡免费看

APP下載

掃一掃

下載觀察者APP

陳經(jīng)：人類智能堡壘圍棋突然被谷歌智能攻破了，靠的是策略判斷和暴力搜索兩手都硬
- 陳經(jīng)風云學會會員，《中國的官辦經(jīng)濟》
分享到：

2016-01-28 16:16:25 字號：A- A A+ 來源：觀察者網(wǎng)

關(guān)鍵字: 谷歌人工智能職業(yè)二段圍棋圍棋AI人工智能AlphaGoAlphaGo電腦圍棋樊麾

從人工智能技術(shù)發(fā)展上看，DeepMind使用了“深度學習”技術(shù)，而非象俞斌估計的和職業(yè)高手合作。電腦通過海量學習人類高手的棋譜，用深度神經(jīng)網(wǎng)絡快速模擬出人的招法，下出來的棋就很象人了。樊麾二段說：“如果沒人告訴我，我會想對手下得有一點怪，但肯定是個很強的棋手，一個真正的人”。

樊麾二段

Facebook的圍棋人工智能程序Darkforest就是用這種辦法，不靠搜索，只用深度學習這一招就很快達到了之前研究者多年無法實現(xiàn)的棋力，扎克伯格1月27號正好發(fā)文介紹了這個進展。由于棋力還略低于Zen、Crazystone，所以不算是巨大的突破。

而DeepMind小組在搜索技術(shù)上取得了更大突破。跟Darkforest相似，AlphaGo用一個深度神經(jīng)網(wǎng)絡（policy network，“策略網(wǎng)絡”）減少搜索的選點，象人類高手一樣，只考慮少數(shù)幾個可能的選點。此外，他們還建立了另一個深度神經(jīng)網(wǎng)絡（value network，“值網(wǎng)絡”），象人類高手一樣，思考到某個局面就有了結(jié)論，不必象之前的蒙特卡洛模擬那樣下到終局，極大地減小了搜索的深度。

DeepMind引入的另一個逆天的高招是，讓圍棋人工智能自己和自己下，總結(jié)經(jīng)驗，自我不斷提高！這個技術(shù)2015年2月就在Nature上發(fā)表了，標題是《玩游戲的軟件從神經(jīng)科學中吸取經(jīng)驗》（Game-playing software holds lessons for neuroscience）。

這個人工智能自學習的要點是，不需要告訴電腦人類的經(jīng)驗，就讓它自己玩這些電腦游戲，只是給出玩的分數(shù)。電腦看著分數(shù)不斷糾正自己的策略，最后就發(fā)展出比人類還強的電游技術(shù)。這次的AlphaGo也用了這個技術(shù)，這又是比其它電腦圍棋程序強的地方。從Nature的文章看，DeepMind的絕招是，用50臺電腦讓AlphaGo不斷和自己對弈，下了3000萬盤棋！然后每盤棋選取一個局面（不多選，以避免同一盤棋中不同局面之間的相關(guān)性），根據(jù)這盤棋的最終結(jié)果判斷局勢優(yōu)劣。這樣獲得了3000萬個訓練數(shù)據(jù)，用于訓練生成“值網(wǎng)絡”。暴力生成這么多數(shù)據(jù)需要海量的計算資源和投入，確實只有谷歌這樣的大公司敢想敢做。可以看出他們的戰(zhàn)略是智能和蠻力兩手抓，兩手都要硬，哪個合適就用哪個，并且互相幫助。

通過這樣三招，DeepMind小組確實在圍棋人工智能上取得了巨大突破。而且研究方法的潛力很大，從這個方向上走，最終象“更深的藍”一樣戰(zhàn)勝人類最高手是完全可以想象的。一個月前，DeepMind小組就報告說圍棋人工智能取得了巨大突破，會戰(zhàn)勝人類，但當時棋迷與職業(yè)棋手并未留意。現(xiàn)在有了棋譜，又有了技術(shù)細節(jié)，就顯得可信多了。

職業(yè)棋手李喆在微博上說：

“Google的圍棋AI已具有職業(yè)水準。從棋譜初步判斷是頂尖棋手讓先-讓先倒貼的水平，離戰(zhàn)勝人類還有一小段距離。但這是三個月前的棋譜...以Google機器學習堆數(shù)據(jù)的速度，今年三月對決李世石相當值得期待。”

如果象報道的那樣，2016年三月AlphaGo真的挑戰(zhàn)韓國棋手李世石（過去十年獲得世界冠軍最多的棋手），這說明Google對AlphaGo非常有信心，認為三個月的時間就能進步到戰(zhàn)勝頂尖高手了。DeepMind小組認為，電腦圍棋的優(yōu)勢在于一天可以下100萬盤棋，而且一直保持水平穩(wěn)定，而人類能下的棋和能打的棋譜很有限，時間長了還會疲勞出錯。

圍棋世界冠軍李世石九段

我認為這次電腦是真的有可能在圍棋上戰(zhàn)勝人類。樊麾在非正式對局中兩次中盤勝AlphaGo，可見AlphaGo也是會認輸?shù)模皇怯肋h纏斗到終局，而且樊麾是有擊敗AlphaGo的棋力的，在正式比賽中可能是太緊張技術(shù)變形了。如果李世石象樊麾二段一樣心態(tài)失衡露出大破綻，肯定會被電腦抓住輸?shù)簟＜词剐⌒膽叮娔X也會有勝機。即使只贏李世石一盤，也是了不起的成就。最終，電腦以穩(wěn)定的概率戰(zhàn)勝職業(yè)棋手將在一二年內(nèi)實現(xiàn)。

這無疑是人工智能領(lǐng)域的巨大突破，預示著機器將在棋類這項“智力運動”上徹底戰(zhàn)勝人類。圍棋這個人類自以為還能堅固防守五十年以上的堡壘，在引發(fā)了人工智能研究領(lǐng)域的巨大興趣后，被機器出人意料地迅速突破了。

當然正如深度學習技術(shù)的發(fā)明人、DeepMind小組的Hassabis所言，人工智能真正的挑戰(zhàn)是“泛化”的能力。人工智能在圍棋上達到的超高能力，并不能轉(zhuǎn)移到其它任務上去。

Demis Hassabis，深度學習技術(shù)發(fā)明人，Google DeepMind 的CEO，AlphaGo的20位作者之一

但是從目前達到的成就來看，人工智能帶來的社會革命也許真的快來了。對于人工智能“奇點革命”有興趣的可以參考：

人工智能革命：通向超級智能之路人類永生或滅絕

對于我個人，會象許多業(yè)余棋迷一樣，非常希望Google能把AlphaGo商業(yè)化推向市場。這會是圍棋學習的一個革命：隨時隨地有最高等級的選手教你下棋。所以，暫時歡呼吧！

致謝：感謝風云學會會長袁嵐峰博士（@中科大胡不歸）的寶貴意見。

本文系觀察者網(wǎng)獨家稿件，文章內(nèi)容純屬作者個人觀點，不代表平臺觀點，未經(jīng)授權(quán)，不得轉(zhuǎn)載，否則將追究法律責任。關(guān)注觀察者網(wǎng)微信guanchacn，每日閱讀趣味文章。

首頁上一頁 1 2 余下全文
標簽圍棋人工智能算法 nature
- 請支持獨立網(wǎng)站，轉(zhuǎn)發(fā)請注明本文鏈接：
- 責任編輯:李楚悅
搜索

   觀察者頭條查看全部

外媒緊盯：中方又要出手？評論 18

馬上走人了，還要對中國無人機動手評論 97

促消費為什么沒有起色？這與搞創(chuàng)新不矛盾評論 175

中國首次實現(xiàn)！“領(lǐng)先馬斯克的星鏈” 評論 292

15死！新年首日，“恐襲”疑云籠罩美國評論 174

   風聞 · 24小時最熱查看全部

   最新視頻查看全部
最新聞 Hot
快訊

久久久久精品免费福利电影,国产又黄又大又粗视频,A级毛片免费播放无码,人人妻人人爽人人澡欧美一区

陳經(jīng)：人類智能堡壘圍棋突然被谷歌智能攻破了，靠的是策略判斷和暴力搜索兩手都硬

外媒緊盯：中方又要出手？

拜登給前共和黨眾議員切尼授勛，還打算提前赦免她

FBI改口：嫌犯是單獨行動

時隔40年，美國遺留的毒垃圾終于處理了

沙特處決6名伊朗人，伊方：不可接受！

馬上走人了，還要對中國無人機動手

馬斯克：拜登，100%叛國

“美歐經(jīng)濟學家們集體搖頭”

“流入中國的主權(quán)基金激增21%”

中國首次實現(xiàn)！“領(lǐng)先馬斯克的星鏈”

“我倆聊吧，氣瘋他們”

以防長放話：如果哈馬斯不放人，加沙將遭到久違的猛烈打擊

《經(jīng)濟學人》“勉強”承認：中國量子發(fā)展模式“也許”更好

15死！新年首日，“恐襲”疑云籠罩美國

“美國農(nóng)民買中國貨，原因很簡單”

美國首席大法官：那誰試圖恐嚇法官