-
陳經:被圍棋AI橫掃后,職業(yè)棋手應該如何提高水平?
關鍵字: 圍棋AI柯潔MasterAlphaGo谷歌人工智能價值網絡算法中韓高手們集體實戰(zhàn)驗證套路的辦法,其實暗合了AlphaGo強化學習生成價值網絡的方法。AlphaGo會進行幾千萬次的高質量“自我對局”,比高手們的對局加起來都多得多。人類高手們反復實戰(zhàn)能判斷幾十個局面都不容易,AlphaGo的訓練流水線卻能生成幾千萬個局面,用于價值網絡的訓練。
價值網絡是個和策略網絡結構相似的多層神經網絡,但是里面的系數不一樣,它能對一個靜態(tài)局面不搜索直接給出勝率,判斷誰占優(yōu)。有了策略網絡與價值網絡,AlphaGo不需要搜索都可以下得很好了,對每一招策略網絡提供的選點,價值網絡給出勝率判斷,選擇最好的一個選點下就可以了。2016年中Deepmind說AlphaGo棋力取得突破,就特別說了價值網絡取得了巨大的進步。
價值網絡是人類思考中沒有的,在谷歌論文之前甚至沒有這個概念。從學術角度來說,這可能是谷歌論文最大的貢獻,深度學習生成策略網略并非Deepmind最先提出的。雖然對人類來說有點不自然,但價值網絡正是人類可以學習的地方,職業(yè)高手們也許能從這個方向上取得棋力的突破,但需要科學的方法。
人類能通過多次實戰(zhàn)、打譜,在腦中形成直覺,看一眼局面就能根據棋形產生一些靠譜的候選點。對人類直覺方便之處在于,候選點有“局部性”,人只要看局部就能有“關鍵”點的直覺。有時一些照顧全局的棋招會被夸張地稱為“耳赤妙手”。人類自然傾向就是局部觀察,眼睛看畫面時自然會聚焦在一小塊地方,棋手思維也是如此。高手要逆著這個直覺觀察全局,多找一些候選點。范西屏是中國古代水平最高的棋手之一,李步青對其它人這樣形容他的棋藝:“君等于弈只一面,余尚有兩面,若西屏先生則四面受敵者也”,這是說范西屏全局觀念特別強。
但這種全局觀念畢竟難于描述,成了高手中只可意會不可言傳的“大局觀”。人類對局部的精確描述卻不斷取得進展,局部定式發(fā)展出成千上萬個,甚至有《定式大全》這樣的書。局部數目的手段與技術也不斷發(fā)展,目數價值精確到幾分之一。大局觀方面卻一直沒有太大的進展。甚至一些90后年青高手認為,布局不要太看重,花時間想也想不出什么東西,隨便搞搞套路或者下一些過得去的著手應付下,大量時間要留在中后盤決戰(zhàn)。
從實戰(zhàn)來說,這也確實是勝率較高的選擇,你脫離套路未必占優(yōu),就算花大量時間琢磨布局選點便宜了兩三目,后面時間不夠了隨時崩盤,因為人家后面肯定會來“攪”。孟泰齡主要的獲勝方式,就是利用一些年青棋手忽視布局這個特點,他精心研究布局,多次在局面判斷中取得優(yōu)勢,后面拼了老命把優(yōu)勢守下來。但是由于年青高手們沖擊實在太厲害,往往頂不住,泰哥也無法取得戰(zhàn)績的突破,只能維持住一流高手的地位。
職業(yè)棋手面臨著訓練內容與方法的革命
職業(yè)棋手們水平取得突破,也和一些圍棋道場的嚴格軍事化訓練手段分不開。沖段小棋手們做海量的死活題,認真進行大量的對局,嚴謹計算的態(tài)度與人腦中“策略網絡”的質量都不錯。死活題有上千年的歷史積累,多年的實戰(zhàn)提供了大量素材,還有不少高手喜歡創(chuàng)作死活題。日本的《發(fā)陽論》吸收了中國古代棋書中不少素材,韓國《天龍圖》是實戰(zhàn)積累。死活題素材不缺,有道場、有網絡,高水平實戰(zhàn)鍛煉的機會不缺,套路相關的信息流傳也快,職業(yè)棋手群體水平迅速進步。
但是,各道場并沒有多少“局面判斷”的題目積累,這是一個非常嚴重的技術性缺失。如果棋手群體有意識地在這方面努力,是有辦法可想的。可以集體討論一些局面,取得一致,拿出來做為習題或者“訓練樣本”。也可以在網絡上組織實戰(zhàn),主動對一些局面統(tǒng)計勝率,獲得寶貴的數據,達成一致。可以積累大量網站與實戰(zhàn)高水平棋譜,對一些同類開局進行大數據分析。這樣的分析程序已經有了,但主要是正式比賽棋譜不夠多,如果能和對弈網站聯手,增加海量棋譜,局面統(tǒng)計分析就更為精確。
現在有了高水平圍棋AI,就更為方便了。高水平圍棋AI,以后一定會普及。如果放開AI數據后門,就能看到局面的具體勝率,甚至價值網絡對局面的估值。甚至也可以把訓練好的價值網絡單獨抽出來做成小程序幫助分析。這樣,應該可以象死活題一樣積累出海量的局面判斷素材。和以前不一樣的是,這些局面判斷題有參考答案,或更為權威的答案,并不僅僅是思考題。
職業(yè)棋手們可以去盯著這些局面判斷題,進行全局思考。為什么這些局面是黑優(yōu)不是白優(yōu)?為什么和自己的感覺相反?為什么AI或者統(tǒng)計結論明顯,自己卻沒有感覺?這樣仔細琢磨,一定會想出一些道理。琢磨久了,甚至作出判斷的速度都會加快。AI的策略網絡和價值網絡的神經網絡是相似的,人類既然能夠有“策略網絡”的直覺系統(tǒng),同樣在人腦中訓練出“價值網絡”應該是可行的。
從人類等級分最高的柯潔的棋藝來看,他可能就有這樣的特點。柯潔的算路并不是最深的,數目也不是最強,也不是妙手一堆,當然這些都不弱。柯潔自稱最強的是判斷,有時直接判斷不用數目就知道是虧了還是賺了,是通過4000多盤網棋成長起來的。很可能柯潔在數千盤對戰(zhàn)中不自覺地注意了對腦中“價值網絡”的訓練,形成了自己領先其余高手的局面判斷能力。這些棋手與棋迷認為,柯潔是下得最象AI的棋手。
職業(yè)棋手群體可以把這個過程工程化,主動收集有教育意義的反直覺局面,棋手們主動接受類似機器學習的“人腦學習”訓練,形成直覺一樣的局面判斷能力。在高水平AI的幫助下,這個過程應該可以迅速縮短,不用非常辛苦地積累素材。對各個道場的培訓水平而言,局面判斷素材以及使用AI幫助訓練的能力,會成為重要因素。國際象棋AI早就這樣幫助人類棋手訓練了。
這種局面判斷,天生就是全局的。這將使人類高手的圍棋思維,從之前的局部定式、局部數目、局部戰(zhàn)斗,飛躍進步到全局判斷、全局戰(zhàn)斗,這將是吳清源大師窮畢生之力思索并力推的“21世紀圍棋”、“六合圍棋”時代。吳清源2014年去世了,沒有看到圍棋AI的革命性進展。但是在圍棋AI的幫助下,這個時代將不可避免的到來,人類高手圍棋水平將再次取得突破性進展。
而對于Master這樣的圍棋AI,也不要過于恐懼。它的秘密武器就是以價值網絡為基礎的全局思維,新手不斷,明快取舍。AI的價值網絡是基于全局的,所以全局配置稍有不同,它的著手就會發(fā)生變化,遠遠的幾個散子人類看不到什么,AI卻能考慮到下出新手。
人類高手30秒計算時間過短,碰到的又是完全不同的棋路需要計算,自然容易出錯被狠狠打擊。甚至有些著手,人類高手們“不知道AI是什么意思”,過了一些招數才發(fā)現吃大虧了。有些上陣的高手甚至由于恐懼,對自己失去信心,明顯技術變形,早早就大敗了。
人類由于生理條件的限制,需要更多的思考時間。從探索圍棋技藝的角度,要求更多思考時間是合理的。如果在布局與中盤戰(zhàn)斗中領先或者頂住了,收官時因時間緊張出小錯敗北,這并不可怕。但是人類必須在布局方向選擇、接觸戰(zhàn)的局面判斷中更多地引入全局思維,接近AI的水平,才有機會頂住。
AI由于MCTS算法天生的弱點,很大可能仍然是有缺陷的,太復雜的局面會出現算路問題,或者局部死活出現漏算,而這是人類的優(yōu)勢。人類的語言邏輯推理能力,局部嚴密算路是有優(yōu)勢的!對于復雜局面,人類可以總結歸納主要矛盾,設計出組合手段,推理出可行次序。而AI由于MCTS的框架特性,什么都要算到終局,不可能什么都模擬到,大量算力浪費在非關鍵的邏輯里,發(fā)生漏算是可能的。當然前提是人類高手需要頂住,不能讓AI隨便就領先10幾20目,那AI可以簡明地控制局面,對手毫無機會。
如果人類高手能夠學習價值網絡的全局思維主動訓練,取得棋藝的飛躍進步,再給以足夠的思考時間,和AlphaGo以及其它水平不斷進步的高水平AI對戰(zhàn)還是有勝機的,而這對圍棋發(fā)展的意義極為重大。Deepmind開發(fā)出AlphaGo這樣的革命性圍棋程序,將確定無疑地引領圍棋藝術再一次的飛躍進步,人類棋手也會獲益非淺。
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平臺觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閱讀趣味文章。
-
本文僅代表作者個人觀點。
- 請支持獨立網站,轉發(fā)請注明本文鏈接:
- 責任編輯:武守哲
-
“中國在非洲真正贏得了民心,就連斯威士蘭…” 評論 70“日企抱團是絕望之舉,中國工廠效率質量都是第一” 評論 113“她下月訪華,盡管特朗普團隊表達了擔憂” 評論 53“中國有能力讓夢想照進現實,將贏得史詩般競爭” 評論 120最新聞 Hot
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團是絕望之舉,中國工廠效率質量都是第一”
-
“中國有能力讓夢想照進現實,將贏得史詩般競爭”
-
被災民暴罵到當場破防,馬克龍發(fā)飆:你該慶幸你在法國!
-
美高校敦促國際學生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調”
-
澳大利亞來了,中國就得走人?澳總理這么回應
-
美媒感慨:基建狂魔發(fā)力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報復來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-
還在扯皮中國,“涉華條款全刪了”
-
中國“光伏OPEC”發(fā)文嚴厲質問央企,怎么回事?
-
“最后一道貿易障礙,中國解除了!”
-