-
陳經(jīng):被圍棋AI橫掃后,職業(yè)棋手應(yīng)該如何提高水平?
關(guān)鍵字: 圍棋AI柯潔MasterAlphaGo谷歌人工智能價值網(wǎng)絡(luò)算法AI殺手锏:價值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)
人類高手下圍棋的過程和機器下棋的手段是可以參照的。對于當前局面,人類先直覺產(chǎn)生一些候選點,這對應(yīng)現(xiàn)在所有高水平圍棋AI都采用的深度學(xué)習(xí)出來的“策略網(wǎng)絡(luò)”。機器學(xué)習(xí)生成策略網(wǎng)絡(luò)時,參考的就是人類高手的棋局,也有說法是AlphaGo從零開始不參考人類棋局,全部自我強化學(xué)習(xí)生成策略網(wǎng)絡(luò)的。這次Master的招數(shù)絕大多數(shù)都是在人類的候選點范圍內(nèi)的,可以認為高手和Master的勝負不在于候選點的質(zhì)量。
人類高手會利用有限的思考時間對不多一些選點進行幾步推演,如果必走的直線著數(shù)多,有時能推到幾十手以后。然后高手們會進行判斷,如這個局面“簡明”,就是自己優(yōu)勢可以接受,就這么下了,再狠些能給對手更狠打擊的也不去想了。再如判斷局面“復(fù)雜”看不清,李昌鎬會非常獨特地盡量避免這種局面,尋找雖然優(yōu)勢小但是自己能控制的處理辦法。也有一些高手會主動將棋局導(dǎo)入復(fù)雜局面,發(fā)揮自己亂戰(zhàn)的長處。
幫助進行局面的判斷的主要手段是“數(shù)目”,能確定的地算清楚,李昌鎬的貢獻就是將數(shù)目判斷精細化的程度推到了極致,當然現(xiàn)在的高手這方面的水平也上來了。數(shù)完目以后,算上貼目后雙方會有目數(shù)差距,如果在收官階段差距稍大到兩三目以上,結(jié)論一般就確定了,勝負已定收拾心情。在布局以及中盤,就要用厚勢、弱棋負擔之類的來回調(diào)整一下,粗粗的給個結(jié)論。
這種結(jié)論往往很不精確,不同的棋手判斷可能不同,有的喜歡實地,風(fēng)格是“敏于實地”,或者喜歡外勢,風(fēng)格是“厚實攻擊”。高手們有時沒法判斷了或者想講清楚道理,還喜歡用日本道策發(fā)明的“手割”法,從公認有結(jié)論的局面為基礎(chǔ),改變著手次序倒推,有點數(shù)學(xué)公理系統(tǒng)的意思。總之,在局面還有很多未確定因素的時候,人類進行判斷的手段就是這些,并不太多。
這種情況下,人類高手們討論局面判斷的時候有時顯得很搞笑的。如果一個局面,下A和下B結(jié)果是確定的“下A會比下B虧1目”,那所有高手都會認為A是錯招不成立。有時甚至?xí)榱诉@一目“不能忍受”的虧損進行復(fù)雜的大轉(zhuǎn)換,或者否定一個定式。
人類高手對于有確定結(jié)論的東西是非常在意的。這也是多數(shù)業(yè)余棋手糊里糊涂的地方,下B可以下A好象也行憑感覺來吧,幾下就虧掉很多目。但是如果這時有另外一個選擇C,沒有辦法相對AB給出確定結(jié)論,那高手們就會作出“兩分”、“雙方可下”、“得失不明”、“下C不好控制還是下B”,“下C照顧大局”之類的模糊結(jié)論。但是實際上可能下C比下B要好得多,如果選擇B虧的就不是1目了,可能是好幾目。
上圖是以前的一個常見小目定式,高手們下過無數(shù)盤。但是后來沒有人下了!因為實際上這個圖黑棋虧大了。雙方手數(shù)一樣,黑還先占角的,但是子力位置偏低,地和勢都不見得有優(yōu)勢,沒有體現(xiàn)“先招優(yōu)勢”。現(xiàn)在是這么解釋,但是之前為什么一直下?因為理由也并不是那么明顯。孟泰齡說,是高手們經(jīng)過多次實戰(zhàn),發(fā)現(xiàn)執(zhí)黑一方勝率明顯偏低,回頭找問題,這才放棄了這個定式。
這種“集體實戰(zhàn)”判斷,是網(wǎng)絡(luò)圍棋時代高手們開發(fā)出的新辦法。說不清,大家就實戰(zhàn)來試試,你說兩分,我說黑優(yōu),水平相當?shù)碾p方實戰(zhàn)100盤如果黑勝了70盤明顯占優(yōu),大家還是會同意“黑優(yōu)”的結(jié)論。以前沒有網(wǎng)絡(luò),職業(yè)棋手一年才下幾十盤棋,互相交流也少,這種方法就不可行了,往往是個人面壁式的細心體會局面優(yōu)劣。現(xiàn)在網(wǎng)絡(luò)時代,勤奮的職業(yè)棋手一年下上千盤網(wǎng)棋都有可能,這種方法不僅可能,甚至發(fā)生了有趣的演變。
高手們?yōu)榱司S持狀態(tài),就積極地在網(wǎng)站上下20秒30秒的快棋。這樣的結(jié)果是,高手們開發(fā)演變出了一些大型“套路”。這是因為,如果你偏離套路,一般會吃虧,會通過輸棋或者直接講理判斷證明。于是大家都擺套路,提高熟練程度。
偶而會有高手出“新手”取得效果,于是其它高手們研究試用以后,給出相應(yīng)的應(yīng)對,否定這個新手,豐富了套路的內(nèi)涵。或者同意這個新手成立,形成新的套路,回頭否定老的套路。這樣來回否定,對套路的理解確實深了,也可以算是棋藝的進步。但是網(wǎng)棋以及正式對局,就出現(xiàn)了大型套路太多,降低棋局精彩程度的問題,有時甚至“復(fù)盤”到四五十手才變招,圍棋有“象棋化”的趨勢。
當然這些套路是有內(nèi)涵的。一般認為日本棋手水平相對中韓下降,是因為日本棋手戰(zhàn)斗力不行,布局看著還行,中盤就被殺得不行了。孟泰齡戰(zhàn)斗力與算路與年青棋手比相對差,但是布局分析卻較有信心,經(jīng)常戰(zhàn)勝算路好的對手,在中國等級分能排20多位。他認為日本棋手恰恰是布局水平有問題,對局面的理解落后了。因為中韓棋手積極在網(wǎng)絡(luò)上對戰(zhàn),或者在國家隊里交流最新“套路”內(nèi)涵成果,所以其實掌握了很多先進知識。
日本棋手還是老套路,也不注意這些最新成果,還是按老的理解走吃了虧也不知道,經(jīng)常就是“安樂死”。想要掙扎下出過分的招數(shù),戰(zhàn)斗力又不行,輸?shù)酶臁?
-
本文僅代表作者個人觀點。
- 請支持獨立網(wǎng)站,轉(zhuǎn)發(fā)請注明本文鏈接:
- 責任編輯:武守哲
-
“中國在非洲真正贏得了民心,就連斯威士蘭…” 評論 70“她下月訪華,盡管特朗普團隊表達了擔憂” 評論 53最新聞 Hot
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團是絕望之舉,中國工廠效率質(zhì)量都是第一”
-
“中國有能力讓夢想照進現(xiàn)實,將贏得史詩般競爭”
-
被災(zāi)民暴罵到當場破防,馬克龍發(fā)飆:你該慶幸你在法國!
-
美高校敦促國際學(xué)生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調(diào)”
-
澳大利亞來了,中國就得走人?澳總理這么回應(yīng)
-
美媒感慨:基建狂魔發(fā)力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報復(fù)來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-
還在扯皮中國,“涉華條款全刪了”
-
中國“光伏OPEC”發(fā)文嚴厲質(zhì)問央企,怎么回事?
-
“最后一道貿(mào)易障礙,中國解除了!”
-