? ? ?谷歌圍棋人工智能AlphaGo今天與韓國棋手李世石的人機圍棋大戰(zhàn)塵埃落定,AlphaGo拿下最后一場,將總比分定格在4:1。雙方聯(lián)手為世人貢獻了五場精彩絕倫的圍棋比賽,比賽結(jié)束了,而相關(guān)的話題討論才剛剛進入高潮。
關(guān)注
其實人們最關(guān)注的話題集中在以AlphaGo代表的人工智能是否會取代人類上,AlphaGo之父、DeepMind聯(lián)合創(chuàng)始人德米斯·哈薩比斯表示,圍棋是一種"完全信息博弈",比賽雙方所有信息都呈現(xiàn)在棋盤上。而例如撲克和電腦游戲等由多人參與的對戰(zhàn)游戲是"不完全信息博弈",計算機無法獲知所有信息,目前這些領(lǐng)域?qū)θ斯ぶ悄軄碚f還存在困難。另外,對DeepMind來說,他們研發(fā)AlphaGo的最終目標指向為智能手機助手、醫(yī)療健康和機器人,只是目前先在圍棋領(lǐng)域測試系統(tǒng),達到檢測其學(xué)習(xí)能力算法的目的。所以大可不必過于驚慌,將此番圍棋較量上升至保衛(wèi)"人類智慧最后一塊高地"的地步。
哈薩比斯稱,人工智能的下一步目標是讓計算機自己學(xué)棋。也就是說,下個版本的AlphaGo將從零開始,不接受人類的灌輸?shù)奶囟ㄖR,做到真正的自主學(xué)習(xí)。
回顧:
人機大戰(zhàn)首局:李世石中盤認輸
北京時間3月9日,李世石執(zhí)黑先行,為打亂電腦布局采用新走法,AlphaGo應(yīng)對不佳,出現(xiàn)失誤。在中盤階段的勝負關(guān)鍵時期,AlphaGo下法變得強硬,雙方展開接觸戰(zhàn)。李世石圍住一塊大空,在大局上搶得先機。隨后李世石卻放出了非常業(yè)余的手法,瞬間使微弱的優(yōu)勢化為烏有,進入官子,AlphaGo根本不犯一點錯誤,著著精準,李世石算清后投子認輸。
人機大戰(zhàn)次局:李世石完敗
北京時間3月10日,?AlphaGo執(zhí)黑先行,李世石轉(zhuǎn)變行棋風(fēng)格,開局下得非常穩(wěn)健。AlphaGo也下出了不少新手,這讓李世石應(yīng)對得非常謹慎,黑37和41兩步尖沖令人匪夷所思,尤其是第41手,致目數(shù)大虧。中盤階段,本來形勢占優(yōu)的李世石行棋過緩,右上角的一步二路打拔被視作敗手,AlphaGo的優(yōu)勢逐漸清晰起來。在形勢陷入被動的情況下,李世石下出一手扳的好棋,但幾次轉(zhuǎn)換后,黑棋還是牢牢守住了領(lǐng)先的局面,而且棋形很厚。李世石無力改變,AlphaGo執(zhí)黑獲勝且優(yōu)勢明顯,總比分2-0領(lǐng)先。
人機大戰(zhàn)第三局:李世石破釜沉舟未果
北京時間3月12日,李世石執(zhí)黑先行,布局階段,李世石左下掛角后走高中國流。行不到二十手,李世石局面就落入下風(fēng)。隨后,雙方在左上角展開戰(zhàn)斗,AlphaGo對全局的把握一如既往地強大。李世石不但自己的模樣被對手輕松打入,AlphaGo還借助戰(zhàn)斗在下邊圍起一大塊空,局面看上去還不如前兩盤好看。隨后的比賽,雖然李世石仍然極力抵抗,并且祭出劫爭的手段,但是電腦精確應(yīng)對,讓他無功而返,只有投子認負。
人機大戰(zhàn)第四局:李世石祭出"神之一手"獲首勝
北京時間3月13日,李世石祭出白78"挖"妙手,?AlphaGo被李世石的"神之一手"下得陷入混亂,走出了黑93一步常理上的廢棋,導(dǎo)致棋盤右側(cè)一大片黑子"全死"。?此后,"阿爾法圍棋"判斷局面對自己不利,每步耗時明顯增長,更首次被李世石拖入讀秒。最終,李世石冷靜收官鎖定勝局。
人機大戰(zhàn)第五局:李世石執(zhí)黑280手認負
在上局比賽扳回一城后,李世石向AlphaGo團隊提出要在末戰(zhàn)中執(zhí)黑,因為他覺得AlphaGo執(zhí)黑時發(fā)揮并不完美,戰(zhàn)勝執(zhí)白的AlphaGo才更有意義。執(zhí)黑的李世石選擇了穩(wěn)健的錯小目、無憂角開局,AlphaGo則以二連星應(yīng)對。李世石和79和81手連出緩手,被視為敗招。AlphaGo82靠也并非好的應(yīng)手,一波錯進錯出后,黑棋在87和89手再出緩手,致使白棋左上角的圍剿更加有力,黑棋形勢瞬間坍塌。此后,占據(jù)優(yōu)勢的AlphaGo展現(xiàn)了它強大的中后盤計算能力,鮮有失誤,落子效率極高。不過李世石也并未放棄,連續(xù)走出強硬應(yīng)手,可惜棋盤下得越來越小,難再覓逆轉(zhuǎn)機會。第280手,李世石投子認負。
AlphaGo原理
在人機大戰(zhàn)開始前,職業(yè)棋手們幾乎一邊倒地傾向于李世石。就連這個性格執(zhí)拗、棋風(fēng)兇悍的韓國人也認為5比0不成問題,只是在開賽前了解到AlphaGo自我學(xué)習(xí)的原理后,才略有擔(dān)心。其實在科技界人士看來,代表人工智能頂尖水準的AlphaGo勝出同樣是大概率的事情。
傳統(tǒng)的人工智能方法是將所有可能的走法構(gòu)建成一棵搜索樹?,但這種方法對圍棋并不適用。AlphaGo則是將高級搜索樹與深度神經(jīng)網(wǎng)絡(luò)結(jié)合在一起,這些神經(jīng)網(wǎng)絡(luò)通過12個處理層傳遞對棋盤的描述,處理層則包含數(shù)百萬個類似于神經(jīng)的連接點。
其中一個神經(jīng)網(wǎng)絡(luò)"決策網(wǎng)絡(luò)"(policy?network)負責(zé)選擇下一步走法,另一個神經(jīng)網(wǎng)絡(luò)"值網(wǎng)絡(luò)"("value?network)則預(yù)測比賽勝利方。谷歌方面用人類圍棋高手的三千萬步圍棋走法訓(xùn)練神經(jīng)網(wǎng)絡(luò),與此同時,AlphaGo也自行研究新戰(zhàn)略,在它的神經(jīng)網(wǎng)絡(luò)之間運行了數(shù)千局圍棋,利用反復(fù)試驗調(diào)整連接點,這個流程也稱為鞏固學(xué)習(xí)(reinforcement?learning)。通過廣泛使用Google云平臺,完成了大量研究工作。
AlphaGo在與人的對弈中用了"兩個大腦"來解決問題:"決策網(wǎng)絡(luò)"和"值網(wǎng)絡(luò)"。通俗來說就是,一個大腦用來決策當(dāng)前應(yīng)該如何落子,另一個大腦來預(yù)測比賽最終的勝利方。
值得一提的是,李世石也是第一次與機器對戰(zhàn),所以他無法像和人類對戰(zhàn)那樣,先研究對方的棋譜和下棋風(fēng)格。李世石所能做的就是和自己對弈。AlphaGo也是通過這種方式鍛煉自己,真正做到了"人工智能"。
聲音:
"這是我的失敗,'阿爾法圍棋'很強大。但這不代表了人類棋手的失敗,更不代表圍棋的失敗。"–李世石九段
"棋道一百,我只知七。"–日本棋圣藤澤秀行九段
"AlphaGo就像是好萊塢影片《侏羅紀世界》里,人類暗中研究培育的那頭變異暴龍。"–上海知名圍棋教練夏勝浩
"職業(yè)棋手已經(jīng)接受競技角度上,AI超越人類的現(xiàn)實。但從思維方式上,AlphaGo會對棋手有更多幫助,局部方面的對抗,大局觀的把控。"–上海棋院副院長劉世振
"人機大戰(zhàn)的勝利者依舊是人類,人類制造了AlphaGo,這次比賽預(yù)估也將讓歐美的圍棋普及度增加5倍。"–韓國棋院院長洪錫炫
"世界上真正的挑戰(zhàn)不是'人類對機器',而是人類利用機器與那些全球性難題之間的對決。'阿爾法圍棋'對人工智能的發(fā)展和人類的發(fā)展都是積極的一步,今后它的水平還可能應(yīng)用到醫(yī)療等其他領(lǐng)域,更好地造福人類。"–谷歌CEO桑達-皮查
“這絕不是圍棋的終點,而是一個新的起點!我們正處在最好的時代,一個激動人心的科技發(fā)展的時代。人工智能、機器人、深度學(xué)習(xí)、VR虛擬現(xiàn)實這些將代表未來科技發(fā)展方向的事物我們都還在探索,云和數(shù)據(jù)現(xiàn)在正在主攻VR虛擬現(xiàn)實領(lǐng)域?!薄坪蛿?shù)據(jù)CEO郭凱
?
網(wǎng)友吐槽:
看了前三局本來想給孩子報個圍棋班呢,第四局看完,得,還是給送到云和學(xué)院學(xué)編程吧!–云和小編阿凡
我估摸著把李世石拆了,會發(fā)現(xiàn)有個阿爾法狗beta版本趴在里面–云和數(shù)據(jù)某程序員一
李世石連輸5局氣急敗壞地砸開電腦,發(fā)現(xiàn)柯潔趴在機箱里–云和數(shù)據(jù)某程序員二
啊~啊~啊~九段,你比八段多一段;啊~啊~啊~九段,你比十段少一段;終于有一天,阿法狗來挑戰(zhàn),連輸三盤怎么辦,只好拔插線板~要是再輸怎么辦,要么麻將來兩盤~–麻將哥哥
我腳得,大殺器是這樣的:下著下著,李世石從棋盤上拿起一粒棋子,"啪"的一聲拍在棋盤另一個位置,大喊一聲"將軍"?,然后,阿法狗就當(dāng)機了…–象棋弟弟
我去都3.15了啊,阿爾法狗的產(chǎn)品質(zhì)量問題有沒有人能關(guān)注下?–打假達人
"我叫李世石,我是一名來自韓國的棋手,今天早上出門前我在網(wǎng)上各大投注點用盡家財下了巨額賭注買我自己輸,我想,這就是人類比人工智能強的地方。"–某直播員
Copyright ? 2013-2021 河南云和數(shù)據(jù)信息技術(shù)有限公司 豫ICP備14003305號 ISP經(jīng)營許可證:豫B-20160281