首頁>要論>銳評銳評

擊敗圍棋高手人工智能仍沒人類聰明

2016年02月15日 13:39 | 來源：解放日報

分享到：

近日，人工智能又一次成為媒體和公眾關(guān)注的焦點：谷歌旗下一家公司研制出的人工智能程序“阿爾法圍棋”（AlphaGo）在比賽中5:0完勝歐洲職業(yè)圍棋冠軍樊麾二段，在這種復(fù)雜度最高的棋類游戲上，人工智能顯示出有望超越人類頂尖高手的“智力”。今年3月，AlphaGo將挑戰(zhàn)世界冠軍李世石九段。 1997年，IBM開發(fā)的計算機程序“更深的藍”在六局棋比賽中，擊敗國際象棋棋王卡斯帕羅夫，成為載入史冊的人工智能突破。然而，圍棋的復(fù)雜度遠遠高于國際象棋，前者最多有10的約170次方種局面，后者的最多局面僅為10的約47次方種。近年來，人工智能有了什么發(fā)展，才有底氣與職業(yè)圍棋選手一較高下？它能否擊敗圍棋世界冠軍？如果擊敗，意味著什么？對于這些問題，專家給予了解答。

深度學習“消化” 2000萬局棋

復(fù)旦大學哲學學院教授、人工智能哲學專家徐英瑾介紹，傳統(tǒng)的計算機下棋程序的基本原理，是有限步數(shù)的搜索樹，即采用數(shù)學和邏輯推理方法，把每一種可能的路徑都走一遍，從中選出最優(yōu)解。顯然，這種下棋思考方法是人類無法做到的，發(fā)揮了計算機速度快、運算量大的優(yōu)勢。不過，這種“暴力算法”并不適用于圍棋。據(jù)計算，圍棋每回合有250種可能，一盤棋可長達150回合，所以圍棋最多有10的170次方種局面。即便對計算機而言，這個運算量也是相當大的。除了復(fù)雜度高，圍棋還有一大特點——黑白兩方棋的每個棋子是一樣的，沒有大小之分、角色之別。這給計算機程序的運算推理帶來了很大難度，因為從哲學上看，圍棋具有“語境敏感性”，不太適合邏輯推理；　而棋子各不相同的中國象棋、國際象棋具有“超語境性”，每個棋子角色明確，不因棋局的變化而改變，非常適合邏輯推理，這正是計算機的強項。近年來，不同于搜索樹的深度學習技術(shù)逐漸成熟，給圍棋程序的研發(fā)帶來了突破。深度學習源于人工神經(jīng)網(wǎng)絡(luò)，其模仿對象是人腦。研究表明，人腦由約10的11次方個神經(jīng)元構(gòu)成，神經(jīng)元細胞的外表有很多突起。其中，比較短的放射性突起叫“樹突”，外形似樹枝分叉，具有接受刺激并將沖動傳入細胞體的功能。而要把信息向其他神經(jīng)元輸送，就得依靠“軸突”。人工神經(jīng)網(wǎng)絡(luò)從信息處理角度對人腦神經(jīng)元網(wǎng)絡(luò)進行了抽象和模擬，建立運算模型。這種網(wǎng)絡(luò)由大量模擬神經(jīng)元的節(jié)點相互連接構(gòu)成，每個節(jié)點代表一種特定的輸出函數(shù)，稱為激勵函數(shù)。每兩個節(jié)點間的連接，都代表一個對于通過該連接信號的權(quán)重值，形成人工神經(jīng)網(wǎng)絡(luò)的記憶。網(wǎng)絡(luò)的輸出則根據(jù)連接方式、權(quán)重值和激勵函數(shù)的不同而不同。 “深度學習系統(tǒng)是人工神經(jīng)網(wǎng)絡(luò)的升級版。”徐英瑾解釋說，這種系統(tǒng)由輸入層、中間層和輸出層構(gòu)成，其中，中間層由多層人工神經(jīng)網(wǎng)絡(luò)構(gòu)成，可多達七八十層，故名為“深度學習”。每增加一層，就意味著增加了一個人工智能分析維度。當人把某種大數(shù)據(jù)樣本輸入系統(tǒng)后，這種系統(tǒng)即可進行學習，掌握樣本中蘊含的規(guī)律。為了讓　Al－phaGo具有一流的圍棋水平，谷歌科研人員輸入了2000萬局棋譜。假如一個人要學習2000萬局棋，每局棋耗時15分鐘，他需要一刻不停地下570年！

戰(zhàn)勝圍棋世界冠軍是遲早的事

Facebook　專家也在研發(fā)圍棋程序，但谷歌走在了他們前面。看了谷歌專家近日以封面形式發(fā)表在《自然》上的論文后，F(xiàn)acebook人工智能組研究員田淵棟博士表示，從算法上說，這篇文章并沒有太多新意，主要是通過大量訓練數(shù)據(jù)，包括以往的棋譜和自我對局，把性能“堆”出來。谷歌團隊訓練了一個走子的神經(jīng)網(wǎng)絡(luò)，又訓練了一個可以評估局面的網(wǎng)絡(luò)，然后在“蒙特卡羅樹搜索”中同時使用這兩個網(wǎng)絡(luò)。香港科技大學計算機科學碩士陳經(jīng)介紹，采用“蒙特卡羅樹搜索”這種算法，是圍棋程序在采用深度學習系統(tǒng)之前的一次突破。2010年左右，開發(fā)者們引入“蒙特卡羅樹搜索”，其特點是模擬棋局一直到下完算子、判斷勝負，模擬多次后，看哪個選點的獲勝概率最高。模擬時，會利用“棋形”等經(jīng)驗減少選點，一直模擬下去直至終局。時間不夠或電腦計算能力不足，模擬的局面數(shù)就少，棋力就低。由此可見，這是一種基于概率的“暴力搜索”算法。如今，AlphaGo將“暴力搜索”與“大數(shù)據(jù)+深度學習”結(jié)合在一起，取得了突破。經(jīng)過2000萬局“自我對局”訓練，它擁有了擊敗職業(yè)棋手的能力。“這個訓練規(guī)模，我實在沒有想到過，谷歌在這方面是很有優(yōu)勢的。”田淵棟坦言，他們的“默認策略”也是經(jīng)過處理的，能夠僅耗時2微秒就走一步，而且準確率也不錯。總之，谷歌的做法充分利用了“大數(shù)據(jù)+深度學習”的優(yōu)勢，而且?guī)缀跬耆从玫絿宓膶I(yè)知識。“若是以后棋力能再往上走，我也不會驚訝。” 不斷學習、不斷進步的Al－phaGo，今年能否戰(zhàn)勝李世石？華東師范大學計算機系賀樑教授認為，有這個可能，即使今年沒有戰(zhàn)勝，計算機程序擊敗圍棋世界冠軍也是遲早的事。這是因為，計算機的運算速度比人腦快得多，能憑借“大數(shù)據(jù)+深度學習”在短期內(nèi)分析完一個人一生也無法窮盡的棋譜，棋力提升的速度和幅度會很驚人。

打造“通用人工智能” 需新算法

在不少人看來，如果　Al－phaGo擊敗圍棋世界冠軍，意味著人類將喪失在棋類游戲中最后的尊嚴。對此，徐英瑾認為大可不必妄自菲薄。從訓練棋局數(shù)量與圍棋水平的“投入/產(chǎn)出比”來看，人工智能還是沒有人類圍棋高手聰明。要知道，Al－phaGo可是訓練了2000萬局棋后，才能戰(zhàn)勝職業(yè)圍棋二段選手。而一個人在成長為職業(yè)九段高手前，訓練的棋局數(shù)量遠小于2000萬。從這個意義上說，人工智能程序的聰明程度遠不如大多數(shù)人，盡管擁有了深度學習能力，但它戰(zhàn)勝人類的主要原因仍和以前一樣：運算速度快、不受生物屬性限制。因此，我們不必沮喪，而是要為人工智能技術(shù)的進步感到欣喜。谷歌團隊表示，他們打算利用研發(fā)AlphaGo過程中的技術(shù)來解決一些當今社會的重要問題，如醫(yī)學診斷、全球變暖。自然語言理解，也是人工智能研發(fā)的一個重點領(lǐng)域。目前，代表這一領(lǐng)域國際先進水平的蘋果手機Siri，在與用戶對話時，仍顯得較為幼稚，有時答非所問。谷歌、Facebook、微軟、百度等許多知名互聯(lián)網(wǎng)企業(yè)都在投入重金，開展研發(fā)，以期在人機問答領(lǐng)域取得突破。徐英瑾表示，AlphaGo擊敗圍棋高手，也許還稱不上人工智能領(lǐng)域的重大突破。人工智能唯有能模仿“整全的人”，具備人類思維的大多數(shù)功能，才是真正震撼人心的事件。他分析說，計算機程序的許多單項能力早已超越人類，即使是一個小小的計算器，其算數(shù)能力也非人類可比。計算機程序如今成為圍棋高手，不過是增加了一種單項能力。與之相比，實現(xiàn)“通用人工智能”的難度高得多，要求一個人工智能系統(tǒng)，可以像人一樣做很多事情：做算術(shù)、寫文章、畫畫、下棋……這種系統(tǒng)能處理生活中紛繁復(fù)雜的情況，如果科學家能開發(fā)出一套優(yōu)質(zhì)的家政服務(wù)系統(tǒng)，能讓機器人獨立做各種家務(wù)，那么它就基本可算作通用人工智能。賀樑和徐英瑾都認為，“大數(shù)據(jù)+深度學習”技術(shù)并不能打造出通用人工智能系統(tǒng)，科技界需要開發(fā)出新的算法和技術(shù)，更好地模擬人腦工作方式，才有望把人工智能推向新的高度。（俞陶然）

編輯：劉文俊

關(guān)鍵詞：人工智能擊敗圍棋高手“阿爾法圍棋”