人物檔案
中文名:樊麾
國籍:中國
出生地:中國
職業(yè):圍棋手
相關(guān)人物:時(shí)越、周睿羊、唐韋星
主要事項(xiàng)
與“AlphaGo”一較高下的棋手是2013年至2015年的歐洲圍棋冠軍、生于中國的樊麾。2015年10月,雙方以正式比賽中使用的十九路棋盤進(jìn)行了無讓子的5局較量,“AlphaGo”贏得滿堂紅。
2016國際智力運(yùn)動(dòng)聯(lián)盟智力運(yùn)動(dòng)精英賽,歐洲圍棋冠軍樊麾現(xiàn)身圍棋賽場(chǎng)。當(dāng)樊麾領(lǐng)銜的歐洲圍棋隊(duì)遇上3位世界冠軍時(shí)越、周睿羊與唐韋星組成的中國男隊(duì),0比3的結(jié)果并不意外,但第三臺(tái)樊麾與唐韋星的對(duì)局頗受關(guān)注。
相關(guān)資訊
機(jī)器人又贏了!去年與Alphago秘密決戰(zhàn)的歐洲圍棋冠軍樊麾深度剖...
搜狐 2016-03-10
舉世矚目的圍棋人機(jī)世紀(jì)大戰(zhàn)——谷歌人工智能系統(tǒng)“阿爾法圍棋”(AlphaGo)對(duì)決韓國高手李世石(五番賽第二回合)剛剛結(jié)束。擁有眾多國際冠軍頭銜的9段高手李世石再次不敵AlphaGo。
本次對(duì)戰(zhàn)具有重要的意義,是首次人工智能在人類最復(fù)雜的博弈游戲中挑戰(zhàn)最高級(jí)別的人類選手,而拉開這一帷幕的是去年歐洲圍棋冠軍樊麾與 AlphaGo的對(duì)戰(zhàn)。樊麾老師還作為裁判長現(xiàn)場(chǎng)督戰(zhàn)「AlphaGo VS 李世石」。
本文是機(jī)器之心對(duì)樊麾老師的專訪,樊麾老師詳細(xì)回顧了他與 AlphaGo 交戰(zhàn)的精彩故事,暢談了他對(duì)人工智能技術(shù)的感觸,以及對(duì)圍棋與人生的哲學(xué)思考。相信這篇精彩分享一定可以給大家?guī)沓奖荣惐旧淼膯⒌,關(guān)乎機(jī)器與人類、科技與文化、圍棋與哲學(xué)、歷史與未來。
2016年4月17日,第8屆應(yīng)氏杯世界職業(yè)圍棋錦標(biāo)賽名單公布,樊麾代表歐洲隊(duì)。
程序原理
阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序。這個(gè)程序利用“價(jià)值網(wǎng)絡(luò)”去計(jì)算局面,用“策略網(wǎng)絡(luò)”去選擇下子。
深度學(xué)習(xí)
阿爾法圍棋(AlphaGo)的主要工作原理是“深度學(xué)習(xí)”。“深度學(xué)習(xí)”是指多層的人工神經(jīng)網(wǎng)絡(luò)和訓(xùn)練它的方法。一層神經(jīng)網(wǎng)絡(luò)會(huì)把大量矩陣數(shù)字作為輸入,通過非線性激活方法取權(quán)重,再產(chǎn)生另一個(gè)數(shù)據(jù)集合作為輸出。這就像生物神經(jīng)大腦的工作機(jī)理一樣,通過合適的矩陣數(shù)量,多層組織鏈接一起,形成神經(jīng)網(wǎng)絡(luò)“大腦”進(jìn)行精準(zhǔn)復(fù)雜的處理,就像人們識(shí)別物體標(biāo)注圖片一樣!
兩個(gè)大腦
阿爾法圍棋(AlphaGo)是通過兩個(gè)不同神經(jīng)網(wǎng)絡(luò)“大腦”合作來改進(jìn)下棋。這些大腦是多層神經(jīng)網(wǎng)絡(luò)跟那些Google圖片搜索引擎識(shí)別圖片在結(jié)構(gòu)上是相似的。它們從多層啟發(fā)式二維過濾器開始,去處理圍棋棋盤的定位,就像圖片分類器網(wǎng)絡(luò)處理圖片一樣。經(jīng)過過濾,13 個(gè)完全連接的神經(jīng)網(wǎng)絡(luò)層產(chǎn)生對(duì)它們看到的局面判斷。這些層能夠做分類和邏輯推理。
這些網(wǎng)絡(luò)通過反復(fù)訓(xùn)練來檢查結(jié)果,再去校對(duì)調(diào)整參數(shù),去讓下次執(zhí)行更好。這個(gè)處理器有大量的隨機(jī)性元素,所以人們是不可能精確知道網(wǎng)絡(luò)是如何“思考”的,但更多的訓(xùn)練后能讓它進(jìn)化到更好。
第一大腦:落子選擇器 (Move Picker)
阿爾法圍棋(AlphaGo)的第一個(gè)神經(jīng)網(wǎng)絡(luò)大腦是“監(jiān)督學(xué)習(xí)的策略網(wǎng)絡(luò)(Policy Network)” ,觀察棋盤布局企圖找到最佳的下一步。事實(shí)上,它預(yù)測(cè)每一個(gè)合法下一步的最佳概率,那么最前面猜測(cè)的就是那個(gè)概率最高的。這可以理解成“落子選擇器”。
第二大腦:棋局評(píng)估器 (Position Evaluator)
阿爾法圍棋(AlphaGo)的第二個(gè)大腦相對(duì)于落子選擇器是回答另一個(gè)問題。不是去猜測(cè)具體下一步,它預(yù)測(cè)每一個(gè)棋手贏棋的可能,在給定棋子位置情況下。這“局面評(píng)估器”就是“價(jià)值網(wǎng)絡(luò)(Value Network)”,通過整體局面判斷來輔助落子選擇器。這個(gè)判斷僅僅是大概的,但對(duì)于閱讀速度提高很有幫助。通過分類潛在的未來局面的“好”與“壞”,AlphaGo能夠決定是否通過特殊變種去深入閱讀。如果局面評(píng)估器說這個(gè)特殊變種不行,那么AI就跳過閱讀在這一條線上的任何更多落子。
相關(guān)知識(shí)
阿爾法圍棋是一款圍棋人工智能程序,由位于英國倫敦的谷歌(Google)旗下DeepMind公司的戴維·西爾弗、艾佳·黃和杰米斯·哈薩比斯與他們的團(tuán)隊(duì)開發(fā),這個(gè)程序利用“價(jià)值網(wǎng)絡(luò)”去計(jì)算局面,用“策略網(wǎng)絡(luò)”去選擇下子。2015年10月阿爾法圍棋以5:0完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾。2016年3月9日,AlphaGo對(duì)戰(zhàn)圍棋冠軍李世石,最終李世石投子認(rèn)輸;3月10日,“圍棋人機(jī)大戰(zhàn)”第二局在韓國首爾的四季酒店開賽,結(jié)果阿爾法電腦執(zhí)黑戰(zhàn)勝李世石,五番棋2-0領(lǐng)先;3月12日,阿爾法電腦執(zhí)白再次戰(zhàn)勝李世石,五番棋3-0領(lǐng)先;3月13日,李世石戰(zhàn)勝阿爾法電腦,比分扳成1-3。