IBM AI與人類辯論賽全程：機(jī)器語義、邏輯分析能力突飛猛進(jìn)

2019/02/14 11:59 騰訊《潛望》紀(jì)振宇

　　你或許從來沒有見過這樣一場(chǎng)奇特的辯論賽：人類辯手在講臺(tái)上正進(jìn)行著精彩陳述，一旁是一臺(tái)一人多高的黑色方形柱，中間屏幕上的三個(gè)光球不時(shí)彈跳、閃爍，隨后，從這臺(tái)柱子身上傳出一個(gè)冷靜的女聲，保持著恒定的語速闡述自己的觀點(diǎn)。

　　這場(chǎng)備受矚目的人與人工智能之間的辯論賽11日在IBM 2019年Think大會(huì)期間上演。臺(tái)上的黑色柱子，是被IBM稱為“Project Debater”的人工智能系統(tǒng)，誕生于IBM位于以色列海法的實(shí)驗(yàn)室，最早于2011年由研究員Noam Slonim提出，去年6月，Project Debater首次在舊金山的一場(chǎng)媒體閉門活動(dòng)上亮相，對(duì)陣兩名以色列辯論冠軍并取得勝利。

　　時(shí)隔半年多后，Project Debater的再次亮相則高調(diào)了許多，這場(chǎng)辯論賽對(duì)外進(jìn)行了視頻直播，對(duì)陣的人類辯方是2012年歐洲辯論冠軍、入選2016年全球辯論大賽最終決賽圈的專業(yè)辯論選手Harish Natarajan。

　　當(dāng)天的辯論賽分成三部分進(jìn)行，首先正反雙方分別進(jìn)行4分鐘的觀點(diǎn)陳述，然后進(jìn)入各自4分鐘的反駁時(shí)間，最后是各自進(jìn)行2分鐘的總結(jié)。

　　這場(chǎng)辯論的辯題為“是否應(yīng)該對(duì)學(xué)前教育進(jìn)行補(bǔ)貼?” Project Debater 為正方，人類辯手為反方，每一輪都由Project Debater首先進(jìn)行。

　　在開場(chǎng)陳述中，Project Debater表示，應(yīng)該對(duì)學(xué)前教育進(jìn)行補(bǔ)貼，“補(bǔ)貼”不僅僅是“錢”的問題，還關(guān)乎政治、社會(huì)和倫理道德等，根據(jù)許多過往的經(jīng)驗(yàn)及研究表明，學(xué)前教育能夠?qū)ι鐣?huì)帶來正效益，包括減少犯罪，幫助貧困等，Project Debater特別提到幫助貧困人群的問題，相關(guān)研究成果稱，學(xué)前教育可以幫助與貧困相關(guān)的兒童的一些缺陷。

　　AI隨后連續(xù)引用了三份研究結(jié)果來佐證自己的觀點(diǎn)，首先是引用經(jīng)合組織的建議，稱應(yīng)對(duì)貧困地區(qū)進(jìn)行學(xué)齡前教育補(bǔ)貼，以改善這些地區(qū)兒童的未來表現(xiàn)。其次，AI還引用了60年代的一份研究稱，學(xué)前教育能夠?qū)€(gè)人及社會(huì)未來長(zhǎng)期發(fā)展帶來幫助，遠(yuǎn)遠(yuǎn)超過為此需要付出的成本。最后，AI還引用了疾控中心的研究，稱學(xué)前教育能夠減少醫(yī)療成本、降低犯罪、對(duì)福利的依賴以及虐待兒童等。

　　因而AI的結(jié)論是，對(duì)學(xué)前教育進(jìn)行補(bǔ)貼，能夠讓貧困家庭的兒童支付的起相關(guān)教育，讓他們更好地為未來的教育做好準(zhǔn)備。

　　Project Debater的整個(gè)陳述句式完整，邏輯清晰，尤其多次引用了過往的研究成果，包括經(jīng)合組織的數(shù)據(jù)等，來佐證自己的觀點(diǎn)。

　　隨后人類辯手Natarajan做了針對(duì)性的開場(chǎng)陳述，不僅闡述了其在15分鐘時(shí)間內(nèi)所準(zhǔn)備的內(nèi)容，還對(duì)Project Debater的陳述，進(jìn)行了有針對(duì)性的質(zhì)疑。他指出，Project Debater的主要觀點(diǎn)，基于一種“本能性”的結(jié)論，即我們?nèi)绻J(rèn)為學(xué)前教育總體上是好事，那么就理所應(yīng)當(dāng)對(duì)其進(jìn)行補(bǔ)貼，但他認(rèn)為，僅憑此就做出這樣的結(jié)論還遠(yuǎn)遠(yuǎn)不夠，這樣的邏輯過于簡(jiǎn)單直接，他給出了例子進(jìn)行反駁，例如如果一國(guó)增加對(duì)醫(yī)療的投入，也能夠給整個(gè)社會(huì)帶來福利，也能夠?qū)逃龓硗苿?dòng)。

　　此外，他還指出，Project Debater忽略了在現(xiàn)實(shí)情境下，簡(jiǎn)單進(jìn)行補(bǔ)貼并不一定能夠達(dá)到預(yù)期的效果，尤其是針對(duì)學(xué)前教育的補(bǔ)貼，最終實(shí)際上是補(bǔ)貼在中產(chǎn)階級(jí)身上，而這些階層原先就有能力支付學(xué)前教育的費(fèi)用，而補(bǔ)貼的錢由來自于所有人，因而對(duì)于貧困人群來說，反而帶來了損害。Natarajan同時(shí)指出，如果目的是幫助貧困人群，那么在政府資金資源有限的情況下，應(yīng)該考慮現(xiàn)實(shí)的限制，將資源最優(yōu)化配置在能夠達(dá)到這一目的的領(lǐng)域。

　　人類辯手的這一開場(chǎng)陳述，同樣邏輯清晰，并且體現(xiàn)了人類在進(jìn)行辯論過程中，能夠根據(jù)對(duì)方的陳述，做出有針對(duì)性回應(yīng)的特點(diǎn)，考慮到這位人類辯手是一位專業(yè)的辯論高手，因而在他的陳述中，也體現(xiàn)了許多專業(yè)性的辯論技巧，例如將辯題進(jìn)一步細(xì)化，并引向?qū)κ址皆陉愂鲋斜┞冻龅倪壿嬌系谋∪醐h(huán)節(jié)，比如Natarajan就針對(duì)了Project Debater在陳述中所表現(xiàn)出的“因?yàn)閷W(xué)前教育好，所以就要進(jìn)行補(bǔ)貼”這樣的簡(jiǎn)單粗暴的邏輯。

　　在接下來的駁論環(huán)節(jié)，辯論雙方需要對(duì)對(duì)方之前所做出的陳述，進(jìn)行針對(duì)性的回應(yīng)，以進(jìn)一步鞏固自身的觀點(diǎn)。

　　就這一輪環(huán)節(jié)來說，對(duì)于人工智能Project Debater的挑戰(zhàn)在于，需要首先理解人類辯手在陳述中所進(jìn)行的闡述，同時(shí)在其中找出其論證的一些漏洞或邏輯不嚴(yán)密的地方并對(duì)這些薄弱環(huán)節(jié)進(jìn)行針對(duì)性回?fù)簟?/p>

　　Project Debater的設(shè)計(jì)者之一、IBM研究員Noam Slonim表示，這一輪對(duì)于AI來說是“挑戰(zhàn)最大”的部分，對(duì)于AI來說，首先需要獲得人類辯手之前陳述的詞語，然后將這些詞語組織成“有意義”的句子，再從這些句子中摘取出人類辯手陳述的要點(diǎn)，再對(duì)這些要點(diǎn)進(jìn)行回應(yīng)。

　　但遺憾的是，這一輪Project Debater的表現(xiàn)并不夠好，這一輪也是最能反映出人和人工智能之間的區(qū)別的環(huán)節(jié)。盡管Project Debater準(zhǔn)確地抓取了人類辯手在開場(chǎng)陳述中所提到的對(duì)于貧困人群幫助的問題，并進(jìn)行進(jìn)一步闡述，但卻錯(cuò)誤地理解了人類辯手的意思，Project Debater稱，對(duì)方辯友說學(xué)前教育是有害(harmful)的，但實(shí)際上是AI錯(cuò)誤地理解了人類辯手的意思，人類辯手說，過早的學(xué)前教育，可能讓兒童在心理上產(chǎn)生挫折感，這樣反而是有害的，而AI并沒有將這樣的完整的上下文全部吸收并進(jìn)行正確理解。

　　隨后，Project Debater的大部分陳述依然圍繞著其相對(duì)簡(jiǎn)單的邏輯進(jìn)行，包括有數(shù)據(jù)和研究表明學(xué)前教育對(duì)于兒童接下來接受學(xué)校教育更有幫助，以及學(xué)前教育可以降低犯罪率，所以要對(duì)學(xué)前教育進(jìn)行補(bǔ)貼。

　　人類辯手在接下來自己的反駁環(huán)節(jié)，繼續(xù)緊抓AI邏輯相對(duì)簡(jiǎn)單以及對(duì)情境的闡述過于理想化這一點(diǎn)進(jìn)行攻擊，指出，AI所提出的政府資金能夠滿足各個(gè)方面只是理想的狀況，現(xiàn)實(shí)情況下，在政府資源有限的情況下，直接將資金撥給學(xué)前教育，并不一定是最理想的選擇。

　　在最后總結(jié)陳詞環(huán)節(jié)，Project Debater依然給出了標(biāo)準(zhǔn)完整的陳述，人類辯手在進(jìn)一步闡述自身觀點(diǎn)的同時(shí)，繼續(xù)指出Project Debater的觀點(diǎn)在論證邏輯上的不足。

　　本場(chǎng)辯論賽最終的輸贏是根據(jù)賽前賽后觀眾投票結(jié)果的變化來決定，在比賽進(jìn)行之前，現(xiàn)場(chǎng)的觀眾對(duì)該辯題進(jìn)行投票，結(jié)果為支持補(bǔ)貼學(xué)前教育的觀眾占79%，不支持補(bǔ)貼學(xué)前教育的觀眾占13%，在辯論結(jié)束后，支持補(bǔ)貼學(xué)前教育的觀眾比例變?yōu)?2%，而不支持補(bǔ)貼學(xué)前教育的觀眾占30%，也就是說，17%的觀眾的觀點(diǎn)因?yàn)槭艿睫q論的影響，由支持變?yōu)榉磳?duì)，根據(jù)這樣的結(jié)果，本場(chǎng)辯論賽以人類辯手獲勝而告終。

　　與此同時(shí)進(jìn)行的另一個(gè)投票結(jié)果則并不讓人意外，69%的觀眾認(rèn)為，Project Debater讓他們?cè)黾恿酥R(shí)。

　　從整場(chǎng)辯論賽的進(jìn)程來看，進(jìn)行地十分順利流暢，無論是AI還是人類辯手，都在各自環(huán)節(jié)的指定時(shí)間內(nèi)，準(zhǔn)時(shí)無誤地完成了自身的陳述，Project Debater從始至終保持了冷靜平緩的語調(diào)，語速也從頭至尾保持一致，這也完全符合外界之前的預(yù)期。有些出人意料的地方在于，AI時(shí)不時(shí)還會(huì)冒出一兩句幽默，比如“對(duì)方辯友或許從來沒有和機(jī)器進(jìn)行過辯論”，還有“或許我自己無法親身經(jīng)歷貧困是什么樣的，也不應(yīng)對(duì)目前的生活水平有任何抱怨”，所有這些小花絮，都讓AI聽上去更像一個(gè)有著獨(dú)立思考能力和情感的人類，辯論賽的主持人也在開始前說，Project Debater是有性別的，是一位女性，并在辯論賽結(jié)束后稱，AI展現(xiàn)出了“魅力”(Charming)。

　　當(dāng)然AI自身存在的不足，也在整個(gè)辯論賽過程中很明顯地暴露出來，而這些“弱點(diǎn)”也正好被其訓(xùn)練有素的人類辯手所利用，例如AI的邏輯結(jié)論相對(duì)簡(jiǎn)單，總體而言，AI的邏輯是，過往的經(jīng)驗(yàn)和研究數(shù)據(jù)表明，A能夠?qū)е翨、A也能夠?qū)е翪或者D，如果B、C、D都是好的，那么就應(yīng)該支持A，基于這樣簡(jiǎn)單的因果邏輯所得出的結(jié)論在遇到很多現(xiàn)實(shí)問題制約以及其他變量因素時(shí)，并不能夠完全成立。

　　當(dāng)然，由于AI背后的海量數(shù)據(jù)資源的優(yōu)勢(shì)，AI在辯論過程中能夠隨意引用相關(guān)研究成果來佐證自己的觀點(diǎn)這一點(diǎn)，要絕對(duì)遠(yuǎn)勝過人類，在賽后，人類辯手在接受短暫訪談時(shí)也提到，在辯論賽中，發(fā)現(xiàn)AI所具備的這種“潛力”，讓他十分驚嘆，他認(rèn)為，如果人類也能夠具備這樣的能力，那么將在分析問題得出結(jié)論過程中得到更多的助益。

　　Noam Slonim表示，Project Debater的數(shù)據(jù)庫包含100億的句子，而該系統(tǒng)的能力在于在短時(shí)間里，從這些數(shù)據(jù)中找出能夠用于當(dāng)前辯題的詞語，組成合乎邏輯的句子，再組成完整的陳述。

　　從當(dāng)場(chǎng)AI的表現(xiàn)來看，Project Debater至少已經(jīng)完成了在短時(shí)間內(nèi)(15分鐘)，從數(shù)據(jù)庫中尋找到能夠用于當(dāng)前辯題的詞語，組成相關(guān)的句子，并形成邏輯相對(duì)嚴(yán)謹(jǐn)?shù)年愂�，但同時(shí)，在理解人類對(duì)手的陳述，抓住對(duì)方陳述的要點(diǎn)，甚至邏輯的薄弱環(huán)節(jié)方面，還存在很明顯的不足。

　　無論結(jié)果如何，這場(chǎng)辯論賽向世人展示了AI所具備的另一種能力，在我們親眼看到AI能夠在國(guó)際象棋、圍棋、電腦游戲方面能夠輕松戰(zhàn)勝人類頂級(jí)選手以后，在對(duì)語義、邏輯要求更高的領(lǐng)域，已經(jīng)取得了非常驚人的進(jìn)展。

　　在辯論賽后，Slonim接受騰訊《潛望》等媒體采訪時(shí)表示，自己愿意給Project Debater的表現(xiàn)打9分，他對(duì)于系統(tǒng)的表現(xiàn)十分滿意，同時(shí)也指出在駁論階段系統(tǒng)存在的不足。

　　“我們的最終目標(biāo)是，當(dāng)結(jié)果并不是非黑即白時(shí)，建立一個(gè)能夠幫助人們做出基于證據(jù)的決策的系統(tǒng)。”Slonim說。

　　正如IBM 研究院主管Dario Gil在辯論賽開場(chǎng)之前所說，比賽的意義并不在于誰輸誰贏，而是通過這樣的方式，展示人類能夠?qū)I更好地運(yùn)用到分析問題、解決問題以及做出決策等方面的另一種可能性。

IT產(chǎn)業(yè)網(wǎng)微信二維碼logo

　　榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn（把#換成@）。

海報(bào)生成中...

分享到微博分享到微信一鍵復(fù)制

標(biāo)題鏈接已成功復(fù)制

IBM AI與人類辯論賽全程：機(jī)器語義、邏輯分析能力突飛猛進(jìn)

最新新聞

熱門新聞

新動(dòng)態(tài)

關(guān)注度

最話題

IBM AI與人類辯論賽全程：機(jī)器語義、邏輯分析能力突飛猛進(jìn)

相關(guān)閱讀

最新新聞

熱門新聞

新動(dòng)態(tài)

關(guān)注度

最話題