[No.L001]
你或許從來沒有見過這樣一場奇特的辯論賽:人類辯手在講臺上正進行著精彩陳述,一旁是一臺一人多高的黑色方形柱,中間屏幕上的三個光球不時彈跳、閃爍,隨后,從這臺柱子身上傳出一個冷靜的女聲,保持著恒定的語速闡述自己的觀點。
這場備受矚目的人與人工智能之間的辯論賽11日在IBM 2019年Think大會期間上演。臺上的黑色柱子,是被IBM稱為“Project Debater”的人工智能系統(tǒng),誕生于IBM位于以色列海法的實驗室,最早于2011年由研究員Noam Slonim提出,去年6月,Project Debater首次在舊金山的一場媒體閉門活動上亮相,對陣兩名以色列辯論冠軍并取得勝利。
時隔半年多后,Project Debater的再次亮相則高調了許多,這場辯論賽對外進行了視頻直播,對陣的人類辯方是2012年歐洲辯論冠軍、入選2016年全球辯論大賽最終決賽圈的專業(yè)辯論選手Harish Natarajan。
當天的辯論賽分成三部分進行,首先正反雙方分別進行4分鐘的觀點陳述,然后進入各自4分鐘的反駁時間,最后是各自進行2分鐘的總結。
這場辯論的辯題為“是否應該對學前教育進行補貼?” Project Debater 為正方,人類辯手為反方,每一輪都由Project Debater首先進行。
在開場陳述中,Project Debater表示,應該對學前教育進行補貼,“補貼”不僅僅是“錢”的問題,還關乎政治、社會和倫理道德等,根據許多過往的經驗及研究表明,學前教育能夠對社會帶來正效益,包括減少犯罪,幫助貧困等,Project Debater特別提到幫助貧困人群的問題,相關研究成果稱,學前教育可以幫助與貧困相關的兒童的一些缺陷。
AI隨后連續(xù)引用了三份研究結果來佐證自己的觀點,首先是引用經合組織的建議,稱應對貧困地區(qū)進行學齡前教育補貼,以改善這些地區(qū)兒童的未來表現(xiàn)。其次,AI還引用了60年代的一份研究稱,學前教育能夠對個人及社會未來長期發(fā)展帶來幫助,遠遠超過為此需要付出的成本。最后,AI還引用了疾控中心的研究,稱學前教育能夠減少醫(yī)療成本、降低犯罪、對福利的依賴以及虐待兒童等。
因而AI的結論是,對學前教育進行補貼,能夠讓貧困家庭的兒童支付的起相關教育,讓他們更好地為未來的教育做好準備。
Project Debater的整個陳述句式完整,邏輯清晰,尤其多次引用了過往的研究成果,包括經合組織的數據等,來佐證自己的觀點。
隨后人類辯手Natarajan做了針對性的開場陳述,不僅闡述了其在15分鐘時間內所準備的內容,還對Project Debater的陳述,進行了有針對性的質疑。他指出,Project Debater的主要觀點,基于一種“本能性”的結論,即我們如果認為學前教育總體上是好事,那么就理所應當對其進行補貼,但他認為,僅憑此就做出這樣的結論還遠遠不夠,這樣的邏輯過于簡單直接,他給出了例子進行反駁,例如如果一國增加對醫(yī)療的投入,也能夠給整個社會帶來福利,也能夠對教育帶來推動。
此外,他還指出,Project Debater忽略了在現(xiàn)實情境下,簡單進行補貼并不一定能夠達到預期的效果,尤其是針對學前教育的補貼,最終實際上是補貼在中產階級身上,而這些階層原先就有能力支付學前教育的費用,而補貼的錢由來自于所有人,因而對于貧困人群來說,反而帶來了損害。Natarajan同時指出,如果目的是幫助貧困人群,那么在政府資金資源有限的情況下,應該考慮現(xiàn)實的限制,將資源最優(yōu)化配置在能夠達到這一目的的領域。
人類辯手的這一開場陳述,同樣邏輯清晰,并且體現(xiàn)了人類在進行辯論過程中,能夠根據對方的陳述,做出有針對性回應的特點,考慮到這位人類辯手是一位專業(yè)的辯論高手,因而在他的陳述中,也體現(xiàn)了許多專業(yè)性的辯論技巧,例如將辯題進一步細化,并引向對手方在陳述中暴露出的邏輯上的薄弱環(huán)節(jié),比如Natarajan就針對了Project Debater在陳述中所表現(xiàn)出的“因為學前教育好,所以就要進行補貼”這樣的簡單粗暴的邏輯。
在接下來的駁論環(huán)節(jié),辯論雙方需要對對方之前所做出的陳述,進行針對性的回應,以進一步鞏固自身的觀點。
就這一輪環(huán)節(jié)來說,對于人工智能Project Debater的挑戰(zhàn)在于,需要首先理解人類辯手在陳述中所進行的闡述,同時在其中找出其論證的一些漏洞或邏輯不嚴密的地方并對這些薄弱環(huán)節(jié)進行針對性回擊。
Project Debater的設計者之一、IBM研究員Noam Slonim表示,這一輪對于AI來說是“挑戰(zhàn)最大”的部分,對于AI來說,首先需要獲得人類辯手之前陳述的詞語,然后將這些詞語組織成“有意義”的句子,再從這些句子中摘取出人類辯手陳述的要點,再對這些要點進行回應。
但遺憾的是,這一輪Project Debater的表現(xiàn)并不夠好,這一輪也是最能反映出人和人工智能之間的區(qū)別的環(huán)節(jié)。盡管Project Debater準確地抓取了人類辯手在開場陳述中所提到的對于貧困人群幫助的問題,并進行進一步闡述,但卻錯誤地理解了人類辯手的意思,Project Debater稱,對方辯友說學前教育是有害(harmful)的,但實際上是AI錯誤地理解了人類辯手的意思,人類辯手說,過早的學前教育,可能讓兒童在心理上產生挫折感,這樣反而是有害的,而AI并沒有將這樣的完整的上下文全部吸收并進行正確理解。
隨后,Project Debater的大部分陳述依然圍繞著其相對簡單的邏輯進行,包括有數據和研究表明學前教育對于兒童接下來接受學校教育更有幫助,以及學前教育可以降低犯罪率,所以要對學前教育進行補貼。
人類辯手在接下來自己的反駁環(huán)節(jié),繼續(xù)緊抓AI邏輯相對簡單以及對情境的闡述過于理想化這一點進行攻擊,指出,AI所提出的政府資金能夠滿足各個方面只是理想的狀況,現(xiàn)實情況下,在政府資源有限的情況下,直接將資金撥給學前教育,并不一定是最理想的選擇。
在最后總結陳詞環(huán)節(jié),Project Debater依然給出了標準完整的陳述,人類辯手在進一步闡述自身觀點的同時,繼續(xù)指出Project Debater的觀點在論證邏輯上的不足。
本場辯論賽最終的輸贏是根據賽前賽后觀眾投票結果的變化來決定,在比賽進行之前,現(xiàn)場的觀眾對該辯題進行投票,結果為支持補貼學前教育的觀眾占79%,不支持補貼學前教育的觀眾占13%,在辯論結束后,支持補貼學前教育的觀眾比例變?yōu)?2%,而不支持補貼學前教育的觀眾占30%,也就是說,17%的觀眾的觀點因為受到辯論的影響,由支持變?yōu)榉磳�,根據這樣的結果,本場辯論賽以人類辯手獲勝而告終。
與此同時進行的另一個投票結果則并不讓人意外,69%的觀眾認為,Project Debater讓他們增加了知識。
從整場辯論賽的進程來看,進行地十分順利流暢,無論是AI還是人類辯手,都在各自環(huán)節(jié)的指定時間內,準時無誤地完成了自身的陳述,Project Debater從始至終保持了冷靜平緩的語調,語速也從頭至尾保持一致,這也完全符合外界之前的預期。有些出人意料的地方在于,AI時不時還會冒出一兩句幽默,比如“對方辯友或許從來沒有和機器進行過辯論”,還有“或許我自己無法親身經歷貧困是什么樣的,也不應對目前的生活水平有任何抱怨”,所有這些小花絮,都讓AI聽上去更像一個有著獨立思考能力和情感的人類,辯論賽的主持人也在開始前說,Project Debater是有性別的,是一位女性,并在辯論賽結束后稱,AI展現(xiàn)出了“魅力”(Charming)。
當然AI自身存在的不足,也在整個辯論賽過程中很明顯地暴露出來,而這些“弱點”也正好被其訓練有素的人類辯手所利用,例如AI的邏輯結論相對簡單,總體而言,AI的邏輯是,過往的經驗和研究數據表明,A能夠導致B、A也能夠導致C或者D,如果B、C、D都是好的,那么就應該支持A,基于這樣簡單的因果邏輯所得出的結論在遇到很多現(xiàn)實問題制約以及其他變量因素時,并不能夠完全成立。
當然,由于AI背后的海量數據資源的優(yōu)勢,AI在辯論過程中能夠隨意引用相關研究成果來佐證自己的觀點這一點,要絕對遠勝過人類,在賽后,人類辯手在接受短暫訪談時也提到,在辯論賽中,發(fā)現(xiàn)AI所具備的這種“潛力”,讓他十分驚嘆,他認為,如果人類也能夠具備這樣的能力,那么將在分析問題得出結論過程中得到更多的助益。
Noam Slonim表示,Project Debater的數據庫包含100億的句子,而該系統(tǒng)的能力在于在短時間里,從這些數據中找出能夠用于當前辯題的詞語,組成合乎邏輯的句子,再組成完整的陳述。
從當場AI的表現(xiàn)來看,Project Debater至少已經完成了在短時間內(15分鐘),從數據庫中尋找到能夠用于當前辯題的詞語,組成相關的句子,并形成邏輯相對嚴謹的陳述,但同時,在理解人類對手的陳述,抓住對方陳述的要點,甚至邏輯的薄弱環(huán)節(jié)方面,還存在很明顯的不足。
無論結果如何,這場辯論賽向世人展示了AI所具備的另一種能力,在我們親眼看到AI能夠在國際象棋、圍棋、電腦游戲方面能夠輕松戰(zhàn)勝人類頂級選手以后,在對語義、邏輯要求更高的領域,已經取得了非常驚人的進展。
在辯論賽后,Slonim接受騰訊《潛望》等媒體采訪時表示,自己愿意給Project Debater的表現(xiàn)打9分,他對于系統(tǒng)的表現(xiàn)十分滿意,同時也指出在駁論階段系統(tǒng)存在的不足。
“我們的最終目標是,當結果并不是非黑即白時,建立一個能夠幫助人們做出基于證據的決策的系統(tǒng)。”Slonim說。
正如IBM 研究院主管Dario Gil在辯論賽開場之前所說,比賽的意義并不在于誰輸誰贏,而是通過這樣的方式,展示人類能夠將AI更好地運用到分析問題、解決問題以及做出決策等方面的另一種可能性。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...