[No.H002]
今年2月,2021海華AI挑戰(zhàn)賽·中文閱讀理解正式啟動開賽。本次大賽由中關(guān)村海華信息技術(shù)前沿研究院與清華大學(xué)交叉信息研究院聯(lián)合主辦,騰訊云計算協(xié)辦,biendata競賽平臺承辦。大賽采用中學(xué)組與技術(shù)組雙賽道并行的賽制,比賽總獎金30萬元。
經(jīng)過數(shù)個月的多輪角逐,北京時間6月22日,2021海華AI挑戰(zhàn)賽·中文閱讀理解經(jīng)過歷時1小時的線上決賽答辯圓滿收官。最終的獲獎團隊名單如下:
中學(xué)組獲獎團隊
1、團隊:HEE
2、團隊:Learning Magic
3、團隊:WENGSYX
技術(shù)組獲獎團隊
1、團隊:美麗&英俊
2、團隊:test
3、團隊:臥龍鳳雛、ATTOY
中學(xué)組賽道獲獎團隊
技術(shù)組賽道獲獎團隊
本次比賽的數(shù)據(jù)來自小學(xué) / 中高考語文閱讀理解題庫,中學(xué)組為來自八千余篇文章的17000多道小學(xué)語文題(現(xiàn)代文、古文、詩詞占比分別為80%、8%、12%),技術(shù)組是來自八千篇文章的兩萬余道中高考語文題(現(xiàn)代文、古文、詩詞占比分別為70%、27%、3%),形式豐富,內(nèi)容多樣。
6月22日下午2點,2021海華AI挑戰(zhàn)賽決賽答辯暨頒獎儀式的線上直播活動正式開始。由于未能參與直播,姚期智院士特別為大家錄制了一段祝福視頻。
姚院士在視頻中提到,“希望通過AI挑戰(zhàn)賽的舉辦,提升機器智能水平,希望更多的AI技術(shù)人才加入海華這個家庭,并讓更多的年輕人投入人工智能這個領(lǐng)域”,最后姚院士對獲獎的參賽選手表示祝賀。
在直播中,海華研究院副院長、清華大學(xué)交叉信息研究院長聘副教授黃隆波和騰訊云異構(gòu)計算產(chǎn)品負(fù)責(zé)人宋丹丹作為決賽評委發(fā)表致辭,海華研究院兼職顧問,清華大學(xué)交叉信息研究院助理教授高陽及吳翼亦作為評委對答辯選手進行了提問。
黃隆波說:“海華希望通過AI挑戰(zhàn)賽的形式,激發(fā)大家對中文閱讀理解領(lǐng)域的關(guān)注和興趣,推動該領(lǐng)域的研究,為做出更加智能化、擬人化的機器而努力。”
宋丹丹表示:“希望有朝一日,我們可以云上再見,將技術(shù)演進的紅利通過云原生、云應(yīng)用的形式釋放出來,真正地讓機器學(xué)會文明,讓AI產(chǎn)生價值,從而服務(wù)于我們的社會和生活。”
答辯環(huán)節(jié)中,來自騰訊云小微教育的技術(shù)組冠軍與來自南豐縣第二中學(xué)的中學(xué)組冠軍分別為直播觀眾帶了精彩的技術(shù)分享。
其中,技術(shù)組的冠軍成員代表、來自騰訊云小微教育的姜雨帆在講解中介紹,團隊基于Bert、Roberta、Macbert和AIbert等預(yù)訓(xùn)練模型進行微調(diào),將篇章、問題和選項進行拼接,并采用了Multiple Choice的形式,結(jié)合以內(nèi)外部數(shù)據(jù)增強以及領(lǐng)域&任務(wù)微調(diào)等技巧,最終得出了52.4283的好成績。
中學(xué)組的冠軍隊伍代表、來自南豐縣第二中學(xué)的初三學(xué)生黃熙鳴則使用了BertForMultipleChoice作為基線,在roberta-base上初次提交得到44.01分。其后,他又通過增加迭代次數(shù),更換不同預(yù)訓(xùn)練模型等方法逐步提升成績,最終得到了 65.0786分的好成績。
本次大賽吸引了來自全球9個國家和地區(qū)的參賽選手總計超過1,600人,技術(shù)組賽道的參賽選手覆蓋超過600所全球頂級高校、科研機構(gòu)以及知名科技企業(yè)。中學(xué)組有近百人報名參賽,最后的提交率超過70%。本次大賽技術(shù)組和中學(xué)組兩賽道采用了初賽選拔+復(fù)賽評測的賽制,經(jīng)過初賽選拔出前40名參賽隊伍進入復(fù)賽階段。
隨著最終結(jié)果的出爐,2021海華AI挑戰(zhàn)賽·中文閱讀理解已圓滿結(jié)束,但我們對于前沿科技的探索不曾停下腳步。一場隆冬及夏至的旅程,在好奇下嘗試、在熱情中鉆研,從青少年,大學(xué)生到科技從業(yè)者,他們給出了一份對未來具有借鑒意義的答卷。“大鵬一日同風(fēng)起,扶搖直上九萬里”,等風(fēng)起時,機器閱讀理解在中文語境下展現(xiàn)流光溢彩,它或許可以解釋出大鵬鳥為什么沖上了萬里云霄,而我們,真切地期待那一天的到來。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...