8月14日,在“高質(zhì)量完成‘十四五’規(guī)劃”系列主題新聞發(fā)布會上,國家發(fā)展改革委黨組成員、國家數(shù)據(jù)局局長劉烈宏介紹,在人工智能時代,Token,也就是大家通常所說的詞元,作為處理文本的最小數(shù)據(jù)單元,如同互聯(lián)網(wǎng)時代大家所說的“流量”。2024年初,我國日均Token的消耗量為1千億,截至今年6月底,日均Token消耗量已經(jīng)突破30萬億,1年半時間增長了300多倍,這反映了我國人工智能應用規(guī)模的快速增長。
劉烈宏表示,作為人工智能發(fā)展的三大核心要素之一,數(shù)據(jù)在推動“人工智能+”過程中發(fā)揮著關(guān)鍵作用,特別是高質(zhì)量數(shù)據(jù)集的建設至關(guān)重要,比如在醫(yī)療健康領(lǐng)域,通過標注的醫(yī)學影像高質(zhì)量數(shù)據(jù)集,模型的疾病診斷準確率可以提升15%以上。
據(jù)了解,國家數(shù)據(jù)局持續(xù)推進高質(zhì)量數(shù)據(jù)集建設工作。截至今年6月底,我國已經(jīng)建設高質(zhì)量數(shù)據(jù)集超過3.5萬個,總體量超過了400PB(1PB可存儲約5億張2MB大小的高清照片,400PB的總量相當于中國國家圖書館數(shù)字資源總量的140倍左右)。人工智能模型的訓練也推動了數(shù)據(jù)交易需求的攀升,截至今年6月底,各地高質(zhì)量數(shù)據(jù)集累計交易額近40億元,數(shù)據(jù)交易機構(gòu)掛牌的高質(zhì)量數(shù)據(jù)集總規(guī)模達到了246PB。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...