3月15日,OpenAI推出GPT4,進(jìn)一步更新的AI能力,引發(fā)大模型的海嘯狂飆。
當(dāng)大多數(shù)人談大模型時,往往會從技術(shù)視角去預(yù)設(shè)未來的可能性,甚至引發(fā)文明是否將從碳基文明轉(zhuǎn)向硅基文明的大討論。
不過隨著討論的深入,就會發(fā)現(xiàn)大模型也是按照人類學(xué)習(xí)語言的模式進(jìn)行發(fā)展的。不同角度、不同視野下,能否穿透大模型百家狂飆的海嘯,找到技術(shù)風(fēng)暴中的踏浪點,決定了企業(yè)能否抓住甚至引領(lǐng)開拓大模型的無限可能性。
5月6日,科大訊飛在安徽合肥發(fā)布星火認(rèn)知大模型�?拼笥嶏w董事長劉慶峰、研究院院長劉聰現(xiàn)場實測大模型七大核心能力,并發(fā)布教育、辦公、汽車、數(shù)字員工四大行業(yè)應(yīng)用成果。
在這場發(fā)布會上,從技術(shù)到落地,科大訊飛由內(nèi)向外展示了中國企業(yè)探索大模型的自信力。
厚積薄發(fā)的技術(shù)必然性
對于大模型的出現(xiàn),人們常常喜歡用暴力美學(xué)來形容誕生于“大數(shù)據(jù)+大算力+強(qiáng)算法”的范式主義。
但是技術(shù)的暴力美學(xué)僅僅只是大模型智慧涌現(xiàn)的結(jié)果,所謂暴力美學(xué)的實現(xiàn),核心是建立在確定的方向和長期的技術(shù)投入中。從這個角度來看,發(fā)布引領(lǐng)行業(yè)的AI大模型,一定程度上是科大訊飛技術(shù)發(fā)展的必然。
通常來說,人工智能大致可以分為:感知智能、認(rèn)知智能、運動智能三個階段,分別對應(yīng)的能力是:聽說能力、推演學(xué)習(xí)、智能執(zhí)行。
不妨來看看科大訊飛如何走過這三個發(fā)展階段。時間回到2011年,彼時科大訊飛提出讓機(jī)器人像人一樣能說會聽,同時承建了語音及語言信息處理國家工程實驗室。
當(dāng)時看起來不大不小的一件事,為今天星火認(rèn)知大模型打下感知智能的基礎(chǔ)條件。
有了感知智能的基礎(chǔ),2014年科大訊飛又推出“訊飛超腦計劃”,明確提出:讓機(jī)器人像人一樣能理解會思考,成為科大訊飛踏入人工智能第二階段的開端。
作為認(rèn)知智能階段的技術(shù)雛形,訊飛超腦發(fā)布之初,就選擇使用深度神經(jīng)網(wǎng)絡(luò)、大數(shù)據(jù)和漣漪效應(yīng)三大技術(shù)路徑。其中深度神經(jīng)網(wǎng)絡(luò)是當(dāng)前各類大模型AI算法的基礎(chǔ),大數(shù)據(jù)和漣漪效應(yīng)后來不斷發(fā)展為數(shù)據(jù)標(biāo)注、無監(jiān)督學(xué)習(xí)等大模型AI的必備技術(shù)。
2022年,科大訊飛又推出“訊飛超腦2030計劃”,提出讓懂知識、善學(xué)習(xí)、能進(jìn)化的通用人工智能技術(shù)成為每個人未來發(fā)展的重要機(jī)會。
按照規(guī)劃,在2023年—2025年的項目中期,訊飛將在此前軟硬一體機(jī)器人的形態(tài)基礎(chǔ)上推出能夠自適應(yīng)行走的外骨骼機(jī)器人與家庭服務(wù)機(jī)器人。
這類產(chǎn)品在形態(tài)逐漸接近人形,能夠模仿人類完成更多工作,實現(xiàn)更多的智能執(zhí)行能力,為人工智能第三階段的產(chǎn)品爆發(fā)積蓄實力。
技術(shù)路徑的選擇規(guī)劃僅僅只是方向,想要出成果,還需要長期的資源投入。在基礎(chǔ)硬件資源儲備方面,得益于訊飛超腦的訓(xùn)練,在大模型浪潮來臨前,科大訊飛就已經(jīng)布局了長期算力儲備。
同時位于合肥總部的科大訊飛數(shù)據(jù)中心,在工程技術(shù)方面能實現(xiàn)百億參數(shù)大模型推理效率的近千倍加速。這也是使其大模型能夠真正落地,并快速實現(xiàn)規(guī)�;瘧�(yīng)用的基礎(chǔ)。
技術(shù)儲備的扎實力,來自于科大訊飛真金白銀投入。
數(shù)據(jù)顯示,在去年,科大訊飛用于研發(fā)上的投入高達(dá)33.6億元,同比提升14.28%,研發(fā)投入占營收的比例為17.83%。一年的投入只是冰山一角,得益于長期大手筆資源投入的積累,早在2021年科大訊飛就已經(jīng)在全球126個國家拿下3234項獨家專利。
科大訊飛還摘獲了一系列與大模型技術(shù)相關(guān)的獎項,包括但不限于:世界頂級人工智能挑戰(zhàn)賽Open Graph Benchmark(OGB)、常識推理挑戰(zhàn)賽CommonsenseQA 2.0、國際語義評測大賽(The 16th International Workshop on Semantic Evaluation, SemEval 2022)、國際口語機(jī)器翻譯評測比賽(IWSLT)……
技術(shù)積累只是AI底座,如何將這些技術(shù)能力全面發(fā)揮出來,在于系統(tǒng)主義的工程方法論。
正如科大訊飛董事長劉慶峰所說:“我們要向OpenAI致敬和學(xué)習(xí),同時也要快速追趕并努力超越,而這需要一套科學(xué)系統(tǒng)的評測體系。”
作為人工智能“國家隊”之一,科大訊飛通過認(rèn)知智能全國重點實驗室牽頭設(shè)計了通用認(rèn)知大模型評測體系,并與中科院人工智能產(chǎn)學(xué)研創(chuàng)新聯(lián)盟和長三角人工智能產(chǎn)業(yè)鏈聯(lián)盟共同探討形成了覆蓋7大類481個細(xì)分任務(wù)類型。
得益于技術(shù)底座的實力和工程方法論的系統(tǒng)能力,據(jù)了解,在文本生成和數(shù)學(xué)能力上,星火認(rèn)知大模型已經(jīng)國內(nèi)顯著領(lǐng)先,且相比ChatGPT也具有一定優(yōu)勢;在語言理解和知識問答方面也達(dá)到接近ChatGPT水平,處于國內(nèi)領(lǐng)先水平。
厚積薄發(fā)的技術(shù)能力,也讓整場發(fā)布會底氣十足。不僅AI演示現(xiàn)場實測互動,同時科大訊飛公布大模型年內(nèi)三次升級時間點,10月底將整體趕超ChatGPT。后續(xù)還將聯(lián)合開發(fā)者推動大模型應(yīng)用落地,共建人工智能“星火”生態(tài)。
富有節(jié)奏感的進(jìn)度表背后,正是科大訊飛進(jìn)擊人工智能新賽道的決心與恒心。
面向未來的人本主義
在這樣一個巨變的時代,面對AI技術(shù)大爆炸的科技周期,科大訊飛正在用自己的技術(shù)積累,成長為推動中國大模型生長的重要引擎。
當(dāng)大模型的科技浪潮來臨,,雖然先進(jìn)的技術(shù)往往是改造一切的起點,但這場變革不僅僅只是技術(shù)的,同時也是社會的、商業(yè)的和人文的,最終更強(qiáng)調(diào)的是以人為中心,多場景下的智慧涌現(xiàn)。
因此,在發(fā)布會上,圍繞星火大模型,科大訊飛帶來了更多的生態(tài)場景建設(shè)和開放賦能的落地能力。
在場景建設(shè)方面,生態(tài)的共建,往往來自于組織者的引領(lǐng)能力。
作為“星火”生態(tài)的主導(dǎo)者,一場圍繞自身生態(tài)產(chǎn)品的大模型落地場景率先在發(fā)布會上亮相。首先在教育領(lǐng)域,“大模型+AI學(xué)習(xí)機(jī)”,讓AI像老師一樣批改作文,像口語老師一樣實景對話。
相比于傳統(tǒng)學(xué)習(xí)機(jī)只能針對字詞標(biāo)點糾錯、識別句式修辭錯誤這些基礎(chǔ)批改,訊飛AI學(xué)習(xí)機(jī)可以圍繞寫作要求分析全篇結(jié)構(gòu)和文采,實現(xiàn)深度高階批改。在口語對話方面,陪伴式對話練習(xí),幫助孩子擺脫啞巴英語,提升口語表達(dá)能力。
在辦公行業(yè),“大模型+智能辦公本”,針對口語稿閱讀困難、紀(jì)要整理耗費精力、已有素材難成稿、長篇章難抓要點等痛點,搭載大模型技術(shù)的訊飛智能辦公本可以輕松將一篇語音轉(zhuǎn)寫文稿規(guī)整成書面化內(nèi)容,使用戶的閱讀效率提升50%。
“大模型+訊飛聽見”,輸入音頻錄音后,除了能夠?qū)崿F(xiàn)語音轉(zhuǎn)文字外,訊飛聽見還能通過AI分析文字內(nèi)容,一鍵生成全文摘要、宣傳稿件等多種文本。還可以針對原文件內(nèi)容,進(jìn)行AI對話提問溯源。
此外還有訊飛智能錄音筆、訊飛智能麥克風(fēng)等辦公產(chǎn)品結(jié)合星火大模型的相關(guān)功能也在快速落地中,推動智慧辦公邁入全新階段。
結(jié)合已有的硬件生態(tài)落地大模型應(yīng)用,只是圍繞星火認(rèn)知大模型“1+N”架構(gòu)中的一部分。
在外部合作領(lǐng)域,科大訊飛還發(fā)布了大模型在汽車、數(shù)字員工等多個方向的行業(yè)應(yīng)用成果。“大模型+智能座艙”,實現(xiàn)車內(nèi)跨業(yè)務(wù)、跨場景人車自由交流;“大模型+數(shù)字員工”,幫助企業(yè)員工完成大量重復(fù)性工作。
除了上述領(lǐng)域外,未來訊飛星火認(rèn)知大模型還將賦能包括醫(yī)療、城市、政法、工業(yè)等在內(nèi)的更多行業(yè),滿足更多專業(yè)領(lǐng)域的需求,向更廣闊的產(chǎn)業(yè)領(lǐng)域延伸。
正如訊飛董事長劉慶峰所強(qiáng)調(diào)的:“今天要看一個大模型系統(tǒng)到底好不好,首先要看它是不是能解決剛需、是不是真的有用,而不是一個簡單的單點測試。”
技術(shù)上的長期主義和產(chǎn)品上的以人為本,正在成為科大訊飛在大模型賽道上越跑越快的自信力。
未來,科大訊飛計劃將這種自信力,通過能力開放、插件開放、行業(yè)共創(chuàng),傳遞給更多的企業(yè)。
科大訊飛認(rèn)為,人工智能的發(fā)展絕不是單個企業(yè)和單個科研機(jī)構(gòu)的事情,而是需要大家合作共贏的。
首批來自36個行業(yè)的3000余家企業(yè)開發(fā)者將接入星火大模型,進(jìn)一步推動科大訊飛聯(lián)合各行業(yè)合作伙伴共建大模型“星火”生態(tài),與生態(tài)伙伴一起,燎原新一輪產(chǎn)業(yè)變革。
接下來,科大訊飛還將進(jìn)一步在智慧教育、智慧辦公、智慧城市、智慧醫(yī)療等領(lǐng)域推動大模型應(yīng)用場景落地,并且將一個個單點技術(shù)集合起來形成平臺,持續(xù)讓更多企業(yè)、用戶受益。
顯然能夠引領(lǐng)大模型的企業(yè),一定不能僅僅去崇拜現(xiàn)有的技術(shù),而是要突破現(xiàn)有的技術(shù),建立自己的AI生態(tài)。只有堅信自己的技術(shù)路線,關(guān)注用戶的痛點,不斷自我更新,才能見到效果。
正是長期堅定AI賽道,堅定布局、踏實前進(jìn)、長期主義,科大訊飛才可以快速打造出技術(shù)實力領(lǐng)先的國產(chǎn)大模型,并邁出了“在中國率先實現(xiàn)智慧涌現(xiàn)”這一堅實的步伐。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...