最近最熱門(mén)的生成式AI模型應(yīng)用要屬ChatGPT了,一款由OpenAI開(kāi)發(fā)的聊天機(jī)器人。
當(dāng)前,ChatGPT Plus用戶可以使用GPT-4,這是一種大型多模態(tài)模型(LMM),可以接受圖像和文本輸入并生成文本輸出。2023年3月23日,OpenAI推出了ChatGPT插件,這意味著ChatGPT現(xiàn)在可以訪問(wèn)某些第三方源和數(shù)據(jù)庫(kù)。
ChatGPT即Chat(基于對(duì)話的) G (生成的) P (預(yù)訓(xùn)練的) T (轉(zhuǎn)換的),它通過(guò)強(qiáng)化學(xué)習(xí)人類(lèi)反饋來(lái)進(jìn)行微調(diào),ChatGPT經(jīng)過(guò)人類(lèi)偏好的獎(jiǎng)勵(lì)模型訓(xùn)練,使輸出內(nèi)容更人性化,并盡量避免編造事實(shí)。
ChatGPT最初是作為一個(gè)大型語(yǔ)言模型(LLM)創(chuàng)建的,經(jīng)過(guò)發(fā)展已經(jīng)成為了一個(gè)大型的多模態(tài)生成AI應(yīng)用程序。
“大”代表的是模型所基于的數(shù)據(jù)量,以及模型本身的大小。例如,當(dāng)它在2022年發(fā)布時(shí),ChatGPT有1750億個(gè)參數(shù)(一個(gè)控制機(jī)器學(xué)習(xí)模型行為的值——參數(shù)越大,模型的分析能力就越強(qiáng))。它最初使用超過(guò)100萬(wàn)個(gè)數(shù)據(jù)集或5000億個(gè)標(biāo)記(單詞或單詞片段)進(jìn)行訓(xùn)練,包括來(lái)自維基百科和紐約時(shí)報(bào)的標(biāo)記。從這個(gè)角度來(lái)看,人類(lèi)平均一生會(huì)說(shuō)8.603億個(gè)單詞,這個(gè)集合——即人工智能術(shù)語(yǔ)中的“語(yǔ)料庫(kù)”——相當(dāng)于300年的語(yǔ)言價(jià)值。
ChatGPT的基本版本沒(méi)有連接到互聯(lián)網(wǎng),并且直到2021年9月都在接受材料培訓(xùn),這意味著它的知識(shí)不是最新的。向少數(shù)高級(jí)開(kāi)發(fā)者發(fā)布的較新的產(chǎn)品,例如必應(yīng)搜索引擎的插件,可以連接到互聯(lián)網(wǎng)并包含最新的內(nèi)容。
根據(jù)OpenAI的說(shuō)法,盡管GPT-4仍然不完全可靠,但與其前身GPT-3.5相比,它在處理細(xì)微指令方面的能力要高得多。最重要的是,它在模擬司法考試中以前10%的成績(jī)通過(guò)了考試。相比之下,GPT-3.5在同樣的模擬考試中得分倒數(shù)10%。OpenAI指出,它的局限性類(lèi)似于早期的GPT模型,對(duì)事實(shí)產(chǎn)生幻覺(jué)并產(chǎn)生推理錯(cuò)誤。
ChatGPT的人氣迅速上升,部分原因是即使沒(méi)有技術(shù)背景也可以使用它。它的用戶快速增長(zhǎng),是人們渴望使用這項(xiàng)技術(shù)的一個(gè)標(biāo)志,使用的用戶越多,其底層人工智能能得到的訓(xùn)練就越好。
ChatGPT有潛力以前所未有的速度和極高的效率應(yīng)用于IT、審計(jì)、人力資源、運(yùn)營(yíng)和更多業(yè)務(wù)功能領(lǐng)域,但它們并不意味著沒(méi)有風(fēng)險(xiǎn)的。
生成式AI的內(nèi)部風(fēng)險(xiǎn)及思考
首先是保密信息泄露的風(fēng)險(xiǎn)。許多生成式人工智能模型的建立是為了吸收用戶輸入的數(shù)據(jù),并隨著時(shí)間的推移改進(jìn)底層模型,其本質(zhì)上是幫助它們學(xué)習(xí)和構(gòu)建知識(shí)。同時(shí),再將這些數(shù)據(jù)用來(lái)回答其他人的提問(wèn),這有可能會(huì)將私人或?qū)S行畔⒈┞督o公眾。作為企業(yè)而言,使用這種技術(shù)越多,其他人就越有可能了解企業(yè)的敏感或機(jī)密信息。因此,企業(yè)需要了解如何在保護(hù)其隱私的同時(shí)享受生成式人工智能應(yīng)用程序的好處。
其次是員工誤用以及虛假信息。如果生成AI內(nèi)容使用的信息不準(zhǔn)確,這可能會(huì)影響公司的業(yè)務(wù)結(jié)果或產(chǎn)生責(zé)任問(wèn)題。ChatGPT可能生成虛假的信息,在這一點(diǎn)上,OpenAI的開(kāi)發(fā)人員承認(rèn)這是其持續(xù)存在的缺點(diǎn)。該技術(shù)也可能會(huì)產(chǎn)生敏感信息,如個(gè)人數(shù)據(jù),這些信息可能被用于身份盜竊或侵犯?jìng)(gè)人隱私。
再次,是生成式AI的持續(xù)發(fā)展所帶來(lái)的合規(guī)挑戰(zhàn)。隨著世界對(duì)人工智能的理解不斷發(fā)展,全球越來(lái)越多的國(guó)家及組織制定法律法規(guī)。即使不打算有意使用生成AI,企業(yè)也必須及時(shí)了解這些內(nèi)容。畢馬威預(yù)計(jì)生成式人工智能將繼續(xù)集成到許多常見(jiàn)的應(yīng)用程序、系統(tǒng)和流程中,從互聯(lián)網(wǎng)瀏覽器到企業(yè)可能授權(quán)的人工智能連接技術(shù)。因此,關(guān)鍵是要保持警惕,確保不會(huì)以違反相關(guān)法律法規(guī)、客戶協(xié)議或?qū)I(yè)標(biāo)準(zhǔn)的方式使用人工智能。
最后,是關(guān)于人才的挑戰(zhàn)。在一個(gè)可生成的未來(lái),專(zhuān)業(yè)人員的角色將從解決問(wèn)題轉(zhuǎn)變?yōu)槎x問(wèn)題,因?yàn)閳F(tuán)隊(duì)要與機(jī)器一起工作,創(chuàng)造新的方法。因此,高質(zhì)量的專(zhuān)業(yè)人員輸入才能有高質(zhì)量的方案產(chǎn)出。
生成式AI的外部風(fēng)險(xiǎn)及思考
對(duì)于外部風(fēng)險(xiǎn),首先是錯(cuò)誤信息、偏見(jiàn)和歧視。生成式AI可以——并且已經(jīng)——被用來(lái)創(chuàng)建深度偽造的圖像和視頻(當(dāng)視覺(jué)內(nèi)容被改變,使其看起來(lái)像是某人說(shuō)了或做了他們沒(méi)有做或說(shuō)的事情)。這些圖像和視頻通常看起來(lái)非常逼真,并且在編輯后的數(shù)字媒體中沒(méi)有留下偽造痕跡,這使得人類(lèi)甚至機(jī)器都很難檢測(cè)到它們。
其次是版權(quán)問(wèn)題,一旦內(nèi)容通過(guò)生成式AI應(yīng)用程序運(yùn)行,誰(shuí)擁有內(nèi)容的版權(quán)問(wèn)題比比皆是,而且沒(méi)有一個(gè)放之四海而皆準(zhǔn)的答案。如果內(nèi)容是剪切和粘貼的,或者基本上沒(méi)有改變版權(quán)文本,這可能被認(rèn)為是抄襲。很難確切地說(shuō),通過(guò)生成AI工具獲得的信息需要改變多少才能合法地稱為你自己的信息。
第三是財(cái)務(wù)、品牌和聲譽(yù)風(fēng)險(xiǎn)。如果將人工智能生成的信息或代碼復(fù)制到任何可交付產(chǎn)品或產(chǎn)品中,可能構(gòu)成版權(quán)或其他知識(shí)產(chǎn)權(quán)侵權(quán),會(huì)給企業(yè)帶來(lái)法律和聲譽(yù)上的損害。同時(shí),缺乏培訓(xùn)和對(duì)這些工具缺乏理解的用戶可能會(huì)無(wú)意中將知識(shí)產(chǎn)權(quán)或商業(yè)秘密暴露給公眾甚至競(jìng)爭(zhēng)對(duì)手,這可能會(huì)導(dǎo)致訴訟。
第四是網(wǎng)絡(luò)安全風(fēng)險(xiǎn)。網(wǎng)絡(luò)犯罪分子可以使用生成式AI來(lái)創(chuàng)建更逼真、更復(fù)雜的網(wǎng)絡(luò)釣魚(yú)騙局或憑據(jù)來(lái)入侵系統(tǒng)。此外,人工智能算法無(wú)法保護(hù)其底層訓(xùn)練數(shù)據(jù)集。研究表明,即使數(shù)據(jù)被匿名化和清除,算法也可以區(qū)分個(gè)人的身份。其他生成式AI網(wǎng)絡(luò)安全風(fēng)險(xiǎn)包括數(shù)據(jù)中毒,其中包括用于訓(xùn)練模型的數(shù)據(jù)被操縱,以及對(duì)抗性攻擊——試圖通過(guò)向生成式人工智能模型提供惡意輸入來(lái)欺騙它們。
最后是敵對(duì)攻擊。即使經(jīng)過(guò)訓(xùn)練,在可接受的范圍內(nèi)工作,生成式AI模型也被證明是脆弱的,就像任何分析模型一樣,容易受到老練的外部用戶的蓄意操縱。如果企業(yè)計(jì)劃使用生成式AI解決方案,就需要意識(shí)到,當(dāng)解決方案向公眾公開(kāi)時(shí),這種情況可能就會(huì)出現(xiàn)。
生成式AI的未來(lái)應(yīng)用方向
軟件開(kāi)發(fā)及維護(hù)。生成式AI在軟件開(kāi)發(fā)過(guò)程中正在顯示出巨大的潛力,有機(jī)會(huì)更快地提供更可靠的軟件產(chǎn)品和服務(wù),企業(yè)能夠?qū)崿F(xiàn)代碼自動(dòng)化生成、維護(hù)和修復(fù)錯(cuò)誤等。
視頻和虛擬現(xiàn)實(shí)創(chuàng)作。生成式AI可以為電商網(wǎng)站創(chuàng)建沉浸式視頻游戲環(huán)境,設(shè)計(jì)視頻,甚至提供個(gè)性化產(chǎn)品視頻。未來(lái),公司可以將其用于虛擬助手或直播應(yīng)用,例如自動(dòng)為直播視頻添加字幕。該領(lǐng)域的許多公司現(xiàn)在正將重點(diǎn)轉(zhuǎn)向企業(yè)客戶。
元宇宙建設(shè)。在虛擬世界中創(chuàng)建逼真的3D資產(chǎn)既昂貴又耗時(shí),生成式AI可以通過(guò)文本、圖像或語(yǔ)音生成3D資產(chǎn),也可以基于2D圖片生成3D場(chǎng)景,甚至可以生成聲音效果,還可以生成人臉,并賦予虛擬化身更真實(shí)的特征。
優(yōu)化網(wǎng)絡(luò)安全。生成式AI可以教會(huì)個(gè)人某些漏洞所代表的關(guān)鍵風(fēng)險(xiǎn),幫助他們編寫(xiě)適當(dāng)?shù)哪_本或了解威脅行為者的攻擊方法。
(THE END)
原文:KPMG 編譯:智成企業(yè)研究院崔帥
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...