日本亚洲欧美高清专区vr专区,免费观看黄a一级视频
首頁(yè) > 資訊 > 數(shù)字化

王小川旗下百川智能發(fā)布 Baichuan-13B AI 大模型,號(hào)稱“130 億參數(shù)開源可商用”

2023/07/11 18:15      IT之家


  王小川旗下百川智能今日發(fā)布 Baichuan-13B 大模型,號(hào)稱“130 億參數(shù)開源可商用”。

  據(jù)官方介紹,Baichuan-13B 是由百川智能繼 Baichuan-7B 之后開發(fā)的包含 130 億參數(shù)的開源可商用的大規(guī)模語(yǔ)言模型,在中英文 Benchmark 上均取得同尺寸模型中最好的效果。本次發(fā)布包含有預(yù)訓(xùn)練 (Baichuan-13B-Base) 和對(duì)齊 (Baichuan-13B-Chat) 兩個(gè)版本。

  官方宣稱,Baichuan-13B 有如下幾個(gè)特點(diǎn):

  更大尺寸、更多數(shù)據(jù):Baichuan-13B 在 Baichuan-7B 的基礎(chǔ)上進(jìn)一步擴(kuò)大參數(shù)量到 130 億,并且在高質(zhì)量的語(yǔ)料上訓(xùn)練了 1.4 萬(wàn)億 tokens,超過(guò) LLaMA-13B40%,是當(dāng)前開源 13B 尺寸下訓(xùn)練數(shù)據(jù)量最多的模型。支持中英雙語(yǔ),使用 ALiBi 位置編碼,上下文窗口長(zhǎng)度為 4096。

  同時(shí)開源預(yù)訓(xùn)練和對(duì)齊模型:預(yù)訓(xùn)練模型是適用開發(fā)者的『 基座 』,而廣大普通用戶對(duì)有對(duì)話功能的對(duì)齊模型具有更強(qiáng)的需求。因此項(xiàng)目中同時(shí)具有對(duì)齊模型(Baichuan-13B-Chat),具有很強(qiáng)的對(duì)話能力,開箱即用,幾行代碼即可簡(jiǎn)單地部署。

  更高效的推理:為了支持更廣大用戶的使用,項(xiàng)目中同時(shí)開源了 int8 和 int4 的量化版本,相對(duì)非量化版本在幾乎沒(méi)有效果損失的情況下大大降低了部署的機(jī)器資源門檻,可以部署在如英偉達(dá) RTX3090 這樣的消費(fèi)級(jí)顯卡上。

  開源免費(fèi)可商用:Baichuan-13B 不僅對(duì)學(xué)術(shù)研究完全開放,開發(fā)者也僅需郵件申請(qǐng)并獲得官方商用許可后,即可以免費(fèi)商用。

  目前該模型已經(jīng)在 HuggingFace、GitHub、Model Scope 公布,感興趣的 IT之家小伙伴們可以前往了解。

IT產(chǎn)業(yè)網(wǎng)微信二維碼logo

  榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報(bào)生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復(fù)制
標(biāo)題鏈接已成功復(fù)制

最新新聞

熱門新聞