微軟展示LLaVA-Med AI模型，可讀CT和X光片

2023/06/14 17:03 DoNews

　　6月14日消息，微軟研究人員日前展示了 LLaVA-Med 模型，該模型主要用于生物醫(yī)學(xué)方面的研究，可根據(jù) CT、X 光圖片等推測(cè)出患者的病理狀況。

　　據(jù)悉，微軟研究人員與一批醫(yī)院合作，獲得了使用生物醫(yī)學(xué)圖像文本對(duì)應(yīng)大型數(shù)據(jù)集來(lái)訓(xùn)練多模態(tài) AI 模型。該數(shù)據(jù)集包括胸部 X 光、MRI、組織學(xué)、病理學(xué)和 CT 圖像等，覆蓋范圍相對(duì)全面。

　　微軟使用 GPT-4，基于 Vision Transformer 和 Vicuna 語(yǔ)言模型，在八個(gè)英偉達(dá) A100 GPU 上對(duì) LLaVA-Med 進(jìn)行訓(xùn)練，其中包含“每個(gè)圖像的所有預(yù)分析信息”，用于生成有關(guān)圖像的問(wèn)答，以滿足“可自然語(yǔ)言回答有關(guān)生物醫(yī)學(xué)圖像問(wèn)題”的助手愿景。

　　在學(xué)習(xí)過(guò)程中，模型主要圍繞“描述此類(lèi)圖像的內(nèi)容”以及“闡述生物醫(yī)學(xué)概念”而展開(kāi)。據(jù)微軟稱(chēng)，該模型最終具有“出色的多模式對(duì)話能力”、“在用于回答視覺(jué)問(wèn)題的三個(gè)標(biāo)準(zhǔn)生物醫(yī)學(xué)數(shù)據(jù)集上，LLaVA-Med 在部分指標(biāo)上領(lǐng)先于業(yè)界其他先進(jìn)模型”。

　　目前該模型已經(jīng)開(kāi)源。

IT產(chǎn)業(yè)網(wǎng)微信二維碼logo

　　榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn（把#換成@）。

海報(bào)生成中...

分享到微博分享到微信一鍵復(fù)制

標(biāo)題鏈接已成功復(fù)制

微軟展示LLaVA-Med AI模型，可讀CT和X光片

最新新聞

熱門(mén)新聞

新動(dòng)態(tài)

關(guān)注度

最話題

微軟展示LLaVA-Med AI模型，可讀CT和X光片

相關(guān)閱讀

最新新聞

熱門(mén)新聞

新動(dòng)態(tài)

關(guān)注度

最話題

微軟展示LLaVA-Med AI模型，可讀CT和X光片