清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)于2024年12月24日發(fā)布了一篇論文,介紹推出AutoDroid-V2 AI模型。該模型在移動設(shè)備上利用小型語言模型(SLM),顯著提升了自然語言控制的自動化程度。
AutoDroid-V2采用基于腳本的方法,通過設(shè)備端的小型語言模型高效執(zhí)行用戶指令,相比依賴云端大型語言模型(LLM)的傳統(tǒng)方法,在效率、隱私和安全性方面均有顯著優(yōu)勢。該系統(tǒng)生成多步驟腳本一次性執(zhí)行多個GUI操作,大幅減少了查詢頻率和資源消耗,有效保護了用戶隱私和數(shù)據(jù)安全,并降低了服務(wù)器端成本。
基準(zhǔn)測試結(jié)果顯示,在23個移動應(yīng)用上測試226項任務(wù)時,AutoDroid-V2的任務(wù)完成率比AutoDroid、SeeClick、CogAgent和Mind2Web等基線提高了10.5%-51.7%。在資源消耗方面,輸入和輸出token消耗分別減少至原來的43.5分之一和5.8分之一,LLM推理延遲降低至5.7~13.4分之一。
此外,跨LLM測試中,AutoDroid-V2在Llama3.2-3B、Qwen2.5-7B和Llama3.1-8B上的成功率為44.6%-54.4%,反向冗余比為90.5%-93.0%。
更多詳情可參考論文《AutoDroid-V2: Boosting SLM-based GUI Agents via Code Generation》。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...