位元組跳動和USTC聯合提出了DocPedia，一個大型多模式文檔模型

2023-12-05 06:58:18

位元組跳動與中國科學技術大學聯合開發的多模態文檔模型DocPedia成功突破解析度極限，達到2560×2560的高解析度，而LLaVA、MiniGPT-4等業界先進的多模態大型模型則以336×336的解析度處理圖像，無法解析高解析度文檔圖像。其結果是，研究團隊採用了一種新的方法來解決現有模型在解析高解析度文檔圖像方面的缺點。

據說DocPedia不僅可以準確識別圖像資訊，還可以調用知識庫根據使用者需求回答問題，展示了理解高解析度多模態文檔的能力。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

讚賞
點讚
留言
轉發
分享

留言

0/400

暫無留言

WendyCS

熱門話題查看更多
#逆勢上漲幣種推薦
3.03萬熱度
#美聯儲會議紀要將公佈
2.63萬熱度
#比特幣行情觀察
2.7萬熱度
#SEC與CFTC恢復運作
1330 熱度
#美國結束政府停擺
3.43萬熱度

熱門 Gate Fun查看更多

1
omdoraomdora
市值:$3775.86持有人數:1
0.00%
2
BOBSBOBS
市值:$3772.41持有人數:1
0.00%
3
GMGM
市值:$3765.51持有人數:1
0.00%
4
CHTCharts
市值:$3758.62持有人數:1
0.00%
5
GoatGoat
市值:$3748.27持有人數:1
0.00%