智譜AI發布視覺編碼模型GLM-5V-Turbo

robot
摘要生成中

ME 新聞訊息,4 月 2 日(UTC+8),智譜 AI 近日發布了新一代基礎模型 GLM-5V-Turbo;該模型旨在彌合視覺感知與軟體工程之間的差距。與僅依賴文字提示的標準大型語言模型不同,GLM-5V-Turbo 原生支援處理設計稿、截圖等視覺輸入,並被定位為「視覺編碼模型」。據文中觀點,該模型具備原生多模態編碼能力,能夠理解圖像、影片、設計稿和文件版面等多種輸入,並在視覺與編程能力的平衡方面,于核心基準測試中取得了領先表現。(來源:InFoQ)

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言