ME 新聞訊息,4 月 2 日(UTC+8),智譜 AI 近日發布了新一代基礎模型 GLM-5V-Turbo;該模型旨在彌合視覺感知與軟體工程之間的差距。與僅依賴文字提示的標準大型語言模型不同,GLM-5V-Turbo 原生支援處理設計稿、截圖等視覺輸入,並被定位為「視覺編碼模型」。據文中觀點,該模型具備原生多模態編碼能力,能夠理解圖像、影片、設計稿和文件版面等多種輸入,並在視覺與編程能力的平衡方面,于核心基準測試中取得了領先表現。(來源:InFoQ)
智譜AI發布視覺編碼模型GLM-5V-Turbo
ME 新聞訊息,4 月 2 日(UTC+8),智譜 AI 近日發布了新一代基礎模型 GLM-5V-Turbo;該模型旨在彌合視覺感知與軟體工程之間的差距。與僅依賴文字提示的標準大型語言模型不同,GLM-5V-Turbo 原生支援處理設計稿、截圖等視覺輸入,並被定位為「視覺編碼模型」。據文中觀點,該模型具備原生多模態編碼能力,能夠理解圖像、影片、設計稿和文件版面等多種輸入,並在視覺與編程能力的平衡方面,于核心基準測試中取得了領先表現。(來源:InFoQ)