OpenAI發布GDPval評估AI經濟價值任務表現

PANews 9月26日消息,OpenAI推出新評估工具GDPval,專注衡量AI在現實世界經濟價值任務上的表現。GDPval覆蓋美國GDP貢獻最大的九大行業的44個職業,任務由平均14年經驗的行業專家設計。評估結果顯示,Claude Opus 4.1模型近半輸出與專家水平相當或更優。OpenAI表示,未來將持續擴展GDPval評估範圍與細節。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
相關話題
#
ai
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)