OpenAIはGDPvalを発表し、AIの経済価値タスクのパフォーマンスを評価します。

PANews 9月26日の報道によると、OpenAIは新しい評価ツールGDPvalを発表しました。これは、AIの現実世界の経済価値に関するタスクにおけるパフォーマンスを測定することに焦点を当てています。GDPvalは、アメリカのGDPに最も貢献している9つの業界の44の職業をカバーしており、タスクは平均14年の経験を持つ業界専門家によって設計されています。評価結果は、Claude Opus 4.1モデルの出力のほぼ半分が専門家のレベルに匹敵するか、それ以上であることを示しています。OpenAIは、今後GDPvalの評価範囲と詳細を拡張し続けると述べています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
関連トピック
#
ai
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)