PANewsは9月26日、 OpenAIが現実世界の経済価値タスクにおけるAIパフォーマンスの測定に重点を置いた新しい評価ツール「GDPval」を発表したと報じた。GDPvalは、米国のGDPに最も貢献する9つの産業における44の職種をカバーしている。タスクは、平均14年の経験を持つ業界専門家によって設計された。評価結果によると、 Claude Opus 4.1モデルの出力のほぼ半数が、専門家のパフォーマンスと同等かそれ以上であることが示された。OpenAIは、今後もGDPvalの評価範囲と詳細を拡大していくと述べた。
OpenAIがAIの経済的価値タスクのパフォーマンスを評価するためのGDPvalをリリース
共有先:
著者:PA一线
この内容は市場情報の提供のみを目的としており、投資助言を構成しません。
PANews公式アカウントをフォローして、一緒に強気相場と弱気相場を乗り越えましょう
おすすめ記事
