OpenAIは、AIのインターネット検索能力に挑戦する高難易度ベンチマーク「BrowseComp」を発表した。 | PANews

OpenAIは、AIのインターネット検索能力に挑戦する高難易度ベンチマーク「BrowseComp」を発表した。

PANewsは4月11日、OpenAIがインターネット上で入手困難な情報を見つけるAIエージェントの能力を評価するための新しいベンチマークテスト「BrowseComp」をオープンソース化したと報じた。このテストには極めて難しい問題が1,266問含まれており、複雑な情報ネットワークにおけるAIの「オンライン宝探し」をシミュレートするように設計されており、答えを見つけるのは難しいが検証は簡単であることを強調している。テストの問題は、映画やテレビ、テクノロジー、歴史など複数の分野をカバーしており、SimpleQA などの既存のテストよりも大幅に難易度が高くなっています。

AIGC オープンコミュニティによると、このテストベンチマークは非常に困難です。 OpenAI独自のGPT-4oとGPT-4.5ですら正解率はわずか0.6%と0.9%と、ほぼ0です。ブラウザ機能付きのGPT-4oを使っても、正解率はわずか1.9%です。しかし、OpenAI の最新のエージェントモデルである Deep Research の精度は 51.5% です。

原文リンク

共有先：

著者：PA一线

この内容は市場情報の提供のみを目的としており、投資助言を構成しません。

PANews公式アカウントをフォローして、強気・弱気相場を一緒に乗り越えましょう

PANews WeChatグループ

Telegram交流グループ

Telegram情報チャンネル

おすすめ記事

PA一线

3 時間前

AIモデル集約プラットフォームのOpenRouterは、CapitalGが主導するシリーズB資金調達ラウンドで1億1300万ドルを調達した。

PA一线

3 時間前

仮想通貨企業が支援する複数の政治活動委員会（PAC）が、テキサス州のいくつかの重要な予備選挙に資金を集中させている。

PA一线

4 時間前

TeraWulfの株価は、ケンタッキー州に1GW規模のAIデータセンターを建設する計画を発表した後、13%急騰した。

PA一线

4 時間前

HYPEの大口投資家は10倍のロングポジションを建て、同時にZEC契約に多額の投資を行った。

PA一线

4 時間前

ハイパーリキッドのアドレスが20日間以上マイクロン株を買い持ちしていた場合、約620万ドルの含み益が発生する。

PA一线

6 時間前

HYPE株の大手空売り投資家が1時間前に空売りポジションを決済し、約700万ドルの損失を被った。

関連トピック

先駆者の視点：暗号通貨業界の有名人のインタビュー

暗号通貨業界の有名人との単独インタビューを通じて、ユニークな観察と洞察を共有します。

158件の記事

暗号化されたプライバシー保護の再浮上：極端な方法で不可欠な要素

暗号通貨のプライバシーは急激な認識の変化を経験しており、ニッチ市場の周辺部から抜け出し、根本的で不可欠なインフラ要素として急速に位置づけられています。

80件の記事

パブリックチェーンの王様: イーサリアム

イーサリアムは、スマートコントラクト機能を備えたオープンソースのパブリックブロックチェーンプラットフォームです。ピアツーピア契約を処理するために、専用の暗号通貨 ETH を通じて分散型仮想マシン (EVM) を提供します。

63件の記事

人気検索:ビットコインイーサリアムステーブルコイン予測市場トランプ RWA USDT DeFi AI 連邦準備制度理事会議長

人気記事

2026算力研报：当AI Agent成为DePIN的最大买家，机会藏在哪里？

Go2Mars的Web3研究

PAデイリーニュース｜アリペイがAIウォレットとトークンペイをローンチ、同社のAI決済は汎用インテリジェントエージェントフレームワークの95％をサポート。ブルームバーグ：ビットコインのボラティリティが9カ月ぶりの低水準に低下、仮想通貨市場は小休止状態に入る。

Unitree RoboticsのIPOカウントダウンが始まりました！「初のヒューマノイドロボット株」の目論見書の複雑さを解き明かします。

高度なリソグラフィ装置を持たずに、ファーウェイはどのようにしてハイエンドチップ市場で突破口を開くことができたのか？ファーウェイの「タオ（τ）の法則」とは何なのか？

Galxe：一家 Quest 平台，如何演变成 Web3 的增长基础设施

業界ニュース

市場ホットスポット

厳選読み物

購読をクリック

PANewsアプリ

24時間ブロックチェーン業界情報を追跡し、深掘り記事を解析。

PANewsアプリをダウンロード

App Store Google Play

金現物価格が4,500ドルを下回る

PANews 速報1 時間前