PANewsは3月8日、SlowMistのCISOである23padsがXプラットフォームに関する記事を公開したと報じました。記事では、PinchBenchベンチマークテストがOpenClawエージェントタスクにおけるAI大規模言語モデルの性能を評価していると述べられています。結果によると、OpenClawタスクの処理において、Gemini 3 Flashが95.1%の成功率でトップに立ち、minimax-m2.1とkimi-k2.5がそれぞれ93.6%と93.4%で2位と3位につけています。Claude Sonnet 4.5は92.7%、GPT-4oは85.2%を達成しています。
OpenClaw プロキシ タスク評価: Gemini 3 Flash 成功率 95.1%、GPT-4o 85.2%。
共有先:
著者:PA一线
この内容は市場情報の提供のみを目的としており、投資助言を構成しません。
PANews公式アカウントをフォローして、強気・弱気相場を一緒に乗り越えましょう
おすすめ記事

