定量的観点からの AI 評価: すべての参加者が 1 未満の利益を予想している場合、人工知能がトレーダーに取って代わるまでにはどのくらい時間がかかるのでしょうか。

PANewsが6つのAI大規模モデル(Gemini-3-pro、Doubao-1.6-vision、DeepSeek V3.2、Grok 4.1、GPT-5.1、Qwen3-max)を対象に、ビットコインの取引予測能力を検証するテストを実施しました。テストは「4時間足ネイキッドローソク足」、「4時間足インジケーター付き」、「15分足ネイキッドローソク足」の3シナリオで行われ、以下のような結果が得られました。

  • 総合勝率:全モデルの平均勝率は、インジケーター使用時が38%、不使用時が30%でした。短期(15分足)の平均勝率34%は、長期(4時間足)の30%を上回りました。
  • 期待利益:すべてのモデルの長期期待利益は1を下回り、長期的には損失が発生する計算となります。
  • 各モデルの特徴
    • Doubao:インジケーター付き4時間足で勝率50%、総合リターン22.2%を記録し、最も優れたパフォーマンスを示しました。
    • DeepSeek:全シナリオで勝率が40%前後と最も安定していましたが、損益比率が低く、収益性には課題がありました。
    • Gemini:純粋なローソク足分析に強く、インジケーターなし4時間足で唯一の利益を達成しましたが、インジケーター追加により精度が低下しました。
    • Grok:非常に攻撃的でインジケーターに依存するスタイルですが、勝率は低めでした。
    • GPT:極めて慎重でポジション開設率が低く、強い悲観論的空売り傾向を示しました。
    • Qwen:最もリスク回避的でポジション開設率が低く、インジケーター付き4時間足では期待利益0.95と収益に最も近づきました。

テスト結果から、現在のAIは人間のトレーダーを完全に代替するには至っておらず、特定の分野(チャート分析、リスク管理など)で優れた「取引アシスタント」としての活用が現実的であることが示唆されています。

要約

著者: フランク、PANews

10,000 ドルが与えられた場合、どの AI に投資の管理を任せますか?

PANewsは以前、nof1.aiのAIトレーディングコンテストをレビューしました(関連記事: 6人のAI「トレーダー」が10日間の対決に挑む:トレンド、規律、そして貪欲についての公開レッスン)。しかし、nof1.aiのコンテストは特定の市場期間に限定されており、各AIモデルの最終的な取引能力は、その特定の取引期間においては十分に発揮されていないように思われます。さらに、異なる状況下におけるAIモデルの実際の予測能力を明らかにすることが急務となっています。さらに、最近、様々なAI企業が最新の大規模モデルをリリースしており、これらのモデルのランキングは現在再評価されています。

この謎を解明するため、PANewsは「AIトレーダー対決」を開催し、大規模AIモデルが市場トレンドを判断し、様々なシナリオで取引を計画する能力を理解することを目的としています。例えば、どの時間足の分析に優れているのか、指標の助けを借りることでAI予測の成功率が向上するのかなどです。

タイムラインを現在まで延長し、BinanceのBTC履歴データからランダムに100個の実際の市場データスライスを選択し、「4時間裸足ローソク足チャート」、「15分短期チャート」、「4時間フルインジケーターチャート」という3つの極端なテストシナリオを構築しました。テスト対象は、中国と米国の最高峰のコンピューティングパワーを誇る6つのプラットフォーム、Gemini-3-pro、Doubao-1.6-vision、DeepSeek V3.2、Grok 4.1、GPT-5.1、Qwen3-maxです。

このテストでは、2017年8月から現在までのBinance BTCスポット取引ペアの15分足ローソク足チャートデータと、2021年から現在までの4時間足ローソク足チャートデータを収集しました。各期間ごとに100本のローソク足の画像50枚がランダムに生成されました。4時間足チャートは、ローソク足と取引量のみと、EMA、SMA、ボリンジャーバンド、MACD、RSIなどの指標を含む2種類に分けられました。15分足ローソク足チャートはすべてネイキッドローソク足チャート(取引量付き)でした。AIには、現在のローソク足チャートに対応する特定の価格または指標データ値を同時に提供しました。すべてのAI出力結果は、こちらでご覧いただけます。

インジケーター付き4時間チャート

4時間足ローソク足チャート

テストプロセス中、各大規模モデルが取得したデータとコマンドは全く同じでした。別の観点から見ると、これはこれらの大規模モデルのマルチモーダル機能の面でもテスト対象となりました(DeepSeekはテキストベースの大規模モデルのみを搭載していたため、最終的にはデータ情報のみを受信し、画像は送信しませんでした)。

ジェミニ3:「指標」によって封印された裸の取引の王

Gemini 3は現在最も人気のあるAIモデルであり、11月18日のリリース以来のメディアレビューやテストに基づくと、入手可能な最も強力なマルチモーダルAIモデルと言えるでしょう。しかし、今回の取引予測テストでは、Gemini 3の結果は最高ではなく、平均的なものにとどまりました。3つのシナリオ(インジケーターなしの4時間チャート、インジケーターありの4時間チャート、インジケーターなしの15分チャート)において、Gemini 3はインジケーターなしの4時間チャートのシナリオで最も優れたパフォーマンスを発揮し、勝率は39.58%を達成しました。次いで、インジケーターなしの15分チャートのシナリオが34.04%でした。しかし、インジケーターあり(同じ時間枠)では、4時間の期間の精度は実際には31%に低下し、3つのシナリオの中で最悪の結果となりました。

この観点から見ると、Gemini 3は純粋なローソク足チャートパターンで優れているように見えますが、インジケーターを追加すると干渉の影響を受けやすくなります。実際の取引では、インジケーターなしの場合、Gemini 3はより積極的にポジションをオープンする傾向があります。純粋なローソク足チャートでは、Gemini 3は95%のケースで市場に参入しますが、インジケーターを追加するとこの割合は71%に低下します。また、Gemini 3は4時間足の純粋なローソク足チャートシナリオで利益を上げる唯一のモデルであることも注目に値します。

15分シナリオでは、Gemini 3は全体的に最も優れたパフォーマンスを示し、ポジション利益は合計15.34%でした。一方、インジケーターを用いたシナリオでは、実際には21.18%の損失となりました。しかし、この利益も短期的な幸運によるものです。各インスタンスの損益率データを見ると、Gemini 3の期待利益(勝率×損益率)は常に1を下回っており、長期的には損失を出している状態にあることを示しています。

DeepSeek V3.2: 堅牢な「超短期注文ブラッシングマシン」

DeepSeekは、6つのモデルの中で総合的な勝率が最も高く、また最も安定しています。3つのシナリオ(4時間足ベアローソク足チャート、インジケーター付き4時間足チャート、15分足ベアローソク足チャート)における勝率は、それぞれ40%、41.38%、42.86%でした。これは、DeepSeekの予測能力が、異なる時間枠やインジケーターの有無に関わらず、比較的安定していることを示しています。

しかし、DeepSeekの損益比率は平均1.25と低く、全体的な収益性は低い。利益確定を早める傾向は、DeepSeekが利益を伸ばす能力に欠けていることを反映している。結果として、予想利益はほぼ常に0.5%程度にとどまり、長期的な収益性に欠けている。さらに、DeepSeekはポジション保有率が低く、ポジション保有率はわずか58%と、ポジション開設の判断において比較的保守的である。

ドゥバオ:今大会の「オールラウンドMVP」

このテストでは、Doubao1.6-visionが総合的に最も優れた結果を達成しました。指標付き4時間足チャートでは、勝率50%という最高の成績を収め、最終リターンは22.2%でした。同時に、15分足の短期チャートでも総合リターン8.2%を達成しました。短期指標と4時間足指標という2つの異なる指標で、一貫して利益を上げている唯一のモデルです。

さらに、Doubao1.6-visionの成果は、比較的保守的なアプローチではなく、平均ポジション比率が92%を超えることで達成されました。つまり、Doubao1.6-visionはほとんどの状況でポジションを保有していました。しかし、相対的に見ると、Doubao1.6-visionのパフォーマンスは指標シグナルに大きく依存しており、指標の有無による総利益の差は38%に達しています。さらに、損益率データを見ると、Doubao1.6-visionはプラスリターンの両期間において比較的高い損益分岐点比率を示しており、これも全体的な優れたパフォーマンスの理由となっています。

Grok 4.1: xAIの「ラディカルギャンブラー」

Grok 4.1の全体的なスタイルは大胆ですが、インジケーターに大きく依存し、より大きな利益を追求する姿勢も持っています。3つのシナリオにおいて、Grok 4.1はインジケーター付きの4時間足週足チャートのみで34.69%の勝率を達成しました。他の2つのシナリオでの勝率は極めて低いものでした。ローソク足パターンのみの4時間足チャートでは勝率はわずか14.58%、15分足チャートでは26.53%でした。しかし、平均ポジションオープン率は98%と高く、ほぼすべてのローソク足シナリオでポジションをオープンする意欲を示しています。この観点から見ると、Grok 4.1のスタイルは、衝動を抑えられないギャンブラーのスタイルに似ています。

しかし、Grok 4.1の損益比率は平均2と非常に高く、すべてのモデルの中で最も高い数値となっています。しかしながら、Grok 4.1に資金を預けるのは賢明な選択とは言えません。

GPT 5.1: 極めて慎重な「デッドリーベア」悲観主義者

GPT 5.1の取引スタイルはGrok 4.1とは正反対です。GPT 5.1は非常に慎重で、ほとんどの場合、傍観者的な姿勢をとります。最終的に、150回のテストのうち、わずか52件の取引が実行され、平均ポジションサイズはわずか0.34%でした。

しかし、この慎重なアプローチでさえ、GPT 5.1の勝率向上には繋がりませんでした。最良のシナリオでも、勝率はわずか35%にとどまりました。さらに、4時間足や15分足チャートの後半と比較すると、GPT 5.1は長期的なエントリーポイントでの優位性が明らかに低く、テクニカル指標を用いた場合でも、4時間足での勝率はわずか27%でした。15分足では、より高い損益比率(2.02)のおかげで、最終的にプラスのリターンを達成し、9.9%に達しました。

さらに、GPT 5.1は、顕著な悲観主義と空売りへの強い傾向を特徴としています。注文の70%以上が空売りです。

質問3:リスクを回避し、言葉を簡潔にする人

Qwen 3は明らかに最も慎重な大型モデルであり、全テストでわずか44ポジションしか開設せず、ポジション開設率はわずか29%でした。しかし、GPTと同様に、この極度の慎重さは勝率の向上にはつながりませんでした。平均勝率はわずか34%で、最高のパフォーマンスはインジケーター付きの4時間チャートで達成されました。

さらに、Qwen 3は1.96という比較的高い損益率を誇っています。これは、リスク回避型のトレーダーであり、取引回数を減らしながら利益を伸ばすのに適していることを示しています。指標を用いた4時間足チャートでは、Qwen 3の期待利益は0.95と、すべてのモデルの中で最も高い水準に達し、収益性に最も近い値となっています。

データ概要

要約:

要約すると、これらの AI シミュレーションによる取引プロセスから、次のような洞察が得られたと考えられます。

まず、ほとんどのモデルにおいて、インジケーターを用いた方がローソク足チャートのみを用いるよりも信頼性が高まります。インジケーターを用いた場合、これらの6つのモデルの平均勝率は38%に達しましたが、インジケーターを用いない場合の勝率はわずか30%でした。

第二に、AIは長期取引よりも短期取引に適している可能性があります。15分足のローソク足チャートを用いたシナリオでは、主要6モデルの平均勝率は34%に達し、4時間足の30%を上回りました。6つのモデルのうち3つ(Gemini、GPT、Doubao)は利益を上げており、平均損益率は概ね良好でした。

第三に、取引をAIに完全に委ねることは推奨されません。今回のテストでは、全てのAIモデルの期待利益は1を下回りました。つまり、この勝率と損益率を長期的に見れば、最終的には全て損失に終わるということです。唯一の違いは、損失のスピードです(ただし、AIモデルは特別に調整されておらず、比較的シンプルで一般的な指標のみを使用しているため)。したがって、AIに取引を委託したい場合は、より複雑な調整プロセスとより多くのバックテストデータが必要になる可能性があります。

このコンピューティングパワー対決が終わり、最終的な口座残高を見る中で、私たちが得る最も重要な教訓は「どのモデルが最も強いか」ではなく、「AIトレーディングの限界はどこにあるのか」ということかもしれません。最終的な結論は、今日のAIはトップクラスのファンドマネージャーを直接置き換えることはできないかもしれませんが、ある分野では比較的洗練されたトレーディングアシスタントへと進化しているということです。チャート分析に優れたAIもあれば、リスク管理に優れたAIもあり、安定した勝率を達成するためのデータ分析に優れたAIもあります。しかし、AIへの期待が高まる中、トレーディングにおいてAIが人間に取って代わることができるかどうかという問題は依然として複雑です。

共有先:

著者:Frank

本記事はPANews入駐コラムニストの見解であり、PANewsの立場を代表するものではなく、法的責任を負いません。

記事及び見解は投資助言を構成しません

画像出典:Frank侵害がある場合は、著者に削除を連絡してください。

PANews公式アカウントをフォローして、一緒に強気相場と弱気相場を乗り越えましょう
おすすめ記事
25分前
39分前
1時間前
2時間前
2時間前
2時間前

人気記事

業界ニュース
市場ホットスポット
厳選読み物

厳選特集

App内阅读