著者:長安一巴眼コンテンツチーム
天気は選挙とは違って、特定の立場を取るわけではありません。NBAとも違って、贔屓のチームもありません。しかし、まさにこの市場こそが、国内ユーザーを大量に引きつけているのです。理由は単純です。誰もが自分なりの経験を持ち、誰もが上海の天気を理解していると思っているからです。
しかし、「理解していると感じること」と「お金を稼げること」は全く別のことだ。
Biteyeは本日、以下の3つのことを共有します。
決済ルールの理解
気象予報方法を確立する
このシステムを利用して、他の人が見つけられない取引機会を見つけましょう。
まず、気象市場が実際にどのように決済を行っているのかを解明する必要がある。
1. 液体が沈殿する温度は、あなたが考えている温度とは異なります。
初めて参加する多くの人が犯す間違いは、スマートフォンの天気予報アプリを使って最高気温に賭けることです。しかし、アプリが表示する気温は上海市街地の気温であり、Polymarketは決済に上海浦東国際空港(ZSPD気象観測所)の実際の観測データを使用します。このデータは、アメリカの気象情報プラットフォームであるWundergroundを通じて公開されています。Polymarketは、決済の根拠としてWundergroundの記録を直接読み取ります。
2つの場所、2つの数字。浦東空港は市の東側、長江河口に隣接している。海風の影響を受けるため、気温は通常、市街地中心部よりも低い。この差は通常は気づかないが、賭けの重要な局面では、賭けの成否を分ける決定的な要素となり得る。
そのため、天気予報のコメント欄では、「今日は昨日より暖かく感じるのに、なぜ最高気温の表示が低いのか?」といった混乱が見られるのです。
2. 数値は正しいですが、単位が予想と異なります。
WUのデータは、空港から提出される1時間ごとのMETARレポート(世界の民間航空で使用される気象電報形式)から直接取得されています。
詳細を説明すると、METARは華氏を整数値で記録するのに対し、WUは変換や補正を行わずに数値を直接表示します。
ほとんどの天気予報システムや気象モデルは、気温を小数点以下まで表示します。モデルの計算精度が高ければ高いほど、この最も粗い詳細を見落としやすくなります。
3. 上海の気温パターン
ZSPD観測所の約1900日分のデータを分析した結果、上海における最高気温の期間は予想以上に集中していることが判明した。
四季のあらゆる現象は、午前11時から午後1時の間に集中している。
夏季の正午には濃度が最も高くなり、1時間でシーズン全体の総濃度の27.6%を占める。
秋のピーク時間はやや早く、午前10時が最も頻繁に発生する時間帯の一つです。
パターンを把握することは第一歩ですが、パターンはそれ自体では機能しません。重要なのは、日中の最高気温がいつ発生するか、すでにその気温を超えているかどうか、そして目標気温まであとどれくらいかを把握することです。
そこで私はこのシステムを構築しました。毎日の決済前に、その日の最高気温が摂氏何度になるかを可能な限り正確に予測するシステムです。
5つの方法のうち2つがうまくいき、そのうち3つが効果があった。
市場のルールが明確になったら、次の疑問は「その日の最高気温をどのように予測するか?」ということだ。
気象学に関しては全くの初心者だった私は、まずChatGPTに「気象業界では、その日の最高気温をどのように計算しているのか、また、確立された計算方法にはどのようなものがあるのか」と尋ねました。ChatGPTは理論的な枠組みを提供し、クロードはその枠組みをコードに変換しました。2つのAIは協力して、週末のうちにシステムを稼働させました。
合計5つの方法を試しましたが、うまくいったのは3つだけでした。
正常に実行されました。
1️⃣ WC + ECMWFの統合予測
最高気温を予測するにはまずデータが必要です。以下の2つの情報源を使用しました。
Weather Company (WC) は、非常に精度の高い時間ごとの予報データを提供する商用気象APIです。
ECMWFは、欧州中期予報センターが開発した全球気象モデルであり、大規模な気象システムに対してより感度が高い。
どちらの情報源にも長所と短所があるため、重み付けを行い、投票によって決定します。重みは当日の天候に応じて動的に調整されます。例えば、WCは晴天時に信頼性が高く、ECMWFは風速の強い曇天時に信頼性が高いとされています。
2️⃣ リアルタイム補正:温度上昇データを使用してピーク値を計算します
予報は昨夜算出されましたが、天気は一日中変化しています。そこで、このモジュールは、今朝既に取得された実際の測定データを使用して、今日の最高気温を推定します。
仕組みは複雑ではありません。上海の気温が最も急上昇するのは午前8時から9時の間であることが分かりました。この時間帯の気温を測定した後、システムは過去のデータ、つまり過去の同じ時間帯と季節における平均気温上昇率を照合します。
次に、2つの修正点を追加します。
雲が多いほど割引率が高くなる。雲が厚ければ厚いほど、温暖化プロセスは阻害される。
風速は熱損失を加速させるため、風速には割引率が乗じられる。「外挿推定値」が算出される。
気圧、露点、湿度も計算に含まれていましたが、バックテストの結果、これらの要因の影響は小さく、相関性も低いことが判明したため、除外されました。
しかし、外挿だけでは安定性に欠けます。そこで、カルマンゲインという概念を用います。これは、外挿結果と元の予測値との加重平均です。さらに、この重みは時間とともに自動的に変化します。
午前6時の時点では、外挿による予測はわずか20%に過ぎず、大部分は依然として予測に基づいていた。
正午までに、外部からの紹介が全体の72%を占めた。
午後1時以降は、実際の測定値のほぼすべてが承認され、その割合は85%に達した。
時期が遅くなればなるほど、現在起こっている出来事の重要性は増し、時期が早ければ早いほど、過去の予測の参考価値は高くなる。
午後2時以降、システムはピークが過ぎた可能性が高いと判断し、それ以上の計算を行わずに、過去の記録から今日の最高気温を直接取得して結果を確定します。
3️⃣ 今日は気温が上がる日ですか?
これはシステム全体の中で最も満足のいくモジュールです。毎朝夜明けに、今日の最高気温は昨日よりも高くなるか、という判断を下します。
システムは毎日午前2時から4時の間に気象データのバッチを収集し、それをモデルに入力する。
過去3時間と12時間の気圧の変化
夜明け時の風向と風速、雲量
昨日の気温変動、過去3日間の気温傾向、そして昨日の気温が平年より高かったか低かったか。
月、季節、年間通算日、そして昨日雨が降ったかどうかを追加してください。
モデルの出力は、温暖化日、やや温暖化日、安定日、やや寒冷化日、寒冷化日の5つのレベルに分けられ、それぞれの信頼度も示されます。
しかし、この方法の精度は季節によって大きく異なる。
冬季に最も正確:寒気が到来すると、気圧が急激に上昇し、北風が強まる。その兆候は非常に明確であり、モデルは一目でそれを判断できる。
秋は最悪の季節だ。寒気団と暖気団が繰り返し衝突し、気温は今日上がって明日下がるなど、過去の気象パターンが最も急速に崩れる季節である。
排除方法:
フーリエ数値予測
初期の試みは、フーリエ解析を用いて過去の気温の周期的なパターンを当てはめ、その日の最高気温を直接予測できるかどうかを検証することだった。
結果から、この方法では「今シーズンの過去平均気温」しか分からないことが判明しました。上海の天候は変動が激しく、フーリエ変換では日々の変動ではなく、滑らかな平均曲線しか得られませんでした。誤差は3.6℃で、100%の系統的な過小評価であったため、即座に削除しました。
ERA5ピーク予測
ERA5は、欧州気候センターが提供する世界的な過去の再解析データセットであり、その日の最高気温が発生する時刻を予測するために使用されます。
バックテスト
1時間以内の精度は59.6%。
2時間以内の精度は81.3%
良さそうに聞こえるが、問題はPMの方が精度が高く、トレーダーが判断を下せる時間枠が非常に短いことだ。30分以内にピークを判断できない場合は、Polymarketのデータを見る方が良い。そのため、この方法は却下された。
III.システム実践:2つの事例研究と欠点に関する考察
Polymarketの天気予報市場は4日前から取引が開始され、人気の高い気温範囲は通常、早い段階で価格が確定します。確率の高い気温範囲で直接購入することは、リスクとリターンの比率が悪くなります。
したがって、私が採用した戦略は、市場が過熱した後、シグナルと適切なタイミングを見計らってから参入するというものだった。
したがって、独自に構築した気象システムに基づいて、以下の2つの操作が実行された。
ケース1:
16日早朝、テレグラムチャンネルは夜間予報を配信した。明日は気温が下がる見込みだという。その理由として、その夜の雲量が比較的多く、季節的および年間の日付特性の両方から気温低下の傾向が示唆されていることが挙げられた。
この時点では、私はすぐに賭けはしませんでした。早朝に得たシグナルは、あくまでも最初の参考情報に過ぎなかったからです。
午前11時、システムは温暖化期間に関するリアルタイムレポートを配信した。その時点で実際に測定された最高気温は12℃に達しており、+1℃の確率スコアは、本日さらに1℃上昇する確率は42%であり、それ以上の温暖化は起こらない可能性が高いという結果を示した。
早朝のロジスティック回帰分析で得られたわずかな冷却シグナルと、両モジュールが同じ方向に移動していることを考慮すると、シグナルは早朝よりもはるかに明確になった。したがって、16日の最高気温は13℃を超えないだろうと私は予想する。
日中の平均気温:12℃。前日の15日は15℃だったので、3℃も下がったことになる。
ケース2:
例えば、本日17日の上海の天気に関して言えば、気象システムは早期警報システムとしても機能しました。午前7時に受信したプッシュ通知では、異常なピーク時刻が午後10時であることが示されていました。
通常、晴れた日の最高気温は午後1時から3時の間に記録されるが、今日は午後10時にピークを迎えた。これは、日差しによる気温上昇ではなく、夜間に暖かく湿った空気が移動してきたことを示している。一日中雨が降り、雲量は97~100%で、ほとんど日差しはなかった。
この時点でポリマーケットを開いてみると、12℃の商品がまだ53%オフで販売されていることが判明した。コミュニティの一部の人々は困惑した。「もう午後だし、気温はたったの11℃だし、通常のピーク時間はとっくに過ぎているのに、なぜまだ12℃の商品を買っている人がいるのだろう?」
この混乱の背景には、人々が依然として晴れた日の論理で雨の日の市場を判断していることがある。
システムは混乱しません。今朝、今日の気象タイプを特定し、通常とは異なるピーク時間と、現在の気温と市場の予想との間に大きな乖離があることを指摘しました。これは情報ギャップであり、情報ギャップは取引機会となります。
これこそが、このシステムを構築する意義である。機会をより容易に特定でき、リスクに対する警告をより迅速に提供できるからだ。
このシステムには他にどのような欠点がありますか?
週末だけで構築されたシステムに脆弱性が全くないということはあり得ない。
秋の天気予報の的中率はわずか63.7%で、まるでコイン投げのようなものです。この時期は寒気団と暖気団が繰り返し衝突し、気温が一日上がったかと思えば翌日には下がるなど、過去の気象パターンが最も急速に崩れる季節です。
気圧データはライブ取引では利用できません。気圧の変化はモデル学習時の特徴量として使用され、バックテストの結果は良好でした。寒気通過のシグナルは非常に明確です。しかし、ライブ取引中は、現在のインターフェースではリアルタイムの気圧データを取得できません。
沿岸補正機能はまだデータ有効化待ちの状態です。浦東空港における海風の影響は実際に存在し、システムには対応する補正モジュールが構築されていますが、バックテストのサンプルサイズがまだ不十分です。
週末しか稼働していないシステムでこれらの問題を発見できたのは、すでに大きな成果です。今後もシステムの運用を続けながら、これらの問題を修正していきます。
結論
気象学は何世紀にもわたり、人工衛星、スーパーコンピューター、地球規模モデルなどを活用して発展してきたが、それでも明日の天気予報は100%正確とは言い切れない。これは科学者たちの努力が足りないからではなく、大気システム自体が混沌としており、初期条件がわずか1度異なるだけでも全く異なる結果につながる可能性があるからだ。
週末のみ稼働したこのシステムは、必然的にミスを犯すものだった。秋の予測精度はコイン投げと大差なく、寒気が早く到来すればシステムが間に合わない可能性があり、海風の影響もまだ十分に捉えられていない。
しかし、それは重要ではありません。市場を予測するたびに正解する必要はありません。ただ、有利な状況で市場よりも一段階多くの情報を持っているだけで良いのです。
上海の天気予報市場はまだ初期段階にあり、今後もシステムの発展に合わせて監視・改良を続けていきます。Polymarketの天気予報市場に携わっている方は、ぜひコメント欄でご意見をお聞かせください。エントリーポイントの決定にはどのような方法を用いていますか?また、予期せぬ決済結果に遭遇したことはありますか?

