인공지능을 활용해 날씨를 예측하고 하루에 200달러를 벌어보세요.

지난 금요일, 폴리마켓(Polymarket)에서 상하이 푸둥 공항의 일일 최고 기온 예측 서비스를 시작했습니다. 저는 주말 동안 예측 시스템을 개발해서 200달러를 벌었습니다.

저자: Changan | Biteye 콘텐츠 팀

날씨는 선거처럼 특정 입장을 고수하는 것이 아닙니다. NBA처럼 특정 팀을 응원하는 것도 아니죠. 하지만 바로 이런 점이 수많은 국내 사용자를 끌어들이는 요인입니다. 이유는 간단합니다. 누구나 자신만의 경험을 가지고 있고, 누구나 상하이 날씨를 잘 안다고 생각하기 때문입니다.

하지만 "이해한다고 느끼는 것"과 "돈을 벌 수 있는 것"은 전혀 다른 두 가지입니다.

Biteye는 오늘 세 가지를 공유합니다.

  1. 정산 규칙 이해하기

  2. 일기 예보 방법을 확립하십시오

  3. 다른 사람들이 보지 못하는 거래 기회를 찾으려면 이 시스템을 사용하십시오.

우선, 날씨 시장이 실제로 어떻게 정산되는지 알아내야 합니다.

1. 액체가 침전되는 온도는 여러분이 생각하는 것과 다릅니다.

처음 참가하는 많은 사람들이 실수를 저지릅니다. 바로 스마트폰의 날씨 앱을 이용해 최고 기온에 베팅하는 것입니다. 하지만 앱은 상하이 시내의 기온을 보여주는 반면, 폴리마켓은 상하이 푸둥 공항(ZSPD 기상 관측소)에서 실제로 측정된 데이터를 사용하여 정산합니다. 이 데이터는 미국의 날씨 플랫폼인 원더그라운드(Wunderground)를 통해 공개적으로 제공됩니다. 폴리마켓은 원더그라운드의 기록을 직접 읽어와 정산 기준으로 활용합니다.

두 위치, 두 가지 수치. 푸둥 공항은 도시 동쪽, 양쯔강 하구에 인접해 있습니다. 해풍의 영향을 받아 도심보다 기온이 낮은 편입니다. 이러한 기온 차이는 평소에는 잘 느껴지지 않지만, 중요한 순간에는 승패를 가르는 결정적인 차이가 될 수 있습니다.

그래서 날씨 정보 댓글란에서 "오늘은 어제보다 더 따뜻하게 느껴지는데, 왜 최고 기온은 더 낮게 표시되는 거죠?"와 같은 혼란스러운 질문을 볼 수 있는 겁니다.

2. 숫자는 맞지만 단위가 예상과 다릅니다.

WU의 데이터는 공항에서 제출하는 시간별 METAR 보고서(전 세계 민간 항공에서 사용되는 기상 정보 형식)에서 직접 가져온 것입니다.

여기서 한 가지 자세히 설명드리자면, METAR는 화씨 온도를 정수로 기록하는 반면, WU는 변환이나 보정 없이 숫자를 직접 표시합니다.

대부분의 일기 예보 시스템과 기상 모델은 온도를 소수점까지 표시하여 출력합니다. 모델의 계산이 정밀할수록 이러한 사소한 오차를 간과하기 쉽습니다.

3. 상하이 기온 패턴

상하이시 기상청(ZSPD)의 약 1900일간의 데이터를 분석한 결과, 상하이의 최고 기온 발생 기간이 예상보다 훨씬 집중되어 있는 것으로 나타났다.

  • 사계절의 특징이 모두 오전 11시부터 오후 1시 사이에 집중적으로 나타납니다.

  • 여름철에는 정오 12시에 농도가 가장 높으며, 이 시간대에 전체 계절 총량의 27.6%가 발생합니다.

  • 가을철 최고 발생 시간은 약간 더 빨라지며, 오전 10시가 가장 빈번한 시간대 중 하나입니다.

패턴을 파악하는 것이 첫 번째 단계이지만, 패턴은 저절로 작용하는 것이 아닙니다. 중요한 것은 일일 최고 기온이 언제 발생할지, 이미 최고 기온을 넘어섰는지, 그리고 목표치까지 얼마나 남았는지 아는 것입니다.

그래서 저는 이런 시스템을 만들었습니다. 매일 정산하기 전에, 이 시스템은 그날 최고 기온이 몇 도에 이를지 최대한 정확하게 예측합니다.

다섯 가지 방법 중 두 가지가 효과가 있었고, 그중 세 가지가 효과가 있었습니다.

시장 규칙이 명확해지면 다음 질문은 "그날의 최고 기온을 어떻게 예측할까?"입니다.

기상학에 대해 전혀 몰랐던 저는 먼저 ChatGPT에게 "기상 업계에서는 정확히 어떻게 그날의 최고 기온을 계산하나요? 그리고 어떤 방법들이 정립되어 있나요?"라고 물었습니다. ChatGPT는 이론적 틀을 제공했고, 클로드는 그 틀을 코드로 구현했습니다. 두 인공지능은 협력하여 주말 동안 시스템을 가동시켰습니다.

총 다섯 가지 방법을 시도해 봤는데, 그중 세 가지만 효과가 있었습니다.

성공적으로 실행되었습니다.

1️⃣ WC + ECMWF 통합 예측

최고 기온을 예측하려면 먼저 데이터가 필요합니다. 두 가지 자료원을 활용했습니다.

  • Weather Company(WC)는 시간별로 매우 정확한 예보 데이터를 제공하는 상용 날씨 API입니다.

  • ECMWF는 유럽 중기예보센터의 전지구 기상 모델로, 대규모 기상 시스템에 더욱 민감하게 반응합니다.

두 자료 모두 장단점이 있으므로 가중치를 부여하고 투표를 통해 결정합니다. 가중치는 당일 날씨 유형에 따라 동적으로 조정됩니다. 맑은 날에는 WC가 더 신뢰할 수 있고, 강풍이 부는 흐린 날에는 ECMWF가 더 신뢰할 수 있습니다.

2️⃣ 실시간 보정: 온도 상승 데이터를 사용하여 최고값을 계산합니다.

예보는 어젯밤에 계산되었지만 날씨는 하루 종일 변했습니다. 따라서 이 모듈은 오늘 아침에 이미 측정된 실제 데이터를 사용하여 오늘 가능한 최고 기온을 추정합니다.

논리는 복잡하지 않습니다. 상하이의 기온이 오전 8시에서 9시 사이에 가장 빠르게 상승한다는 사실을 발견했습니다. 이 시간대의 측정된 기온을 ​​얻은 후, 시스템은 과거 같은 시간대와 계절에 기온이 평균적으로 몇 도 상승했는지에 대한 데이터를 확인합니다.

다음으로 두 가지 수정 사항을 추가하세요.

  • 구름이 많을수록 할인이 적용됩니다. 구름이 두꺼울수록 온난화 과정이 더 많이 방해받기 때문입니다.

  • 바람은 열 손실을 가속화하므로 바람의 영향도 곱해집니다. "외삽 추정치"가 계산됩니다.

기압, 이슬점, 습도 또한 계산에 포함되었지만, 백테스팅 결과 이러한 요소들의 영향력이 미미하고 상관관계가 낮다는 것이 밝혀져 제외되었습니다.

하지만 외삽법만으로는 충분히 안정적이지 않습니다. 여기서는 외삽 결과와 원래 예측값 사이의 가중 평균인 칼만 게인 개념을 사용합니다. 더욱이, 이 가중치는 시간에 따라 자동으로 변경됩니다.

  • 오전 6시 기준으로 외삽법은 20%에 불과했고, 대부분은 여전히 ​​예측에 기반한 것이었다.

  • 정오까지 외부 추천이 72%를 차지했습니다.

  • 오후 1시 이후에는 실제 측정값의 거의 전부(85%)가 수용되었습니다.

시간이 늦을수록 현재 발생하는 사건의 중요성이 커지고, 시간이 빠를수록 과거 예측의 참고 가치가 높아진다.

오후 2시 이후에는 시스템이 최고 기온이 이미 지났을 가능성이 높다고 판단하여 추가 계산 없이 과거 기록에서 오늘 최고 기온을 직접 가져와 결과를 확정합니다.

3️⃣ 오늘은 기온이 오르는 날인가요?

이 모듈은 시스템 전체에서 가장 만족스러운 부분입니다. 매일 새벽 동이 틀 무렵, 이 모듈은 다음과 같은 판단을 내립니다. 오늘 최고 기온이 어제보다 높을까?

이 시스템은 매일 새벽 2시에서 4시 사이에 기상 데이터를 수집하여 모델에 입력합니다.

  • 지난 3시간 및 12시간 동안의 기압 변화

  • 바람의 방향과 풍속, 새벽의 구름량

  • 어제의 기온 변동, 지난 3일간의 기온 추세, 그리고 어제의 기온이 평균보다 높았는지 낮았는지 여부.

  • 월, 계절, 일, 그리고 어제 비가 왔는지 여부를 추가하세요.

모델 출력 결과는 온난화일, 약간 온난화일, 안정일, 약간 냉각일, 냉각일의 다섯 가지 수준으로 나뉘며, 각 수준별 신뢰도 수준도 함께 표시됩니다.

하지만 이 방법의 정확도는 계절에 따라 크게 달라집니다.

  • 겨울철에 가장 정확함: 찬 공기가 유입되면 기압이 급격히 상승하고 북풍이 강해지는데, 이때 신호가 매우 뚜렷하게 나타나 모델이 한눈에 파악할 수 있음.

  • 가을은 최악의 계절입니다. 차가운 공기 덩어리와 따뜻한 공기 덩어리가 끊임없이 충돌하고, 오늘은 기온이 오르고 내일은 떨어지며, 이 계절에는 기존의 기상 패턴이 가장 빠르게 무너집니다.

제거 방법:

  1. 푸리에 수치 예측

초기 시도는 푸리에 분석을 사용하여 과거 기온의 주기적 패턴에 맞춰보고, 이를 통해 당일 최고 기온을 직접 예측할 수 있는지 확인하는 것이었습니다.

분석 결과, 해당 모델은 "이 계절의 과거 평균 기온"만 제공할 수 있는 것으로 나타났습니다. 상하이의 날씨는 너무 불규칙적이어서 푸리에 변환은 실제 일일 변동이 아닌 매끄러운 평균 곡선만을 생성했습니다. 오차는 3.6°C였으며, 이는 100% 체계적인 과소평가였기 때문에 해당 모델은 즉시 삭제되었습니다.

  1. ERA5 최고점 예측

ERA5는 유럽 기후 센터에서 제공하는 전 세계 과거 재분석 데이터 세트로, 하루 중 최고 기온이 발생하는 시간을 예측하는 데 사용됩니다.

백테스팅

  • 1시간 이내 정확도는 59.6%입니다.

  • 2시간 이내 정확도 81.3%

괜찮아 보이지만, 문제는 PM이 더 정확한 반면 트레이더들이 판단을 내릴 수 있는 시간 범위가 매우 짧다는 점입니다. 30분 안에 최고점을 판단할 수 없다면 폴리마켓의 데이터를 보는 것이 더 낫습니다. 그래서 이 방법은 제외되었습니다.

III. 시스템 실천: 두 가지 사례 연구 및 한계점 고찰

폴리마켓의 날씨 시장은 거래 개시 4일 전부터 시작되며, 인기 있는 기온 범위는 대개 초기에 가격에 완전히 반영됩니다. 따라서 확률이 높은 범위에서 직접 매수하는 것은 위험 대비 수익률이 낮습니다.

따라서 제가 채택한 전략은 시장이 과열된 후 적절한 진입 시점과 신호를 기다리는 것이었습니다.

따라서 자체 구축한 기상 시스템을 기반으로 다음과 같은 두 가지 작업을 수행했습니다.

사례 1:

16일 새벽, 텔레그램 채널에서 야간 예보가 올라왔습니다. 내일은 기온이 떨어질 것이라는 내용이었습니다. 예보의 이유는 그날 밤 구름이 비교적 짙었고, 계절적 및 연간 추세 모두 기온 하강을 예고했기 때문이라고 설명했습니다.

이 시점에서 저는 바로 베팅을 하지는 않았습니다. 이른 아침에 들어온 신호는 단지 첫 번째 참고 자료일 뿐이었으니까요.

오전 11시, 시스템은 온난화 기간에 대한 실시간 보고서를 내보냈습니다. 당시 실제 측정된 최고 기온은 12°C에 달했고, +1°C 상승 확률은 오늘 추가로 1°C 상승할 확률이 42%로, 더 이상의 온난화는 없을 가능성이 높다는 결과를 보여주었습니다.

이른 아침 로지스틱 회귀 분석에서 얻은 냉각 신호를 종합하고, 두 모듈 모두 같은 방향으로 움직이는 것을 고려했을 때, 신호는 이른 아침보다 훨씬 더 명확해졌습니다. 따라서 16일 최고 기온은 13°C를 넘지 않을 것이라고 예상합니다.

오늘 기온은 12°C입니다. 전날인 15일에는 15°C였으니, 무려 3도나 떨어졌네요.

사례 2:

예를 들어, 오늘(17일) 상하이의 날씨를 살펴보면, 기상 시스템이 조기 경보 시스템 역할을 하기도 했습니다. 오전 7시에 수신된 푸시 알림은 비정상적으로 높은 기온이 오후 10시에 나타날 것이라고 알려줬습니다.

일반적으로 맑은 날 최고 기온은 오후 1시에서 3시 사이에 나타나지만, 오늘은 오후 10시에 최고 기온을 기록했습니다. 이는 햇볕으로 인해 공기가 데워진 것이 아니라 밤새 따뜻하고 습한 공기가 이동해 온 결과임을 시사합니다. 하루 종일 비가 내렸고, 97~100%가 구름으로 덮여 햇볕은 거의 볼 수 없었습니다.

이때 폴리마켓에 가보니 12°C 음료가 여전히 53% 할인된 가격에 판매되고 있었다. 일부 주민들은 의아해하며 "이미 오후이고 기온은 겨우 11°C인데, 평소 피크 시간대도 한참 지났는데 왜 사람들이 아직도 12°C 음료를 사는 거지?"라고 말했다.

이러한 혼란의 배경에는 사람들이 여전히 맑은 날의 논리를 바탕으로 비 오는 날의 시장 상황을 판단하려는 경향이 있다는 점이 있습니다.

시스템은 혼란스러워하지 않을 겁니다. 오늘 아침 날씨 유형을 파악했고, 평소와 다른 최고 기온 시간과 현재 기온과 시장 예상치 간의 상당한 차이를 기록했습니다. 이는 정보 격차이며, 정보 격차는 거래 기회입니다.

이 시스템을 구축하는 것의 의미는 바로 여기에 있습니다. 기회를 더 쉽게 파악하고 위험에 대한 경고를 더 빠르게 제공할 수 있도록 해줍니다.

이 시스템에는 또 어떤 단점이 있습니까?

주말 동안 구축된 시스템이 취약점이 전혀 없을 수는 없습니다.

  • 가을 날씨 예보의 정확도는 63.7%에 불과해 동전 던지기와 거의 비슷합니다. 이 시기에는 찬 공기와 따뜻한 공기 덩어리가 반복적으로 충돌하여 기온이 하루는 오르고 다음 날은 떨어지는 현상이 발생하며, 특히 가을에는 기존의 날씨 패턴이 가장 빠르게 무너집니다.

  • 실시간 거래에서는 기압 데이터를 활용할 수 없습니다. 모델 학습 시에는 기압 변화를 특징으로 사용했으며, 백테스팅 결과는 양호했습니다. 특히 찬 공기 통과 신호가 매우 뚜렷하게 나타났습니다. 그러나 현재 인터페이스에서는 실시간 거래 시 기압 데이터를 확인할 수 없습니다.

  • 해안선 보정 기능은 아직 데이터 활성화를 기다리고 있습니다. 푸동 공항의 해풍 영향은 실제로 존재하며, 시스템에는 이에 상응하는 보정 모듈이 구축되어 있지만, 백테스팅 샘플 크기가 아직 부족합니다.

주말 동안만 가동한 시스템에서 이러한 문제점을 발견한 것만으로도 이미 큰 성과입니다. 시스템을 계속 운영하면서 문제점들을 수정해 나갈 것입니다.

결론

기상학은 수세기 동안 위성, 슈퍼컴퓨터, 지구 모델을 활용하여 발전해 왔지만, 여전히 내일 날씨를 100% 정확하게 예측할 수는 없습니다. 이는 과학자들이 노력을 게을리해서가 아니라, 대기 시스템 자체가 혼돈 상태이기 때문입니다. 초기 조건에서 단 1도의 차이만으로도 완전히 다른 결과가 나타날 수 있습니다.

주말 동안만 가동된 이 시스템은 오류가 발생할 수밖에 없었습니다. 가을철 정확도는 동전 던지기와 거의 비슷하며, 찬 공기가 일찍 도착하면 시스템이 제때 반응하지 못할 수도 있고, 해풍의 영향도 아직 완전히 반영되지 않았습니다.

하지만 그건 중요하지 않습니다. 시장을 예측할 때마다 항상 맞을 필요는 없습니다. 단지 성공 확률이 높을 때 시장보다 한 단계 더 많은 정보를 가지고 있으면 됩니다.

상하이 날씨 시장은 아직 초기 단계이며, 저희는 시스템이 발전함에 따라 지속적으로 모니터링하고 개선해 나갈 것입니다. 폴리마켓 날씨 시장에서 업무를 하고 계신다면, 댓글란에 진입 시점을 결정하는 데 사용하는 방법이나 예상치 못한 결제 결과에 대해 자유롭게 의견을 나눠주세요.

공유하기:

작성자: Biteye

이 글은 PANews 입주 칼럼니스트의 관점으로, PANews의 입장을 대표하지 않으며 법적 책임을 지지 않습니다.

글 및 관점은 투자 조언을 구성하지 않습니다

이미지 출처: Biteye. 권리 침해가 있을 경우 저자에게 삭제를 요청해 주세요.

PANews 공식 계정을 팔로우하고 함께 상승장과 하락장을 헤쳐나가세요