ウェブページで「信号機を識別する」や「すべての横断歩道を選択する」をクリックするたびに、あなたは自分がロボットではないことを証明しているだけだと思っています。しかし実際には、あなたはGoogleのAIシステムに無料の学習データを提供しているのです。これは15年以上も続いており、世界中の何億人ものユーザーが関わっています。そして最終的には、Googleマップの視覚認識機能や、現在450億ドルの価値があるとされる自動運転車会社Waymoの構築につながりました。この過程において、誰もあなたの同意を求めず、誰も真実を語らず、誰もあなたに一銭も支払っていません。
毎日50万時間もの無償労働。それは、ただ銀行口座にログインしているだけだと思っている人々によって提供されている。
reCAPTCHAは、インターネット史上最も成功した秘密裏のデータ収集作戦である。最盛期には、毎日2億人もの人々がreCAPTCHAの認証を完了していた。彼らのほとんどは、自分が実際に何を作り出しているのかを理解していなかった。
Google傘下の自動運転車開発会社Waymoの企業価値は現在450億ドルに達しています。その重要な学習データの大部分は、あなたから提供されています。しかも無料です。あなたがアクセスするすべてのウェブサイトから。
これが全容です。
出発点:賢いアイデア
2000年当時、スパムボットがインターネットを破壊していた。フォーラムはスパムで溢れかえり、メールの受信トレイはパンク状態だった。ウェブサイトは、人間と機械を区別する方法を必死に必要としていた。
カーネギーメロン大学のルイス・フォン・アン教授はこの問題を解決しました。彼はCAPTCHAを発明しました。これは人間だけが読めるように文字を歪ませたものです。ロボットはこれを通過できませんが、人間は通過できます。
しかし、フォン・アンはさらに大きな可能性を見出した。何百万人もの人々が既にこうした検証に認知エネルギーを費やしている。もしそのエネルギーを二つのことに同時に使えたらどうだろうか?
2007年、彼はreCAPTCHAを導入しました。その独創的な点は、ランダムな意味不明な文字列を表示するのではなく、2つの単語を表示することでした。1つはシステムが認識できる単語で、もう1つはコンピュータがまだ認識できない、実際にスキャンされた書籍から抽出された単語です。あなたの回答は、デジタル化作業の完了に役立ちました。
これらの書籍は、ニューヨーク・タイムズのアーカイブとGoogleブックスから提供されたもので、合計1億3000万冊に及ぶ。
ログインしているつもりでも、実際には世界最大のデジタルライブラリのOCR(光学文字認識)処理を行っているのです。
2009年、GoogleはreCAPTCHAを買収した。
Googleがゲームを変えた
文字が歪んで表示される時代は、2012年頃に終焉を迎えた。
Googleは新たな課題に直面している。ストリートビューの撮影車は地球上のあらゆる道路を撮影しているが、それらの写真は単なる生データに過ぎない。AIが真に役立つためには、道路標識、横断歩道、信号機、店舗の看板など、「何を見ているか」を理解する必要がある。
そこでGoogleはreCAPTCHA v2を再設計した。認証内容は歪んだテキストから画像グリッドに変更され、「信号機を含むすべてのマスをクリックしてください」「すべての横断歩道を選択してください」「店舗の看板を識別してください」といった内容になった。
これらの画像はGoogleストリートビューから直接取得したものです。
クリックするたびにラベルが付けられます。選択するたびに、Googleのコンピュータビジョンモデルに「このピクセルは信号機だ」「この形状は横断歩道だ」といった情報が伝達されます。
あなたはテストに合格しようとしているのではなく、データセットを構築しているのです。
誰も語らないスケール
ピーク時には、1日に2億件ものreCAPTCHA認証が完了していた。
それぞれの検証には約10秒かかるため、毎日20億秒もの人的労働が行われていることになる。これは1日あたり50万時間に相当します。
プロによるデータ注釈の市場価格は、1時間あたり10ドルから50ドルまで幅がある。最低価格の場合、毎日無償で得られる労働の価値は500万ドルにも上る。
さらに、reCAPTCHAは単一のアプリケーションに限定されるものではありません。あらゆる銀行、あらゆる政府ポータル、あらゆるeコマースプラットフォーム、そしてインターネット上のあらゆるログインページに遍在しています。選択の余地はありません。アカウントにアクセスしたいですか?まずデータセットにラベルを付けてください。
Googleはあなたの意見を求めたこともなければ、報酬を支払ったこともなく、この件についてあなたに知らせたことさえなかった。
これらすべては何を生み出すのか?
このデータは両方の製品に直接送信されました。
Googleマップ。世界で最も広く利用されているナビゲーションツール。道路標識の読み取り、店舗の位置特定、都市地理の理解といった機能は、サイトにログインしようとする人々が提供した何十億もの手動注釈によって部分的に支えられています。
Waymoもありますよ。
WaymoはGoogleの自動運転車プロジェクトであり、2016年に独立した子会社となった。安全な走行のためには、自動運転車は信号機、横断歩道、歩行者、一時停止標識など、数千もの視覚パターンをほぼ完璧な精度で認識する必要がある。
これらの認識機能に必要な実際のトレーニングデータは?それは、reCAPTCHAを使用している何百万人もの人々によってラベル付けされたもので、彼らはそのことに全く気づいていない。
Waymoは2024年に400万回以上の有料乗車サービスを完了し、現在サンフランシスコ、ロサンゼルス、フェニックスで事業を展開しており、今後も拡大を続ける予定である。同社の企業価値は450億ドルと評価されている。
この建物の基礎を築いたのは、メールの送受信だけを目的とした、自由なインターネットユーザーたちだった。
なぜ誰もこれを再現できないのだろうか?
データアノテーションは非常に高額な費用がかかる。Scale AI、Appen、Labelboxといった企業は、まさにこの問題を解決するために存在している。これらの企業は何十万人もの従業員を雇用して画像にアノテーションを施しており、時には時給1ドル未満で作業を行っている。
Googleはこの問題を全く異なる方法で解決しました。それは、ウェブサイトへの表示を義務化することでした。料金の支払いも同意も必要ありませんでした。その代わりに、ウェブ上のあらゆるウェブサイトにアクセスするための「入場料」として扱われました。
結果:地球全体を網羅する数十億枚のラベル付き画像。様々な気象条件、期間、そして地球上のあらゆる都市を網羅している。
ラベル会社にはそんなことはできない。インターネットそのものがその工場であり、そこにいる全員が契約書にサインしたことのない従業員なのだ。
あなたが今日も続けていること
2018年にリリースされたreCAPTCHA v3は、認証のための質問を一切表示しません。マウスの動き、ページのスクロール、カーソルを特定の場所に置いた時間などを観察し、その行動パターンから人間かどうかを判断します。
この行動データは、GoogleのAIシステムにもフィードバックされる。
あなたは自ら進んで参加を選んだわけではありません。参加するためのチェックボックスなど存在しなかったのです。そして今もなお、あなたはほとんどのウェブサイトで同じことを繰り返しています。
これは誰もが立ち止まって考えるべき皮肉な事実だ。
ルイス・フォン・アンの最初のアイデアは天才的なものだった。人類が本来なら不要なものを選別するために費やすであろう認知エネルギーを、価値のあるもの、つまり世界の書籍をデジタル化して真の問題を解決することに振り向けるというものだ。
Googleがこのアイデアをどのように応用するかは、全く別の問題である。
彼らは、ユーザーが利用せざるを得ないセキュリティメカニズムを採用し、それをインターネット全体に展開することで利益を上げ、数千億ドル規模の商業製品を構築した。
ユーザーは何も得られず、知る権利さえも与えられなかった。
最も皮肉なのは、あなたが何年もかけて、AIにはまだできない画像認識タスクを実行することで、自分が人間であることを証明してきたのに、AIがこのスキルを習得した途端、人間の画像注釈は不要になったということだ。
あなたは、自分が替えのきく存在であることを自ら証明することで、人間であることを証明した。
出典:カーネギーメロン大学、Googleブログ(2009年)、WebProNews、MakeUseOf、MITテクノロジーレビュー、Waymoの公開文書。

