1分間の通話録音には0.50ドルかかる。人間は自らの命をAIに「売り渡している」のだ。

著者: Su Yang 、Tencent Technology

徐清陽編集

AIはデータ不足に直面しており、人間の生命はビジネスと化している。

南アフリカのケープタウンからアメリカのシカゴやロサンゼルス、インドのランキに至るまで、世界中の何万人もの人々が、皿洗いの動画、足音、電話の録音、料理をする様子など、日常生活の断片をテクノロジー企業に販売している。

こうしたごく普通の日常的な家事は、明確な価格設定と個別販売が可能な「工業用原材料」となりつつあり、AIのトレーニングのための「教材」としても利用されている。例えば、2時間の皿洗い動画は80ドルで取引され、電話の録音は1分あたり0.5ドルの価値がある。

シリコンバレーにおける実在人物データへの強い欲求が、データ市場の急成長を促した。

しかし、そのお金はタダではなかった。

契約に署名するギグトレーナーたちは、知らず知らずのうちに取り消し不可能な権限を放棄してしまうことが多い。彼らの声はAIによる顧客サービスに永久的に利用される可能性があり、彼らの顔は世界の反対側にある顔認識データベースに登録される可能性があり、彼らが訓練したシステムがいつか彼らの職を奪うことになるかもしれないのだ。

これは、生き残りと計算の物語だ。一方では生計を立てるプレッシャーがあり、他方では未来への見えないリスクがある。そして、このデータ「ゴールドラッシュ」において、真の勝者は誰なのか？

01. 人間は人生を「小売」セグメントに分割する。

南アフリカ出身の27歳、ジェイコブス・ラブさんは、毎日カモメに餌をやるために外出する際に、自分の足跡や景色を写真に撮っている。そして、それらの動画をKled AIというアプリにアップロードする。Kled AIは、AIモデルの学習に必要なデータを収集することでユーザーに報酬を支払うアプリだ。約10秒の短い「街歩き」動画で、彼は14ドルを稼ぐことができる。

22歳のインド人学生、サヒル・ティガは、さらにシンプルな方法でお金を稼いでいる。それは、スマートフォンのマイクを常にオンにしておくことだ。彼は「Silencio」というアプリを使って、他の人に自分のスマートフォンのマイクへのアクセスを許可し、レストランや交差点の交通騒音を録音させている。さらに収入を増やすため、彼はホテルのロビーに出向き、まだ録音されていない環境音を録音することもある。こうして彼は月に100ドル以上を稼ぎ、生活費を賄っている。

シカゴ出身の18歳の溶接工見習い、ラメリア・ヒルは、友人や家族との通話記録など、より個人的な情報を、Neon Mobileというプラットフォームに1分あたり0.50ドルで売却することを選んだ。

 AIを活用したギグトレーナーがアップロードするコンテンツは驚くほど多様であり、彼らはこの世界的なデータゴールドラッシュの最前線に立っている。

これらのギグワークは、単なるギグワーク以上のものです。

ロサンゼルスでは、サンタモニカからロスフェリスまで、何百人もの人々が家事をしながら頭や手にカメラを装着している。コーヒーを淹れたり、トイレを磨いたり、植物に水をやったり、皿を洗ったり――すべてが記録されている。

サルバドール・アルシガはInstaworkからヘッドマウント式のスマホスタンドを受け取り、自宅に戻って、カメラの前で皿洗いやコンロ拭きをする様子を撮影し、スペイン語か英語で自分の行動を説明した。彼は2時間の動画撮影で80ドルを稼いだ。

「どうせ家事はやらなきゃいけないんだから」と彼は言った。「これからは家事をしながらお金も稼げるようになるんだ。」

02. 全てはAIのデータ不足に起因している。

こうした一見ローテクな日常生活の断片が価値がある理由は、AIが「飢餓状態」に陥る寸前だからだ。

ChatGPTやGeminiのような大規模な言語モデルは、継続的に性能を向上させるために膨大な量の学習データを必要とします。しかし、現在最も一般的に使用されているC4やRefinedWebなどのトレーニングデータソースは、AI企業が自社データを使用することを制限し始めています。

非営利研究機関のEpoch AIは、2026年までにAI企業がトレーニングに利用できる新鮮なテキストデータを使い果たすと予測している。一部の研究室では、AI自身にデータを生成させて「自律学習」させる実験を開始しているが、このアプローチはモデルの品質低下、ひいてはモデルの崩壊につながる可能性がある。

こうした背景から、Kled AIやSilencioといったデータマーケットプレイスプラットフォームが突如として人気を集めている。

キングス・カレッジ・ロンドンの経済学教授、ボック・クライン・ティッセリンク氏は、ギグAIトレーニングは大きな成長の可能性を秘めた新たな職種であると指摘する。AI企業は、ユーザーの許可を得たデータに対して対価を支払うことで、著作権紛争を効果的に回避することもできる。インターネットからコンテンツを無断で収集すると、訴訟に発展する可能性が高すぎる。

AI研究者のベンジャミン・ヴェセロフスキー氏も、「現状では、AIが自身のパターンから脱却し、新しいことを学習するための最良の情報源は、依然として人間のデータである」と述べている。

端的に言えば、機械がどれほど速く学習できたとしても、実際の人間によるデータがなければ、真に学習することは決してできない。これは特に現実世界において顕著である。

ユニバーサルロボット社のAIロボティクス担当副社長であるアンダース・ベイカー氏は、AIラボで収集されたトレーニングデータのほとんどは実世界での展開には適しておらず、ロボットは視覚的なフィードバックだけでは「手を使った」やり取りを必要とするタスクを学習できないと指摘した。ロボットがドアを開ける、皿を洗う、服をたたむといったスキルを真に習得するには、現実の環境で人間による繰り返しのデモンストレーションに頼る必要がある。

CB Insightsのインサイト責任者であるジェイソン・ソルトマン氏は、「このモデルはまだ何が正しくて何が間違っているかを自力で判断することも、実際の状況を把握することもできない。人間がすべてを教えなければならない」と要約した。

そのため、一部の国では専門的な「アームファーム」を設置している。固定された施設内で、多数の人々がドアを開けたり服を畳んだりといった作業を一人称視点で撮影した動画を作成し、AIの実世界での運用デモンストレーションを提供している。

アルシアは、ライブの一環として、洗濯機に服を入れる様子を自ら撮影した。

データによると、Sunainのような人的データ収集企業は、西はカルバーシティから東はパサデナまで、ロサンゼルス全域に1,400人以上の協力者を抱えている。Sunainの共同創設者であるシャバズ・マグシ氏は、ロサンゼルスの住宅の種類、ライフスタイル、人口の多様性は「他に類を見ない」と述べている。

CB Insightsは、世界のデータ収集・ラベリング市場が2030年までに170億ドル規模に達する可能性があると予測している。一方、ゴールドマン・サックスは、ヒューマノイドロボット市場が2035年までに380億ドル規模に達する可能性があると予測している。

まさにこうした有望な見通しがあったからこそ、資金が大量に流入し始めたのだ。

サンフランシスコを拠点とするEncordは、昨年、物理AI事業の収益が10倍に増加し、今年2月には6,000万ドルの資金調達に成功した。Metaが出資するScale AIは、すでに10万時間分のロボット動画を収集している。競合企業のMicro1は、60カ国で1,000人を雇用し、家事の動画撮影を専門に行っている。

03. プライバシーはなく、後戻りもできない。

AIにデータを提供する入札を勝ち取った企業にとって、その資金は決して無駄ではなかった。

ヒル氏は自身の経験について複雑な心境を抱いている。Neon Mobileで11時間分の通話を販売して300ドルを稼いだが、アプリは頻繁にダウンし、出金も遅れることが多かった。「Neonは以前からかなり怪しいと思っていた」と彼は言う。「でも、ちょっとしたお小遣い稼ぎのためにいつも利用していたんだ。」

やがて、問題が始まった。

2025年9月、Neon Mobileのサービス開始からわずか数週間後、TechCrunchは、オンライン上の誰でもユーザーの電話番号、通話録音、テキストメッセージに直接アクセスできるセキュリティ脆弱性を報じた。ヒル氏は、Neonからこの件について一切通知を受けていないと述べている。彼は今、自分の声がどのように利用されるのかを心配している。

しかも、それが最悪の部分ではない。

ニューヨークの俳優アダム・コイは、2024年にAIビデオ編集会社キャプションズ（現ミラージュ）に自身の肖像権を1,000ドルで売却した。契約には多くの保護条項が盛り込まれており、彼の肖像は政治目的で使用できないこと、アルコール、タバコ、ポルノの販売に使用できないこと、そしてライセンスは1年後に失効することなどが含まれていた。

しかしその後まもなく、彼の友人たちがネット上で拡散している動画を彼に送り始めた。その動画には、彼の顔と声が映っており、妊婦向けの効果が証明されていない健康食品を宣伝していた。

「これを他人に説明するのは、ものすごく恥ずかしいんです」とコイは語った。「それらのコメントは私の外見について言及していたので、奇妙に感じました。でも、それは本当の私とは全く違うんです。」

コイをさらに苛立たせたのは、肖像写真を売ろうと決めた当初の考えだった。ほとんどのモデルはインターネットからデータや画像を収集するのだから、自分もいくらか稼いでしまおうと思ったのだ。今思えば、まるで冗談のようだった。それ以来、彼は二度とそのようなプラットフォームには手を出していない。

シティ・オブ・ロンドン・セント・ジョージ大学の法学教授、エンリコ・ボナディオ氏は、多くのプラットフォームの契約では「追加料金を支払うことなく、その素材をほぼ永久的に自由に利用できる」と指摘する。一方、コンテンツ提供者には「同意を撤回したり、契約内容を再交渉したりする実際的な手段はほとんどない」という。

さらに恐ろしいのは、たとえプラットフォームが「匿名化」処理を行っていると主張したとしても、音声や顔などの生体認証情報は、真に匿名性を実現することが本質的に難しいということだ。

04. 完全ライセンス契約の落とし穴

あなたは単に録音をいくつか「レンタル」しただけだと思っているかもしれませんが、契約書の細かい条項には、もっと大きな落とし穴が隠されている可能性があります。

ユーザーがNeon MobileまたはKled AI上でデータを共有すると、グローバルかつ独占的、取消不能、譲渡可能、ロイヤリティフリーの「完全ライセンス」が付与されます。つまり、プラットフォームは画像を永久的に販売、使用、公開表示、保存し、さらには「派生作品」を作成することもできます。

Kled AIの創業者であるアヴィ・パテル氏は、この契約はAIのトレーニングと研究にのみデータを使用することを許可するものだと述べ、契約内容を擁護した。同社は購入者を審査し、「疑わしい意図」を持つ業界やデータを悪用する可能性のある組織を避けている。パテル氏は「事業全体がユーザーの信頼にかかっている」と語った。

しかし、そのような保証はどれほど信頼できるのだろうか？ボナディオ教授は、契約によってプラットフォームと顧客は「ほぼ何でもできる」と指摘している。

さらに厄介なのは、データが一度売られてしまうと、それがどこへ行くのか全く分からないという点です。スタンフォード大学人間中心AI研究所のデータプライバシー研究者であるジェニファー・キング氏は、これらのプラットフォームはデータがどのように、どこで使用されるのかを明確に説明していないと指摘します。消費者は「自分のデータが、気に入らない、理解できない、あるいは予想していなかった方法で再利用されるリスクに直面し、事実上、何の救済策もない」のです。

学者ローラ・キッテルの経験は、より典型的な例と言えるだろう。彼女は非営利団体や政府機関での仕事を探しており、友人からメルコール社を紹介された。契約書が届くと、彼女はそれを注意深く読んだ。契約条件には、彼女が著作権使用料を一切支払うことなく、既存および将来の学術論文、そして特定されていないクライアントに利益をもたらす可能性のあるあらゆる知的財産の使用を許可することが求められていた。

「これはちょっとやりすぎだと思う」と彼女は言った。

彼女は契約内容を変更したかったのだが、「メルビン」という名のAIアシスタントからメールで「変更はできません。同意できないなら退会してください」という返信があった。

メルコールは後に、この契約はプロジェクト中に参加者が使用することを選択した自身の作品にのみ適用されると説明した。使用されなかった作品は、この制限の対象外だった。しかし、キッテルにとって、その不快な感情は依然として残っていた。

05. 本当の勝者は誰ですか？

オックスフォード大学のインターネット地理学教授であり、『ザ・フィーディング・マシーン』の著者でもあるマーク・グラハム氏は、この資金は発展途上国の人々にとって短期的には役立つ可能性があると認めつつも、「構造的に見て、この種の取り組みは不安定で将来性に乏しく、実際には行き止まりだ」と警告している。

彼は、AI市場は「賃金底辺への競争」と「人間データに対する一時的な需要」によって牽引されていると述べた。

需要が変化すると、「労働者は保護を受けられず、応用可能なスキルも習得できず、安全も保障されない」。最終的な勝者は、「永続的な価値をすべて獲得する北半球のプラットフォーム」となる。

言い換えれば、ギグワーカーが今日稼ぐ一銭一銭が、AIの強化と知能向上に役立っているということだ。そして、AIが十分に強力になった時、それを訓練した人々が真っ先に取って代わられるかもしれない。

DoorDash Tasksのゼネラルマネージャーであるイーサン・ビーティ氏は、「これらは私たちが10年以上にわたって解決してきた現実世界の課題であり、私たちを助けてくれたのと同じ機能が他の企業にも役立つことに気づきました」と述べています。

DoorDashや同様の企業が行っているのは、配達ドライバーの業務経験をデータ資産に変換し、AIのトレーニングを必要とするあらゆる企業に販売することだ。

Uberも同じことをしている。

昨年10月、Uberはドライバー向けアプリにデジタルタスクのカテゴリを追加し、ドライバーがレストランのメニューをアップロードしたり、多言語の音声サンプルを録音したりできるようにした。また、Uber AI Solutions部門は30カ国に事業を拡大し、注釈付け、翻訳、モデルトレーニングサービスを提供している。

両社とも、Scale AIが先駆けた手法、すなわち分散型リモートワーカーを活用して新たなデータセットを作成し、AIの出力を検証するという道を辿っている。唯一の違いは、UberとDoorDashは数百万人の人材を擁しており、現実世界のあらゆる場所に直接配置できる点だ。

アルシヤの友人はかつて彼にこう問いかけた。「ああ、問題は君自身だ」。友人が言いたかったのは、人間しかできないことをAIに教えている君は、事態を悪化させているのではないのか、ということだった。

アルシガ氏は、新しい技術は常に不安と変化をもたらすが、同時に、彼の最新の仕事のように、新しいタイプの仕事も生み出すと答えた。「人はやはり人を必要とする」と彼は述べた。

問題は、AIがもはや「人間」を必要としなくなった時、その必要性は依然として存在するのか、ということだ。