著者:カリー、ディープタイドテックフロー
最近、トークンを何と呼ぶべきかという議論が始まっていることに気づいた方もいるかもしれません。
清華大学の楊斌教授は「トークンの中国語訳決定は間近」と題する論文を発表し、知乎上の関連する翻訳に関する質問は25万回閲覧され、コメント欄には多くのアイデアが寄せられている。
ここ2、3年、国内のAIコミュニティでは「トークン」という用語が特に問題なく使われてきた。なぜ突然中国語の名称が必要になったのか?
直接的な理由としては、今年の春節後、一般の人々が初めて、トークンにはお金がかかることを知ったことが挙げられるだろう。
OpenClawはAIを単なるチャットツールから作業ツールへと変革させ、1つのタスクに数十万トークンを消費することで、請求額を急騰させている。また、様々なクラウドベンダーも価格引き上げを発表しており、トークンが測定単位として用いられるようになっている。
同時に、トークンがこれまで存在すべきではなかった場所に現れ始めた。
GTCカンファレンスで、Nvidiaの社長であるジェンセン・フアン氏は、シリコンバレーではすでに面接時に「この仕事でどれくらいのトークンがもらえるのか」と尋ねる人がいると述べ、エンジニアの給与にトークンを含めることを提案した。
OpenAIの創設者であるサム・アルトマンはさらに踏み込み、トークンがすべての市民のベーシックインカムに取って代わり、誰もが受け取るのはお金ではなく、計算能力になると考えている。
国家データサイエンス局のデータによると、中国の1日あたりのトークン消費量は、2024年初頭の1000億から2025年9月には40兆を超え、今年2月には180兆に達した。人民日報は年初に「トークンに関する気軽な議論」と題した記事を掲載し、読者にこの用語の意味を説明した。
技術用語がクラウドサービスの請求書、給与明細、公式統計などに含まれるようになると、もはや英語とは呼べなくなる。
問題は、それを何と呼ぶべきかということだ。
これが単なる翻訳の問題であれば、とっくに答えが出ていたはずだ。2021年、中国の学術界は「トークン」に「語彙要素」という名称を与えた。
しかし、当時「トークン」は技術業界内の専門用語に過ぎなかったため、誰も気に留めなかった。
今は状況が変わった。
「トークン」という言葉は、本質的に多義的な用語である。仮想通貨の世界では「仮想通貨トークン」、セキュリティ分野では「トークン」、AI分野では「ワードエレメント」と呼ばれている。同じ英語の単語でも、中国語訳の方向性によって、その意味合いが大きく変わる。
こうして、そのトークンに名前を付けるための戦いが始まった。
ビジネスには発言力が必要だ
単語の翻訳は通常、言語学者の仕事である。しかし、今回の命名に関わった人々の中には、言語学者はほとんどいなかった。
今、最も話題になっている名前は「志遠」だ。
最も熱心な推進者は、「新知源」というAIメディアだ。Tokenの中国語名が「知源」であれば、同社のブランド名が業界の基本的な用語と重複するため、Tokenについて論じる記事はすべて、事実上無料の宣伝となる。
彼ら自身の宣伝記事は、実に率直にこう締めくくられていた。「Tokenを『新しい業界の共通認識:Zhiyuan』と訳すことを提案します。『新しい』という言葉は私たちにお任せください。」
同記事によると、白川知能の創業者である王暁川氏は「知源という名前はなかなか良い」とコメントした。
彼は大規模なモデルに取り組んでいるので、トークンを「知源(Zhiyuan)」と呼ぶのは良い考えだ。モデルの各計算結果は、もはや課金単位ではなく、「知能の基本単位」を生成する。
トークンを売ることはトラフィックを売ることだが、Zhiyuanを売ることはインテリジェンスを売ることだ。両者の評価ストーリーは全く異なる。
清華大学の楊斌教授は、「モジュール要素」という概念を提唱した。ここで「モジュール」はモデルに相当する。大型モデルを所有する者が「モジュール要素」の生産権を支配する。モデルを連想させる名称を用いることで、価格決定権はモデル企業へと移る。
中にはそれを「シンボルトークン」と呼ぶことを提唱する人もいる。コンピュータサイエンスにおける最も基本的な定義に戻ると、トークンとは、知能やモデルとは何の関係もないシンボル処理ユニットのことである。
技術的には最も簡潔な提案だったが、提案者は企業の支援や資金援助を受けていない独立した技術ライターであり、そのためこの議論においてほとんど発言権を持たなかった。
ある名前がどの方向に傾いているかによって、業界の動向や資金の流れが決まる。
遠い例を挙げると、Facebookが社名をMetaに変更した日が挙げられます。「メタバース」はSFの概念から企業の評価額を左右する物語へと変貌を遂げました。より最近の例としては、中国が1日に180兆トークンを消費しており、これは世界最多ですが、この用語の名称、定義、そして誰が定義すべきかといった問題は未解決のままです。
世界最大のトークン消費国は、消費するものを何と呼ぶべきかさえまだ決めていない。
しかし、この言葉には既に中国語の名前がある。
2021年、復旦大学コンピュータ科学部の邱希鵬教授は「トークン」を「語元」(cíyuán)と翻訳し、これが学術界に受け入れられ、教科書にも掲載された。当時、トークンは無価値だったため、誰もこのことについて議論しなかった。
トークンは今、価値がある。
それはクラウドサービスの会計単位であり、大規模AI企業の収益源であり、AI産業の規模に関する国家統計の中核的な指標でもある。そのため、メディア、大物、教授たちが集まり、それぞれが好みの名前と、その背後にある論理を持ち寄った。
翻訳自体が問題だったわけではない。問題は、この言葉がいつから価値を持つようになったかということだ。
ジェンセン・フアン氏はGTCでの中国語名称に関する議論には参加しなかった。彼はもっとシンプルなことをした。「トークンキング」と書かれたチャンピオンベルトを掲げ、データセンターの名称を「トークンファクトリー」と発表したのだ。
トークンを誰が生成し、誰がトークンを定義するのか。名前が何であろうと、彼は気にしない。
トークン、土地取得、鋳造
したがって、本当に検討すべき点は、どちらの翻訳が優れているかではない。
「カロリー」という用語が確立されて以来、食品業界全体の価格設定、表示、規制システムはこの用語を中心に構築されてきた。中国の通信業界で「データトラフィック」の定義が確立されて以来、通信事業者はデータトラフィックに基づいて課金し、データトラフィックに基づいて競争し、データトラフィックに基づいて料金プランを設計してきた。10年以上にわたり、ビジネスモデル全体がこの2つの言葉を中心に展開してきたのである。
トークンも現在、同じ経路をたどっています。
トークンはクラウドサービスの課金単位、大規模AI企業の収益指標、そして国家レベルでのAI産業規模を測る主要指標となっている。VCコミュニティでは、投資支払いをトークンで直接行うべきかどうかについても議論が始まっている。
ある言葉が貨幣の単位として使われるようになると、その言葉に名前を付けることはもはや翻訳ではなく、貨幣を鋳造する行為となる。
「インテリジェント元」と呼べば、通貨発行権はAIの物語に帰属し、知能の物語を語る者が利益を得る。「モデル元」と呼べば、通貨発行権はモデル企業に帰属し、優れたモデルを持つ者が紙幣を印刷できる。「キャラクター元」と呼べば、通貨発行権は技術そのものに戻るが、技術そのものが自ら語ることはない。
2021年における「語彙集」の学術的な定義は無視されたが、それは翻訳が下手だったからではなく、当時この「概念」に価値がなかったからである。
今ではそれは貴重なものとなり、誰もが自分の名前をそこに刻み込みたがる。

