OpenClaw 創設者へのインタビュー: AI は代替手段ではなくて手段であり、アプリの 80% が置き換えられます。

著者: Baoyu

これは、Peter Yang が司会を務める、ClawdBot/OpenClaw の作者である Peter Steinberger との 40 分間のインタビューです。

ピーターはPSPDFKitの創設者であり、iOS開発で20年近くの経験を持っています。2021年にInsight Partnersから1億ユーロの戦略的投資を受けた後、彼は「引退」を選択しました。現在、彼が開発したClawdbot（現在はOpenClawに改名）は驚異的な人気を博しています。ClawbotはWhatsApp、Telegram、iMessageでチャットできるAIアシスタントで、コンピューター上の様々なアプリケーションと連携します。

ピーターはクローボットについて次のように説明しました。

「まるでコンピューターの中に住んでいる友達のようです。ちょっと変わっているけど、恐ろしいほど賢いんです。」

このインタビューで彼は、複雑なエージェントオーケストレーションシステムが「スロップジェネレーター」である理由、「AI を 24 時間稼働させる」ことが虚栄心の指標である理由、プログラミング言語がもはや重要ではなくなった理由など、多くの興味深い視点を共有しました。

1時間のプロトタイプ、30万行のコード

ピーター・ヤンは彼に、クローボットとは何なのか、そしてなぜそのロゴがロブスターなのかを尋ねました。

ピーター・スタインバーガー氏はロブスターの質問に直接答えず、ある逸話を披露しました。「引退」後、彼はバイブコーディング、つまりAIエージェントがあなたに代わってコードを書くような仕事に全力を注いだのです。問題は、エージェントが30分も動き続けることもあれば、わずか2分で止まって質問をしてくることもあることです。外食に出かけて帰ってくると、エージェントが完全に固まっていて、非常にイライラさせられます。

彼は、いつでもスマホでパソコンの状態を確認できるようなものを求めていました。しかし、あまりにも当たり前すぎると感じたため、それを追求しませんでした。大企業ならきっとやってくれるだろうと思ったのです。

「昨年11月までに誰もやらなかったので、もういいや、自分でやろうと思ったんです。」

初期バージョンは非常にシンプルでした。WhatsAppをClaude Codeに接続するだけです。メッセージを送信すると、AIが結果を返信します。わずか1時間でセットアップが完了しました。

そして、Clawbotは「復活」しました。現在、Clawbotは約30万行のコードを持ち、ほぼすべての主要なメッセージングプラットフォームをサポートしています。

「これが未来の方向だと思います。誰もが、生涯にわたって付き添う超強力なAIを持つようになるでしょう。」

同氏は「AIにコンピューターへのアクセスを与えれば、基本的に人間ができることはすべてAIに任せられる」と語った。

モロッコの朝

ピーター・ヤン氏は、もうコンピューターの前に座ってじっと見つめる必要はなく、指示を与えるだけで済むようになると語った。

ピーター・スタインバーガーはうなずいたが、何か他のことについて話をしたかった。

ある時、モロッコで友人の誕生日を祝っていた時、彼はずっとClawbotを使っていたことに気づいた。道順を聞いたり、レストランのおすすめを探したりするのは、些細な作業だった。彼を本当に驚かせたのは、その朝、誰かが彼のオープンソースライブラリの一つにバグがあるとツイートしたことだ。

「ツイートの写真を撮ってWhatsAppに送っただけです。」

AIはツイートの内容を理解し、バグレポートだと認識しました。対応するGitリポジトリをチェックアウトし、問題を修正してコードをコミットし、Twitterで修正した旨を相手に返信しました。

「私は『こんなことが可能なのか？』と思いました」

さらに馬鹿げた例がもう一つありました。彼は通りを歩いていて、タイピングするのが面倒だったので、音声メッセージを送ったのです。問題は、彼がクロウボット用の音声メッセージ作成のサポートを一切提供していなかったことです。

「『入力中』と表示されたとき、『これだ』と思いました。でも、普通に返事が来ました。」

彼はその後、AIにどうやってそれをやったのか尋ねました。AIはこう答えました。「ファイルを受け取ったのですが、拡張子がなかったので、ファイルヘッダーを確認したらOgg Opus形式でした。あなたのパソコンにはffmpegがインストールされていたので、それを使ってWAVに変換しました。それからwhisper.cppを探しましたが、インストールされていませんでした。しかし、OpenAIのAPIキーを見つけたので、curlを使って音声を送信し、文字起こししました。」

ピーター・ヤンは、これを聞いてこう言いました。「これらは本当に独創的ですが、ちょっと怖いですね。」

ChatGPTのWeb版よりもはるかに優れています。ChatGPTが解き放たれたかのようです。Claude Codeのようなツールがプログラミングに最適であるだけでなく、あらゆる問題を解決できることに気づいていない人が多いです。

コマンドラインツール (CLI) Legion

ピーター・ヤン氏は、それらの自動化ツールはどのようにして作られたのか、彼自身で書いたのか、それとも AI に書いてもらったのかを尋ねました。

ピーター・スタインバーガーは笑った。

ここ数ヶ月、彼は「CLI軍団」の拡大に取り組んできました。インテリジェントエージェントの得意分野は何でしょうか？それはコマンドラインツールの呼び出しです。トレーニングデータにはそれだけしか含まれていないからです。

彼はPlaces APIを含むすべてのGoogleサービスにアクセスするためのCLIを構築しました。また、AIがメッセージに返信する際にミームを送信できるように、絵文字やGIFを検索するためのツールも作成しました。さらに、AIが音楽を「体験」できるように、音を視覚化するツールも作成しました。

「地元のフードデリバリープラットフォームのAPIもハッキングしました。今ではAIが食べ物が届くまでの時間を教えてくれます。また、Eight SleepのAPIをリバースエンジニアリングして、ベッドの温度も制御できるようにしました。」

[注: Eight Sleep は表面温度を調節できるスマートマットレスです。API は公式には公開されていません。]

Peter Yang 氏は次のように続けました。「これらすべてを AI に構築させたのですか?」

「一番興味深いのは、以前PSPDFKitで20年間Appleエコシステム向けの開発に携わり、SwiftとObjective-Cに精通していたことです。しかし、戻ってきてから方向転換を決意しました。Appleがあらゆることに干渉してくるのにうんざりし、Macアプリのユーザー層が狭すぎると感じたからです。」

問題は、自分が熟知しているテクノロジースタックから別のものに切り替えるのが苦痛なプロセスだということです。概念はすべて理解できても、構文がわからないのです。propとは何か？配列を分割するには？些細な疑問まで調べなければならず、自分がバカみたいに思えてしまいます。

「その後AIが登場し、それらはすべて消え去りました。システム思考、アーキテクチャスキル、センス、そして依存関係の判断力。これらこそが真に価値あるもので、今ではあらゆる分野に簡単に応用できます。」

彼は少しの間立ち止まって言った。

突然、何でも作れるような気がした。言語はもはや問題ではなく、エンジニアとしてのマインドセットが重要になった。

現実世界を制御する

ピーター・スタインバーガー氏が自身のセットアップのデモを始めました。彼がAIに付与した権限のリストは驚くべきものでした。

メール、カレンダー、すべての書類、Philips Hueの照明、Sonosのスピーカー。朝になるとAIに起こしてもらい、音量を徐々に上げてもらうこともできます。AIは防犯カメラにもアクセス可能です。

「ある時、見知らぬ人がいないか監視するように設定しました。すると翌朝、『ピーター、誰か来たよ』と教えてくれました。録画を確認すると、一晩中ソファのスクリーンショットを撮っていたんです。カメラの画質が悪かったので、ソファに誰かが座っているように見えました。」

ウィーンのアパートでは、AI が KNX スマートホームシステムを制御することもできます。

「本当に私を締め出すことができます。」

ピーター・ヤンは質問しました: これらはどのように関連しているのですか?

「直接伝えるだけです。これらの機能は非常に便利です。APIを見つけたり、Google検索したり、システム内のキーを探したりしてくれます。」

ユーザーはさらに熱狂的になっている:

誰かが、Tesco のオンラインストアから購入するように指示しました。
誰かがAmazonから注文しました。
誰かがすべてのメッセージに自動的に返信するように設定しました。
誰かがそれを「家族メンバー」として家族グループチャットに追加しました。

「ブリティッシュ・エアウェイズのウェブサイトでチェックインをさせてもらいました。まるでチューリングテストのようでした。航空会社のウェブサイトでブラウザを操作すると、インターフェースがいかに直感に反するかが分かります。」

初回は、システム全体がまだかなり未熟だったため、20分近くもかかりました。AIはDropboxでパスポートを探し、情報を抽出し、フォームに記入し、人間による認証を通過する必要がありました。

「今では数分で完了します。本物のブラウザを操作しているため、『私は人間です』という認証ボタンをクリックできます。その動作は人間と何ら変わりません。」

アプリの80%が消えます。

Peter Yang 氏は次のように質問しました: アプリをダウンロードしたばかりの一般ユーザーにとって、安全で使いやすいヒントは何ですか?

ピーター・スタインバーガー氏は、人それぞれ進む道は異なると述べました。インストールしてすぐにiOSアプリの開発を始める人もいれば、すぐにCloudflareの管理を始める人もいます。あるユーザーは、1週間目に自分用に、2週間目に家族用にインストールし、3週間目には会社用のエンタープライズ版の構築を始めました。

「技術に詳しくない友人のためにインストールしたら、彼からプルリクエストが送られてくるようになりました。彼は人生で一度もプルリクエストを送ったことがなかったんです。」

しかし、彼が本当に伝えたかったのは、もっと大きな全体像でした。

「考えてみれば、このデバイスは携帯電話のアプリの80％を置き換えることができるかもしれません。」

食事の記録に MyFitnessPal を使い続ける理由は何でしょうか?

「私には、私がKFCで間違った選択をしたことをすでに知っている、とびきり機転が利くアシスタントがいます。写真を投稿すると、データベースに保存し、カロリーを計算し、ジムに行くようにリマインダーを送ってくれます。」

Eight Sleepの温度設定にアプリを使うのは面倒？ AIはAPI権限を持っているので、あなたに代わって直接調整できます。ToDoリストアプリを使うのは面倒？ AIが代わりに記録します。フライトのチェックインにアプリを使うのは面倒？ AIが代わりにやってくれます。ショッピングアプリを使うのは面倒？ AIは商品をおすすめしたり、注文したり、取引を追跡したりできます。

「アプリの層全体が徐々に消えていくでしょう。なぜなら、API があれば、それは AI が呼び出す単なるサービスになってしまうからです。」

彼は、2026年は多くの人々がパーソナルAIアシスタントを検討し始める年となり、大企業も市場に参入するだろうと予測している。

「クローボットは最終的な勝者ではないかもしれないが、正しい方向に進んでいる。」

ただ話しかけるだけ

その後、話題はAIプログラミングの方法論に移りました。ピーター・ヤン氏は「Just Talk to It」という非常に人気のある記事を執筆したことに触れ、その詳細を尋ねました。

ピーター・スタインバーガー氏の主張の中心は、「エージェントの罠」に陥らないことだ。

Twitterでは、インテリジェントエージェントの強力さに気づき、さらに強力にしようとして、結局は行き詰まってしまう人を多く見かけます。ワークフローを高速化するために、ありとあらゆる複雑なツールを開発しますが、実際にはツールを作っているだけで、真に価値のあるものを作っているわけではありません。

彼自身もこの罠に陥っていました。当初、彼は携帯電話の端末にアクセスするためだけにVPNトンネルを構築するために2ヶ月を費やしました。彼はそれをあまりにもうまくやり遂げたため、友人と夕食を共にしている間、会話に参加するどころか、ずっとVibeを使って携帯電話でコーディングをしていたほどです。

「主に精神衛生上の理由でやめなければなりませんでした。」

スロップタウン

最近彼を悩ませているのは、Gastown と呼ばれるオーケストレーションシステムです。

非常に複雑なオーケストレーターが、12～20のエージェントを同時に操作し、相互に通信し、タスクを分担しています。監視者、監督者、市長、PCAT（「民間人」や「飼い猫」といった役割を補うこともある）など、他に何がいるのか全く分かりません。

ピーター・ヤン：ちょっと待ってください、市長もいるんですか？

「はい、ガスタウンプロジェクトには市長がいます。私はこのプロジェクトを『スロップタウン』と呼んでいます。」

RALPH モード (AI に小さなタスクが与えられ、完了するとすべてのコンテキストメモリが破棄され、すべてがリセットされて最初からやり直され、無限ループが発生する「使用してプレイする」単一タスクループモード) もあります...

「これは究極のトークンバーナーです。一晩中運転すれば、翌朝には最高のスロップが出来上がります。」

問題の核心は、これらのインテリジェントエージェントにはセンスがないということです。ある意味では恐ろしいほど賢いのですが、指示を与えず、何が欲しいのかを伝えなければ、出てくるのはゴミばかりです。

他の人のやり方は分かりませんが、プロジェクトを始める時は漠然としたアイデアしかありません。でも、実際に作って、遊んで、経験していくうちに、徐々にビジョンが明確になってきます。いくつか試してみて、うまくいかないこともあり、そしてアイデアは最終形へと進化していきます。次のインスピレーションは、私が見て、感じて、考えている今の自分の状態によって決まります。

すべてを初期の仕様に書き込もうとすると、この人間と機械のループを見逃してしまいます。

「プロセスを感じたり、評価したりせずに、どうすれば良いものを作れるのか分かりません。」

Twitterで誰かが「完全にRALPHが生成した」メモアプリを披露していました。ピーターはこう返しました。「確かに、RALPHが生成したように見えますね。普通の人があんな風にデザインするはずがありません。」

Peter Yang 氏は次のように結論づけています。「多くの人が AI を 24 時間実行するのは、アプリを開発するためではなく、AI を 24 時間実行できることを証明するためです。」

「まるで基準のないサイズ競争のようです。26時間もループを走ったことがあり、当時はかなり誇りに思っていました。しかし、それは虚栄心の指標で、意味がありません。全てを作れるからといって、全てを作るべきだというわけではありませんし、良いものになるわけでもありません。」

プランモードはパッチワーク（ハック）です。

ピーター・ヤン氏は、文脈をどのように管理するのかを尋ねました。会話が長すぎるとAIが混乱する可能性があります。手動で要約したり、要約したりするべきでしょうか？

ピーター・スタインバーガー氏は、これは「古いモデルの問題」だと述べた。

Claude Code にはまだこの問題がありますが、Codex ははるかに優れています。理論上はコンテキストが 30% しか増えていないかもしれませんが、体感的には 2～3 倍増えているように感じます。これは内部の思考メカニズムに関係していると思います。今では、機能開発のほとんどを単一のコンテキストウィンドウ内で完了でき、議論と構築が同時に行えます。

彼はWorktreesを「不必要な複雑さ」と見なしているため使用していません。clawbot-1、clawbot-2、clawbot-3、clawbot-4、clawbot-5といった複数のリポジトリをチェックアウトし、利用可能なものを使ってテストを完了し、メインブランチにプッシュして同期しています。

「工場が全部忙しいような感じです。でも、1つしか開いていないと、待ち時間が長すぎてフロー状態に入ることができません。」

ピーター・ヤン氏は、このゲームは、攻撃するチームを管理し、監視する必要があるリアルタイム戦略ゲームのようなものだと語った。

プランモードに関して、Peter Steinberger 氏は物議を醸す見解を示しています。

プランモードは、モデルが衝動的すぎてすぐにコードを書き始めてしまうため、Anthropic が追加せざるを得なかったパッチワーク的なソリューションでした。GPT 5.2 のような最新のモデルを使用している場合は、基本的にモデルに話しかけることになります。『この機能を構築したいのですが、こうあるべきですか、あああるべきですか、このデザインスタイルが好きです。いくつか提案をください。まずはそれらについて話し合いましょう』と。するとモデルが提案し、それについて話し合い、合意に達し、そして行動に移します。

彼はタイプするのではなく、話すのです。

私はたいていそれに話しかけます。

Discord ドライバー開発

ピーター・ヤンは彼に、新機能を開発する際のプロセスについて尋ねました。まず問題を調査するのでしょうか？それとも、まず計画を立てるのでしょうか？

ピーター・スタインバーガー氏は、「おそらくこれまでやった中で最もクレイジーなこと」をやったという。彼は自分のクローボットをパブリックの Discord サーバーに接続し、誰もが自分のプライベートな記憶を持つプライベート AI とパブリックで話せるようにしたのだ。

このプロジェクトは言葉で説明するのが難しいです。まるでジャービス（『アイアンマン』のAIアシスタント）と映画『her/世界でひとつの彼女』を掛け合わせたような感じです。実際にデモンストレーションした時は皆とても興奮していましたが、Twitterに写真とキャプションを投稿してもなかなか拡散されませんでした。そこで、実際に体験してもらってはどうかと考えました。

ユーザーはDiscord上で質問やバグ報告、リクエストをします。彼の現在の開発プロセスは、Discordでの会話のスクリーンショットを撮り、ターミナルにドラッグして、AIに「これについて話しましょう」と指示するだけです。

「タイピングするのは面倒くさいんです。『これやあれをサポートしていますか？』と聞かれたら、AIにコードを読んでもらってFAQを書いてもらうだけです。」

彼はまた、Discord のヘルプチャネルを少なくとも 1 日に 1 回スキャンする Web クローラーを作成し、AI が最大の問題点を要約して修正できるようにしました。

MCPも複雑なオーケストレーションも不要

Peter Yang 氏はこう尋ねました。「そういう高度な技術は使っているんですか？マルチエージェントシステム、複雑なスキル、MCP (モデルコンテキストプロトコル) などですか？」

私のスキルは主に生活スキルです。食事の記録や食料品の買い物などです。プログラミングの知識はほとんどありません。必要がないからです。MCPなども使っていません。

彼は複雑なオーケストレーションシステムを信じていません。

「ループの中にいると、より良い感触の製品を作れるようになります。もっと速い方法もあるかもしれませんが、ボトルネックはもはやAIではなくなるところまで来ています。制限されるのは主に自分の思考速度と、たまにCodexを待つ時間です。」

元弁護士である元 PSPDFKit の共同設立者も、今では彼に PR (プルリクエスト) を送信しています。

AIのおかげで、技術的なバックグラウンドを持たない人でも何かを構築できるようになったのは素晴らしいことです。中には「このコードは完璧ではない」と反論する人もいるでしょう。しかし、プルリクエストは迅速なリクエストであり、意図を伝えるものだと私は考えています。ほとんどの人はシステムに対する理解が異なり、モデルを最適な結果に導くことができません。ですから、私はプルリクエストの意図を理解して自分で作業するか、プルリクエストに基づいて書き直すことを好みます。

彼は彼らを共同著者としてマークしていましたが、他の人のコードを直接マージすることはほとんどありませんでした。

自分の道を見つける

ピーター・ヤンは次のように結論づけている。「重要な点は、スロップジェネレーターを使わず、常に関係者に情報を伝えることです。人間の脳と味覚はかけがえのないものですから。」

ピーター・スタインバーガー氏は次のように付け加えた。

むしろ、自分の道を見つけてください。よく『どうやってそれを成し遂げたのですか？』と聞かれますが、答えは『自分で探求するしかない』です。こうしたことを学ぶには時間がかかり、自ら失敗を経験することも必要です。他のどんなことを学ぶのにも共通することですが、この分野は変化が特に速いという点が異なります。

Clawdbotはclawd.botとGitHubで見つかります。Wの文字が刻まれたCLAWDBOTは、ロブスターの爪のような見た目です。

(注: ClawdBot は OpenClaw に名前が変更されました)

ピーター・ヤン氏は、どうしても試してみたかったと語った。コンピューターの前に座ってAIと会話するのは嫌だった。子供と外出中にいつでもAIに指示を出せるようにしたかったのだ。

「きっと気に入っていただけると思いますよ」とピーター・スタインバーガーは言った。

ピーター・スタインバーガーの核となる主張は、次の 2 つの文に要約できます。

AIは非常に強力になり、携帯電話のアプリの80%を置き換えることができるようになりました。
しかし、そのサイクルの中に人間の味覚と判断力がなければ、出力は単なるゴミになってしまいます。

一見矛盾しているように見えるこの二つの主張は、実際には同じ結論を指し示しています。AIは代替手段ではなく、てこであるということです。AIは、システム思考、アーキテクチャ能力、そして優れた製品に対する直感といった、既に持っているものを増幅させます。これらがなければ、複数のインテリジェントエージェントを24時間並行して稼働させることは、単にSLOPS（スケーリングループ）を大量生産するに過ぎません。

彼の実践自体が最良の証拠です。20 年のキャリアを持つベテラン iOS プログラマーが、新しい言語の構文を学習したのではなく、言語に依存しない手法で、わずか数か月で 30 万行のコードプロジェクトを TypeScript で構築しました。

「プログラミング言語はもはや重要ではありません。重要なのは私のエンジニアリングの考え方です。」