AIエージェントの現状と将来をざっと見てみる

先週は AI Agent をいじっていましたが、一昨日は AI Agent で実際に何ができるのか、そして将来何ができるのかを考えたいと思い、北京で開催された ai16z のイベントに参加しました。

AI エージェントの現状を見ると、自動販売機の中に隠れている人についてのミームを思い出します。誰もが想像するAIエージェントは自律的な意識を持ち始めていますが、実はAIエージェントの中には開発者が潜んでいます。（ここにいるみんなは絵をでっち上げようとしています。この絵をAIに生成させようとしましたが、AIは「隠す」を理解できないことがわかりました）

AIエージェントフレームワークの基本的な仕組み

AI Agent フレームワークは現在、クライアント (Twitter、Discord、Telegram など) とさまざまなプラグイン (チェーンなど) を接着する接着剤の役割を果たしており、フレームワークは基本的なライブラリ (メモリストレージ) を提供します。、セッション分離、コンテキスト生成）など、後でさまざまな AI プラットフォームインターフェイスに接続されます。

AI エージェントフレームワークがアプリケーションおよびビジネスシナリオとどのように統合されるか

昨年AIが普及して以来、さまざまなプラットフォームやツールが登場していますが、最も重要なのはAIとアプリケーションをどのように組み合わせて問題を解決するかです。 AI プラットフォームの中には、プラグインを提供しようとするもの、ワークフローモデルを作成するもの、および従来のアプリケーションの中に AI をアプリケーション内に埋め込むものがあります。ただし、ここで重要なのは次のとおりです。 1. アプリケーションの対話型入口はどこですか? 2. AI を既存のビジネスロジックと統合する方法。

各 AI プラットフォームがユーザーに提供するアプリケーションインタラクションポータルは、チャットウィンドウに似たダイアログボックスです。AI アプリケーションとのインタラクション方法は「擬人化」であるべきだと誰もが考えています。この点における AI Agent の優れた点は、すべてのオープン IM およびソーシャルシステムに直接接続していることです。これは、新しいシステムを構築するよりも明らかに受け入れられやすいです。

AI を既存のビジネスロジックと組み合わせる方法。 AI エージェントが提供するソリューションを使用すると、開発者は AI の意思決定をビジネスシナリオに統合できます。プログラミング言語は、if の条件が true または false である必要があり、あいまいなビジネスロジックを処理できません。 AI を通じて、複雑なロジックを正確な条件に変換し、ビジネスシナリオにシームレスに統合できます。

たとえば、グループ内のメッセージに返信する機能は、明確なメッセージ指示を通じて従来の IM Bot によってトリガーされる必要がありますが、AI を通じて shouldReplyMessage メソッドを実装でき、コンテキストに応じて true または false を返します。

ビジネスロジックシナリオにおける AI の主な機能は次のとおりです。

1.「意図」の発見：プロンプトワードの説明を通じて、AIがコンテキストに基づいてユーザーのテキストメッセージ内の「意図」を発見し、その意図を特定のコードにマッピングします。

2. 意思決定の支援: AI を使用して、あいまいで複雑な条件を明確な true/false または列挙型に変換し、ビジネスロジックに統合します。

これを見て、AI エージェントは AI に教えているだけで何でもできると思っている人も多いかもしれません。実際、大規模モデルのコンテキスト制限により、何でもできる万能 AI を作成する方法は (少なくとも現時点では) ありません。しかし、良いニュースは、プログラマーが職を失うことを心配する必要がないということです。AI の背後には依然として多数のプログラマーが存在する必要があり、他の場合には誰かが積み重なる必要があります。しかし、重要な違いは、ビジネスの境界があることです。プログラムが対応できる範囲は拡大しています。

2 人の AI エージェント

イベントでショー氏に質問したのは、AI エージェントに対する市場の期待は 2 つあります。 1. AI エージェントは独自の役割を果たし、独自の ID とブランドを持ち、ユーザーにサービスを提供します。 2. ユーザーはパーソナル AI エージェントを持っています。これはパーソナルアシスタントに相当し、ユーザーが何らかの業務を処理するのを支援できます。これら 2 つの AI エージェントのうち、どちらがより人気があるでしょうか?彼は両方の方向性が良く、それらを組み合わせることが可能であると感じました。

現在市場において、誰もが主に模索しているのは最初の方向です。この方向性は、AI Agentization というサービスと似ています。将来的には、アプリのインターフェイスがなくなり、AI Agent が擬人化される可能性があります。 2 番目の方向は、アプリケーションクライアントのエージェント化です。将来的には、アプリケーションクライアントはアシスタントエージェントのプラグインになり、同時にこのプラグインはエージェントメモリライブラリの一部になります。クラウドサービスエージェントとの通信も担当します。そしてこれは、インフラストラクチャ全体を変える新しいアプリケーションアーキテクチャモデルです。

AI エージェントのインフラストラクチャ要件

1. インフラストラクチャはパーミッションレスである必要があります。そうでない場合、AI エージェントはさまざまな攻撃対策戦略によって制限され、サービスは攻撃を防ぐために経済的なコスト (ガス) を使用する必要があります。この時点で、オープン性の比較的低いプラットフォームはより大きな影響に直面することになり、Web2 初期のオープンプラットフォームのブームが再燃することになります。

2. AI エージェントは、上記の問題を解決するために支払う資金を運用できる必要があります。

言い換えれば、将来のサービスは、ブロックチェーンに基づいているかどうかにかかわらず、Crypto の秘密キーモード認証と Crypto ベースの支払いをサポートする必要があります。

AIエージェントとチェーンの組み合わせ

上記の 2 点に加えて、AI Agent とチェーンをどのように組み合わせるかは、全員が模索している方向性です。イベントでは、ミッケが開発中の focEliza についてチャットします。前述の 2 つの AI エージェントのうち、少なくとも最初の AI エージェントには、チェーンによって提供される実行環境または検証環境が必要です。なぜなら、AIエージェントが外部にサービスを提供すると、信頼性の問題が発生し、その役割は実際にはスマートコントラクトと同じだからです。

当時、「スマートコントラクト」という名前については議論がありましたが、それは単なるコードにすぎませんでした。AI はその名前にふさわしいスマートコントラクトを作成できるのでしょうか。難しい問題は、スマートコントラクト環境でAIインターフェースをどのように呼び出すかです。大規模なモデルを検証可能な環境で実行できるようにするまでの道のりがまだ長い場合は、Oracle のようなソリューションを使用することがより実現可能な方法です。

AI エージェントを取り巻くニーズは数多くあります。AI エージェントの知識をどのように獲得するか? AI エージェントはどのように事実を判断するのでしょうか? AI エージェントは、異なるプラットフォーム上の同じユーザーをどのように識別しますか?スマートコントラクトでは「メモリ」はどのように保存されるのでしょうか?複数のデバイスがあり、それぞれに AI エージェントがインストールされている場合、メモリはどのように共有されますか?

これまで Web3 で行われていた「データのアップロード」、リレーションシップのアップロード、DID、P2P ネットワークなどが新しい意味とシナリオを持っていることがわかります。

結論

AI とブロックチェーンについて 21 年に一度共有した結論を再利用すると、AI に優しいインターネットは、人間にも優しいインターネットでもあります。当時は単なる思いつきでしたが、今では未来がここにあります。