ここ数か月で、@ perplexity_ai、@ browsercompany、そして@ OpenAIが独自のエージェンティックブラウザを発表しました。
彼らにとって、ブラウザ層を自社で所有するのは自然な流れです。これにより、ユーザーのOSや体験全体を自社で制御できるようになります。
これらのブラウザでできることは、主に「リード層」、つまり画面上の情報を読み取る・説明する・要約することが中心です。一方、cometのようなブラウザでは、ユーザーの代わりに書き込みアクションまで実行するブラウザエージェントを起動できます。

@ perplexity_ai comet with reddit
現状、エージェンティックブラウザで取引を実行する場合、プロセスは下記の通りです。

このプロセス全体には約10秒かかり、そのうちオンチェーンでスワップ処理に要する時間は約2秒です。
ブラウザエージェントは現在の画面を継続的にキャプチャし、画像を解析した後、DOM経由でアクションを実行します。アプリケーションのUIが複雑だと、この流れはさらに遅くなります。
暗号資産の世界では、ミリ秒単位の差が勝負を分けます。エージェントには物理的限界まで速くアクションしてほしいものです。例えば、Bloomberg Terminalのような複雑なUIをエージェント(ブラウザ)が解析している間に、最適なタイミングでトークンを買えなかった場面を想像してみてください。

2016年のMcD統計画面
上記のようなUIでは、どんなLLMでも操作は困難です。暗号資産領域の多くのプロトコルやアプリは、使いづらいインターフェースを持っています。
エージェンティックブラウザは、暗号資産の最大の強みである「データとプロトコルの公開性」を十分に活用できません。
暗号資産とやり取りするエージェントは、
ユーザーが英語で簡単なプロンプトを書くだけで、スクリプト作成やプログラミング、インフラ運用を気にせず、複雑な金融タスクを作成・実行できるシステムにアクセスできることは、すべてのユーザーの基本的権利であるべきです。
優れたプロンプトは、千行のコードより価値があります。
SendAIは、この基本的権利をすべてのユーザーに提供することを目指しています。





