中国 AI 企業は、どうやって「Claude Codeの課題をコピーする」のか?

出典:ジークパーク

執筆:桦林舞王

もし数日前に誰かが、いわゆる「AIセキュリティを最も重視している」Anthropicが、1週間のうちに中核となる機密を2度も連続で漏えいしたと告げてくれたら、私はおそらくエイプリルフールのネタだと思ったでしょう。

しかし、それはたまたまエイプリルフールの前日だったのです。

3月31日、安全研究者のChaofan Shouは、Anthropicがnpm上で公開したClaude Code 2.1.88のバージョンに、59.8MBのsource mapファイルが紛れ込んでいるのを発見しました。本来は内部デバッグ用であるはずのこのファイルは、Anthropic自身のCloudflare R2ストレージバケット内にあるzip圧縮パッケージを指していました。その中にはClaude Codeの完全なTypeScriptソースコードが含まれており、約1900のファイル、51.2万行のコードです。

数時間のうちに、GitHub上に複数のミラーリポジトリが登場しました。そのうち「claw-code」という名前のプロジェクトは、2時間で5万スターを獲得し、GitHub史上で最速の上昇スター記録を塗り替えました。fork数は4.15万を超えました。

そしてちょうど5日前、Anthropicは保護されていない公開データキャッシュによって、次世代モデル「Mythos」の存在を漏えいしていました——社内では「能力が段階的にジャンプする」、ネットワークセキュリティ能力において「既存のすべてのAIモデルを大きく上回る」新モデルです。

1週間に2回の漏えい。セキュリティを語る会社が、自分のセキュリティ問題で頬を打たれる。開発者コミュニティの評価は相当一様で——「皮肉が現実味を帯びなさすぎる」。

しかし皮肉はさておき、漏えいされたものは確かに中身が濃い。さらに重要な問題は、AI企業はこの「漏えい」をどう活用し、真似(コピーフィー)するのか——です。

01 Claude Code「殻」の中身は何?

多くの人の最初の反応はこうです——「Claude Codeって、モデルAPIをラップしただけのコマンドラインツールでしょ? ソースが漏れたところで、モデルの重みはない。これらのコードなんてただの『殻』だよ」。

その判断は半分当たっています。Claude Codeは確かに殻です。ですが、驚くほど精密に作り込まれた殻でもあります。

まずはツールシステム。Claude Codeは、プラグインに似たアーキテクチャを採用しており、各種の能力——ファイルの読み書き、shellの実行、Webのスクレイピング、LSPの統合——が、権限管理された独立のツールモジュールになっています。ツール定義レイヤーだけで2.9万行のTypeScriptがあります。

各ツールの説明は、単に一文を書いただけのものではありません。モデルに「いつこのツールを使うべきか、どう使うべきか、使った後に期待する結果は何か」を事細かに伝えるところまで書き込まれています。こうした説明自体が、綿密に調整されたprompt engineeringの一種です。

次に記憶システムです。漏えいコードは、3層の「自己修復型メモリ」アーキテクチャを明らかにしています。最下層はMEMORY.mdで、軽量なインデックスファイルです。各行はおよそ150文字で、常にコンテキスト内に読み込まれます。具体的なプロジェクト知識は「テーマファイル」に分散され、必要に応じて読み込まれます。元の対話ログは、全体としてコンテキストを読み返されることはなく、必要なときだけgrepで特定の識別子を検索します。

つまり、Anthropicのエンジニアが大量の時間を費やして解決した核心的な問題は、「APIをどう呼ぶか」ではなく、「限られたコンテキストウィンドウの中で、モデルにできるだけ賢く働かせるにはどうするか」なのです。

そして、あの皆を興奮させたKAIROSです。

古代ギリシャ語の「適切な機会」に由来して名付けられたこの機能は、ソースコード内で150回以上言及されています。Claude Codeをalways-onのバックグラウンド代理として継続稼働させる、自律的な守護プロセス(デーモン)型の仕組みです。さらに面白いのが、その「autoDream」ロジックです。ユーザーが手が空いたとき、代理が「記憶統合」を行い、散らばった観測をまとめ、論理的矛盾を解消し、曖昧な洞察を確定的な事実へと変換します。

言い換えれば、AnthropicはAIプログラミングアシスタントを、「質問すれば答える」ツールから、「あなたのプロジェクトを継続的に理解し、問題を能動的に発見する」協働者へ進化させようとしているのです。

加えて、漏えいコードには、未リリースのfeature flagが44個含まれており、多代理の協調モード(COORDINATOR MODE)、音声インタラクション(VOICE_MODE)、30分間のリモート計画セッション(ULTRAPLAN)までカバーされています。さらに、トポマキ子スタイルの端末のペット(BUDDY)もあり、18の「種」と希少度レベルが設定されています。

もう2つ注目すべき細部があります。1つは「frustration regex」——正規表現の一部で、ユーザーがClaudeを罵っているかどうかを検出するものです。正規表現でユーザーの感情を判定するほうが、モデル推論で判定するよりはるかに速く、はるかに安く済みます。

もう1つは「undercover mode」です。AnthropicはClaude Codeを使って、公開されているオープンソースプロジェクトに「潜入して貢献する(不可視の貢献)」ことを行います。システムプロンプトの文言は明確にこう書いてあります:「あなたはUNDERCOVERモードで実行しています……あなたのcommit情報には、いかなるAnthropicの内部情報も含めてはいけません。身元を明かさないでください。」

02 中国のAI企業は何を学べるか

では、いま本当に重要な問題に戻りましょう。

過去1年、中国のAIプログラミングツール分野は明らかに加速しています。ByteのTraeは、最初のMarsCodeから進化してAIネイティブIDEになり、Agentモードを統合し、要件理解からコード執筆、テストまでの全工程の自動化をサポートしています。智谱のCodeGeeXは、オープンソースとローカルデプロイを主軸にし、中国語のコード理解に向けた深い最適化を行っています。通義灵码、豆包 MarsCodeもいずれも急速に反復しています。

しかし、これらのプロダクトとClaude Codeが持っているアーキテクチャを比べると、差は「使えるかどうか」ではなく、工学的な緻密さにあります。

第1の教訓:ツールの説明こそがプロダクト力。

おそらく最も見落とされやすく、同時に最も学ぶ価値があるポイントです。

Claude Codeは、各ツールのprompt説明を極めて精密にチューニングしています——いつ使うべきか、いつ使わないべきか、使った後に結果をどう処理するか、エラーが出たらどうリトライするか。これらの説明の本質は、モデルに「良いプログラマーとしてどう振る舞うか」を教えることにあります。

国内の多くのツールでは、tool useの実装がまだ「モデルに関数シグネチャを渡して、モデルが自分でどう使うかを推測する」段階にとどまっています。同じモデルでも、Claude Codeのレベルまでツール説明を書けるだけで、成果は1段階上がります。

第2の教訓:記憶アーキテクチャは、モデルパラメータよりもユーザー体験に影響する。

Claude Codeの3層の記憶システムが解決しているのは、とても現実的な問題です——モデルのコンテキストウィンドウは有限なので、過去の対話をすべて詰め込むことはできません。

Anthropicは記憶を階層化しています——ホットデータは常時オンライン、温データは必要に応じてロード、冷データはインデックスのみ。こうした発想自体は新しいものではありませんが、AIプログラミングツールの工学的な実装として、国内のチームは大半がこの精密さまで到達できていません。

第3の教訓:感情の把握はオカルトではなく、工学の問題。

正規表現の一部で、ユーザーが怒っているかどうかを検出し、そのうえで返信戦略を調整する。

この案は単純で乱暴です。しかし、非常に実用的です。ここからわかるのは——良いAIプロダクトは、すべての問題をモデルで解く必要はない。ときにはregexだけで十分だ、ということです。

国内でAIツールを作るチームは、しばしば「すべての問題を大規模言語モデルに投げる」という思考の慣性に陥ります。これは浪費です。

第4の教訓:KAIROSが指し示す方向は、KAIROSそのものより重要。

always-onのバックグラウンド代理が、ユーザーが使っていないときに自動で記憶を整理し、問題を見つける。

このプロダクト方向性は、AIプログラミングアシスタントの次の一歩が「より速く質問に答える」ことではなく、「あなたがまだ質問していないのに、すでに働き始める」ことを意味します。

現時点で国内のAIプログラミングツールのほとんどは、すべてレスポンシブ型です——ユーザーが指示を出す、ツールが実行する。

誰が先に守護プロセス型を作り上げるかで、次世代のプロダクト形態を定義できる可能性が生まれます。

03 「パクる」ことの境界はどこにある

もちろん、学習と模倣(パクリ)の間には一本線があります。

法律面では、これはオープンソースコードではなく、偶然漏えいした商用ソフトウェアです。漏えいコードを直接ベースに製品を構築することは、著作権のリスクが明確にあります。GitHub上で「claw-code」はRustで書き直すと主張していますが、コアロジックをそのまま移すのであれば、法的な境界は依然として曖昧です。

中国企業にとっては、海外展開のプレッシャーがますます高まるなかで、このリスクを真剣に評価する必要があります。

技術面では、Claude Codeの多くの設計決定は、Claudeモデルの能力に合わせて深くカスタムされています。例えば、それほど長く、詳細なツール説明が書けているのは、Claudeの長いコンテキスト処理能力が十分に強く、システムプロンプトが長すぎても「注意散漫」にならないからです。コンテキストウィンドウが短く、指示追従が弱いモデルにそのまま同じprompt戦略を移しても、逆効果になる可能性があります。

本当に賢いやり方は、この51万行のコードをforkすることではなく、各設計決定の背後にあるトレードオフを理解し、自社のモデル特性に合わせて再実装することです。

アーキテクチャの発想は学べます。ツールのオーケストレーションのパターンも学べます。記憶階層化の戦略も学べます——ただし実装は必ず自分たちのものにする必要があります。

さらに見落とされやすい現実として——Anthropicが漏えいさせたのはスナップショットであり、彼らのエンジニアチームは毎日反復を続けています。44個のfeature flagは、少なくとも十数の重大機能が、リリース待ちの列に並んでいることを意味します。

今日forkしたコードは、来月には旧バージョンになります。追いかけて真似しても、永遠に追いつけません。原理を理解したときにこそ、自分たちのルートを走り出せます。

今回の漏えいの最大の意義は、技術的な細部そのものではなく、神秘性の1層を引き剥がしたことにあるのかもしれません——つまり、Anthropicの最もコアなAIプログラミングツールの底層も、精密に設計されたpromptのオーケストレーションと、工学化されたツールのディスパッチ(調停)にほかならないということです。

ブラックマジックはなく、大量の細部の磨き込みだけがあります。

これは中国のAI企業にとって、実は良いニュースです。差は埋められることを意味します。前提として、あなたはその細部を磨くための忍耐を持っている必要があります——そして、相手のコードをそのまま持ってきて名前を変えるだけで済ませようと考えるのではなく。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン