2026-04-08 10:41:05

最近做了一次多模型互搏，有個挺有意思的發現。

同一個架構題，我分別讓 Claude 和 Codex 獨立寫方案。
Codex 漏了一件事：我的策略分散在 20 多個獨立的進程裡，它寫的方案默認"所有組件跑在同一個地方"，直接無效。Claude 一眼看出這個問題。
反過來 Claude 漏了另一件事：它執著於新建獨立的模組，其實我手裡已經有一整套現成的框架可以搭車，加一個字段就夠了。Codex 把這條撿了回來。
最有意思的是後面這步：我讓兩個模型互相 review 對方的最終方案，雙方都下意識錨定了"對方已經寫好的框架"，結果一起漏掉了一個邊界情況——最後是我手動跑生產數據才發現的。
所以現在的習慣是：每一輪互搏都給獨立的成功標準，禁止讓一個模型看另一個模型的底稿。拿到手的是兩份盲區不重疊的獨立底稿，合起來才接近完整。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

2人按讚了這條動態

打賞
2
留言
轉發
分享

留言

請輸入留言內容

暫無留言

熱門話題
查看更多
#
Gate廣場四月發帖挑戰
105.76萬熱度
#
加密市場回升
3.38萬熱度
#
黃金白銀走高
8.63萬熱度
#
川普同意停火兩週
52.47萬熱度
#
WTI原油暴跌
91.87萬熱度

熱門 Gate Fun
查看更多

1
S
Story
市值:$2262.06持有人數:1
0.00%
2
oil
石油
市值:$2313.34持有人數:2
0.14%
3
ANDRO
ANDROMEDA
市值:$2262.06持有人數:1
0.00%
4
db
豆包
市值:$2275.86持有人數:1
0.00%
5
G
Gost face
市值:$2290.93持有人數:2
0.00%

最近做了一次多模型互搏，有個挺有意思的發現。

熱門話題

Gate廣場四月發帖挑戰

加密市場回升

黃金白銀走高

川普同意停火兩週

WTI原油暴跌

熱門 Gate Fun

S

Story

oil

石油

ANDRO

ANDROMEDA

db

豆包

G

Gost face

置頂