最近做了一次多模型互搏,有個挺有意思的發現。


同一個架構題,我分別讓 Claude 和 Codex 獨立寫方案。
Codex 漏了一件事:我的策略分散在 20 多個獨立的進程裡,它寫的方案默認"所有組件跑在同一個地方",直接無效。Claude 一眼看出這個問題。
反過來 Claude 漏了另一件事:它執著於新建獨立的模組,其實我手裡已經有一整套現成的框架可以搭車,加一個字段就夠了。Codex 把這條撿了回來。
最有意思的是後面這步:我讓兩個模型互相 review 對方的最終方案,雙方都下意識錨定了"對方已經寫好的框架",結果一起漏掉了一個邊界情況——最後是我手動跑生產數據才發現的。
所以現在的習慣是:每一輪互搏都給獨立的成功標準,禁止讓一個模型看另一個模型的底稿。拿到手的是兩份盲區不重疊的獨立底稿,合起來才接近完整。
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言