測試時間計算縮放法則應該給你一個粗略的倍增器。



問題是人類的全局細胞要多得多,所以這就像是將主要是 MLP 的東西與主要是 transformers 的東西進行比較。
MORE2.51%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 5
  • 轉發
  • 分享
留言
0/400
韭当割不亏vip
· 13小時前
这规模增长有啥好纠结...
回復0
MEVSandwichMakervip
· 09-07 03:08
哈啊?mlp和transformer完全不是一个量级吧
回復0
0xLostKeyvip
· 09-07 03:07
mlp都老黄历了啊喂
回復0
分叉小王子vip
· 09-07 03:06
模型又不会梦到电子羊
回復0
gaslight_gasfeezvip
· 09-07 03:01
计算效率没那么好说辐
回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)