测试时间计算缩放法则应该给你一个粗略的倍增器。



问题是人类的全局细胞要多得多,所以这就像是将主要是 MLP 的东西与主要是 transformers 的东西进行比较。
MORE2.51%
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 5
  • 转发
  • 分享
评论
0/400
韭当割不亏vip
· 13小时前
这规模增长有啥好纠结...
回复0
MEVSandwichMakervip
· 09-07 03:08
哈啊?mlp和transformer完全不是一个量级吧
回复0
0xLostKeyvip
· 09-07 03:07
mlp都老黄历了啊喂
回复0
分叉小王子vip
· 09-07 03:06
模型又不会梦到电子羊
回复0
gaslight_gasfeezvip
· 09-07 03:01
计算效率没那么好说辐
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)