廣場
最新
熱門
新聞
我的主頁
發布
ServantOfSatoshi
2026-04-01 22:05:23
關注
一直在關注NVIDIA在企業AI領域的最新動向,值得留意。他們剛剛推出了Nemotron 3 Super——一款擁有1200億參數、專為代理式AI工作流程設計的模型,時機也透露出資金真正流向的方向。
讓我特別注意的是:他們解決的核心問題其實相當具體,與多代理系統在實際應用中的運作方式密切相關。當你運行多個需要協調的AI代理時,很快就會遇到瓶頸。每次代理交互都會重新生成完整的對話歷史、工具輸出、推理鏈——這使得令牌用量比基本聊天機器人多出15倍。在企業規模運行時,這成本就變得非常高。Nemotron 3 Super通過一個1百萬令牌的上下文窗口來解決這個問題,讓代理能夠持有整個工作流程狀態,而不需要不斷重新處理。
這裡的架構選擇比標題的規格更為重要。他們採用混合專家(Mixture-of-Experts)設計,只有12億參數在推理時保持激活,儘管總參數達到1200億。效率提升的效果相當顯著——結合多令牌預測,他們聲稱推理速度提升3倍。在Blackwell硬體上,較上一代速度提升4倍,且不影響準確率。
真正能說明問題的是採用清單。Perplexity立即整合了這款模型。CodeRabbit、Factory和Greptile也將其融入他們的AI編碼代理中。但更重磅的工業應用則更具趣味——西門子(Siemens)、Dassault Systèmes和Cadence用於製造和設計自動化。Palantir和Amdocs則用於網絡安全和電信。這不是炒作的採用,而是真正的企業在部署代理系統來支持實際工作流程。
雲端部署已在Google Cloud、Oracle推出,AWS和Azure也即將推出。推理服務商如Fireworks AI和DeepInfra已經在提供服務。這個分佈很重要,因為它傳遞出對持續需求的信心。
有一點特別引人注意:NVIDIA開源了這個模型,並提供權重和超過10兆令牌的訓練數據。這是一個策略性布局——你不僅是在銷售模型,更是在打造一個生態系統,使Blackwell成為運行企業級代理式AI的預設硬體。該模型在Artificial Analysis效率排行榜上名列前茅,驗證了其工程實力。
對於追蹤這一動向的投資者來說,Nemotron 3 Super更像是一個信號,表明NVIDIA正指向企業AI的未來——朝著需要大量計算資源的專用代理系統邁進。真正的問題在於,這些部署是否能在2026年剩餘時間內持續推動Blackwell的需求。早期跡象顯示,應該會的。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見
聲明
。
1人按讚了這條動態
打賞
1
留言
轉發
分享
留言
請輸入留言內容
請輸入留言內容
留言
暫無留言
熱門話題
查看更多
#
四月行情預測
34.36萬 熱度
#
加密市場普遍上漲
7.05萬 熱度
#
金銀同步走強
34.57萬 熱度
#
ClaudeCode50万行源代码泄漏
81.23萬 熱度
#
川普釋放停戰訊號
42.94萬 熱度
熱門 Gate Fun
查看更多
Gate Fun
KOL
最新發幣
即將上市
成功上市
1
CGF
Children\'s_Growth_Fund
市值:
$0.1
持有人數:
0
0.00%
2
FAMO
FAMO
市值:
$2251.72
持有人數:
1
0.00%
3
sjz
三角洲
市值:
$2282.75
持有人數:
1
0.00%
4
per
pear
市值:
$2307.22
持有人數:
2
0.16%
5
888888888888
爆仓终结币
市值:
$2286.2
持有人數:
1
0.00%
置頂
🤔 此時此刻,全世界只有你還沒抽獎了?
別盯著盤面看啦,來 #Gate广场 抽個金條壓壓驚!
第 17 期成長值抽獎進行中,尤其是新朋友,中獎率 100%,真的不打算來“白嫖”一下嗎?
🎁 錦鯉清單: 10g 純金金條、紅牛賽車周邊、大額體驗券...
🚀 极速上車: 廣場發帖/點贊攢夠 300 積分即可開抽!
👇 戳這裡,測測今天的歐氣:https://www.gate.com/activities/pointprize?now_period=17
#BTC #ETH #GT
網站地圖
一直在關注NVIDIA在企業AI領域的最新動向,值得留意。他們剛剛推出了Nemotron 3 Super——一款擁有1200億參數、專為代理式AI工作流程設計的模型,時機也透露出資金真正流向的方向。
讓我特別注意的是:他們解決的核心問題其實相當具體,與多代理系統在實際應用中的運作方式密切相關。當你運行多個需要協調的AI代理時,很快就會遇到瓶頸。每次代理交互都會重新生成完整的對話歷史、工具輸出、推理鏈——這使得令牌用量比基本聊天機器人多出15倍。在企業規模運行時,這成本就變得非常高。Nemotron 3 Super通過一個1百萬令牌的上下文窗口來解決這個問題,讓代理能夠持有整個工作流程狀態,而不需要不斷重新處理。
這裡的架構選擇比標題的規格更為重要。他們採用混合專家(Mixture-of-Experts)設計,只有12億參數在推理時保持激活,儘管總參數達到1200億。效率提升的效果相當顯著——結合多令牌預測,他們聲稱推理速度提升3倍。在Blackwell硬體上,較上一代速度提升4倍,且不影響準確率。
真正能說明問題的是採用清單。Perplexity立即整合了這款模型。CodeRabbit、Factory和Greptile也將其融入他們的AI編碼代理中。但更重磅的工業應用則更具趣味——西門子(Siemens)、Dassault Systèmes和Cadence用於製造和設計自動化。Palantir和Amdocs則用於網絡安全和電信。這不是炒作的採用,而是真正的企業在部署代理系統來支持實際工作流程。
雲端部署已在Google Cloud、Oracle推出,AWS和Azure也即將推出。推理服務商如Fireworks AI和DeepInfra已經在提供服務。這個分佈很重要,因為它傳遞出對持續需求的信心。
有一點特別引人注意:NVIDIA開源了這個模型,並提供權重和超過10兆令牌的訓練數據。這是一個策略性布局——你不僅是在銷售模型,更是在打造一個生態系統,使Blackwell成為運行企業級代理式AI的預設硬體。該模型在Artificial Analysis效率排行榜上名列前茅,驗證了其工程實力。
對於追蹤這一動向的投資者來說,Nemotron 3 Super更像是一個信號,表明NVIDIA正指向企業AI的未來——朝著需要大量計算資源的專用代理系統邁進。真正的問題在於,這些部署是否能在2026年剩餘時間內持續推動Blackwell的需求。早期跡象顯示,應該會的。