近日消息,據(jù)媒體報道,NVIDIA新一代旗艦AI芯片Blackwell被曝在高容量服務(wù)器機架中存在嚴重的過熱問題,可能導致交付延遲。
有知情人士爆料稱,Blackwell芯片在裝有72個處理器的服務(wù)器中使用時會產(chǎn)生過熱問題,這些機器預計每個機架的功耗高達120kw,過熱會限制GPU性能并有損壞組件的風險。
對此,NVIDIA發(fā)言人回應(yīng)媒體稱:“我們正在與領(lǐng)先的云服務(wù)提供商合作,將其作為我們工程團隊和流程中不可或缺的一部分。工程迭代是正常且符合預期的。將GB200這一迄今為止最先進的系統(tǒng)集成到各種數(shù)據(jù)中心環(huán)境中,需要與我們的客戶共同設(shè)計。”
雖然面臨技術(shù)問題,但NVIDIA的AI芯片需求依然強勁,全球近90%的市場仍由其控制,NVIDIA表示:“目前客戶正在搶占GB200系統(tǒng)的市場先機”。
值得注意的是,這并不是Blackwell芯片首次因設(shè)計缺陷而延遲交付,NVIDIA于今年3月推出了Blackwell芯片系列,但在年中的時候,市場上開始流傳Blackwell存在架構(gòu)設(shè)計隱患的消息。
10月晚些時候,NVIDIACEO黃仁勛表示,在長期合作伙伴臺積電的幫助下,NVIDIABlackwell AI芯片的設(shè)計缺陷已經(jīng)修復。
他當時預計,Blackwell芯片將在第四季度發(fā)貨,而如今據(jù)預計,改良后的Blackwell GPU最快要明年1月底才能出貨。
原創(chuàng)文章,作者:科技探索者,如若轉(zhuǎn)載,請注明出處:http://rponds.cn/article/693799.html