英偉達(dá)發(fā)布8B新AI 模型：精度、效率高，可在 RTX 工作站上運(yùn)行

蘋果派 ? 2024年8月23日 12:05:00 ? AI

英偉達(dá)于 8 月 21 日發(fā)布博文，發(fā)布了 Mistral-NeMo-Minitron 8B 小語言 AI 模型，具備精度高、計(jì)算效率高等優(yōu)點(diǎn)，可在 GPU 加速的數(shù)據(jù)中心、云和工作站上運(yùn)行模型。

8 月 23 日消息，英偉達(dá)于 8 月 21 日發(fā)布博文，發(fā)布了 Mistral-NeMo-Minitron 8B 小語言 AI 模型，具備精度高、計(jì)算效率高等優(yōu)點(diǎn)，可在 GPU 加速的數(shù)據(jù)中心、云和工作站上運(yùn)行模型。

英偉達(dá)發(fā)布8B新AI 模型：精度、效率高，可在 RTX 工作站上運(yùn)行

英偉達(dá)攜手 Mistral AI 上月發(fā)布開源 Mistral NeMo 12B 模型，在此基礎(chǔ)上英偉達(dá)再次推出更小的 Mistral-NeMo-Minitron 8B 模型，共 80 億個(gè)參數(shù)，可以在搭載英偉達(dá) RTX 顯卡的工作站上運(yùn)行。

英偉達(dá)表示通過寬度剪枝（width-pruning）Mistral NeMo 12B，并知識(shí)蒸餾（knowledge distillation）輕度重新訓(xùn)練后獲得 Mistral-NeMo-Minitron 8B，相關(guān)成果發(fā)表在《Compact Language Models via Pruning and Knowledge Distillation》論文中。

剪枝通過去除對(duì)準(zhǔn)確率貢獻(xiàn)最小的模型權(quán)重來縮小神經(jīng)網(wǎng)絡(luò)。在 “蒸餾” 過程中，研究小組在一個(gè)小型數(shù)據(jù)集上重新訓(xùn)練剪枝后的模型，以顯著提高通過剪枝過程而降低的準(zhǔn)確率。

就其規(guī)模而言，Mistral-NeMo-Minitron 8B 在語言模型的九項(xiàng)流行基準(zhǔn)測(cè)試中遙遙領(lǐng)先。這些基準(zhǔn)涵蓋了各種任務(wù)，包括語言理解、常識(shí)推理、數(shù)學(xué)推理、總結(jié)、編碼和生成真實(shí)答案的能力。

原創(chuàng)文章，作者：蘋果派，如若轉(zhuǎn)載，請(qǐng)注明出處：http://rponds.cn/article/675640.html

Mistral-NeMo-Minitron 8B 小語言 AI 模型英偉達(dá)

蘋果派管理團(tuán)隊(duì)

0 0

新聞

英偉達(dá)2025-2026年度博士獎(jiǎng)學(xué)金揭曉：6位華人學(xué)者獲獎(jiǎng)

今日，英偉達(dá)公司公布了其2025-2026年度博士獎(jiǎng)學(xué)金名單，共有10位博士研究生獲此殊榮，其中包括6位華人學(xué)者。此次獎(jiǎng)學(xué)金金額較往年上漲20%，每位獲獎(jiǎng)?wù)邔@得6萬美元的資助。 …

小科同學(xué)
2天前
新聞

英偉達(dá)回應(yīng)Nvidia App致部分游戲性能下降：正全力修復(fù)

當(dāng)?shù)貢r(shí)間周一，Tom’s Hardware對(duì)最新的“英偉達(dá)應(yīng)用程序”（Nvidia App）展開測(cè)試，結(jié)果發(fā)現(xiàn)該應(yīng)用會(huì)致使某些游戲性能降低最高達(dá) 15%。對(duì)此，英偉達(dá)官…

野游栗
4天前
商業(yè)

英偉達(dá)股價(jià)持續(xù)下滑，投資者擔(dān)憂AI支出前景

近日，英偉達(dá)股價(jià)持續(xù)呈現(xiàn)下跌趨勢(shì)，周二再跌1.2%，引發(fā)了市場(chǎng)的廣泛關(guān)注。這家全球領(lǐng)先的人工智能芯片制造商的股價(jià)，已從11月初的歷史高峰148.88美元下跌了約12%。據(jù)了解，投…

商業(yè)頭條
4天前
新聞

英偉達(dá)中國否認(rèn)“斷供”：將持續(xù)為中國客戶提供服務(wù)

近日，NVIDIA技術(shù)服務(wù)（北京）有限公司通過其官方微博@NVIDIA英偉達(dá)中國發(fā)布聲明，針對(duì)“NVIDIA對(duì)中國市場(chǎng)斷供”的傳聞，英偉達(dá)中國否認(rèn)“斷供”，明確表示該消息為不實(shí)傳聞…

NEWS
2024年12月13日
新聞

美法院拒絕英偉達(dá)投資者訴訟案上訴請(qǐng)求，案件將繼續(xù)審理

近日，美國最高法院拒絕了英偉達(dá)關(guān)于一項(xiàng)投資者集體訴訟的上訴請(qǐng)求。據(jù)了解，該訴訟由投資者發(fā)起，指控英偉達(dá)在加密貨幣市場(chǎng)對(duì)其銷售額影響的問題上誤導(dǎo)了股東。信息顯示，該訴訟起源于201…

李森
2024年12月12日
新聞

Counterpoint：2024年Q3全球半導(dǎo)體市場(chǎng)回暖，AI和內(nèi)存需求強(qiáng)勁

近日，市場(chǎng)調(diào)查機(jī)構(gòu)Counterpoint Research發(fā)布報(bào)告稱，2024年第三季度全球半導(dǎo)體市場(chǎng)呈現(xiàn)回暖趨勢(shì)，主要得益于人工智能（AI）技術(shù)需求和內(nèi)存市場(chǎng)的復(fù)蘇。報(bào)告顯示…

李小白
2024年12月11日
新聞

英偉達(dá)回應(yīng)反壟斷立案調(diào)查：愿配合監(jiān)管機(jī)構(gòu)

近日，據(jù)國家市場(chǎng)監(jiān)督管理總局通報(bào)，全球知名圖形處理器制造商英偉達(dá)公司因涉嫌違反《中華人民共和國反壟斷法》及相關(guān)審查決定，已被該局依法立案調(diào)查。對(duì)此，英偉達(dá)回應(yīng)反壟斷立案調(diào)查表示：愿…

NEWS
2024年12月10日
商業(yè)

英偉達(dá)市值一夜蒸發(fā)6400億元，AI芯片巨頭遭遇市場(chǎng)“滑鐵盧”

美東時(shí)間周一，全球科技巨頭英偉達(dá)遭遇了一場(chǎng)前所未有的市值危機(jī)。據(jù)最新數(shù)據(jù)顯示，芯片龍頭英偉達(dá)收跌2.55%，報(bào)收138.810美元，英偉達(dá)市值一夜蒸發(fā)6400億元。作為AI芯片領(lǐng)…

商業(yè)頭條
2024年12月10日
新聞

涉嫌違反反壟斷法英偉達(dá)被立案調(diào)查

近日，有消息稱，因涉嫌違反反壟斷法，英偉達(dá)被立案調(diào)查。報(bào)道稱，英偉達(dá)公司因涉嫌違反《中華人民共和國反壟斷法》及相關(guān)法規(guī)，被中國國家市場(chǎng)監(jiān)管總局依法立案調(diào)查。此次調(diào)查的原因是英偉達(dá)…

小丸子
2024年12月10日
新聞

英偉達(dá)CEO黃仁勛被曝涉嫌利用美國遺產(chǎn)稅收漏洞避稅80億美元

近日，有媒體報(bào)道，英偉達(dá)CEO黃仁勛被曝利用美國聯(lián)邦遺產(chǎn)稅和贈(zèng)與稅中的法律漏洞，成功規(guī)避高達(dá)80億美元的潛在稅款。據(jù)報(bào)道，黃仁勛的凈資產(chǎn)目前高達(dá)1270億美元，是美國第十大富豪?！?/p>

科技探索者
2024年12月9日
出海

英偉達(dá)宣布收購越南VinBrain，拓展醫(yī)療AI領(lǐng)域

昨日，英偉達(dá)公司CEO黃仁勛宣布，英偉達(dá)將收購越南Vingroup旗下的人工智能公司VinBrain。黃仁勛表示，此次收購是英偉達(dá)“未來主要設(shè)計(jì)中心的起點(diǎn)”，標(biāo)志著英偉達(dá)在人工智能…

NEWS
2024年12月6日
新聞

傳聞xAI已訂購價(jià)值10.8億美元英偉達(dá)GB200 AI服務(wù)器，將于2025年1月交付

據(jù)外媒最新報(bào)道，馬斯克旗下的xAI公司已經(jīng)訂購了價(jià)值10.8億美元的英偉達(dá)GB200 AI服務(wù)器。這些服務(wù)器預(yù)計(jì)將于2025年1月獲得交付。據(jù)了解，這批GB200 AI服務(wù)器已經(jīng)…

NEWS
2024年12月5日
商業(yè)

英偉達(dá)財(cái)報(bào)發(fā)布：營收351億美元?jiǎng)?chuàng)歷史新高，數(shù)據(jù)中心業(yè)務(wù)強(qiáng)勁增長(zhǎng)

今日，英偉達(dá)公司公布了其截至2024年10月27日的2025財(cái)年第三季度的財(cái)務(wù)報(bào)告。本季度，英偉達(dá)以驚人的表現(xiàn)再次刷新了營收紀(jì)錄，總營收達(dá)到351億美元（當(dāng)前約2540.77億元人…

商業(yè)頭條
2024年11月21日
新聞

英偉達(dá)與谷歌Quantum AI合作加速量子計(jì)算機(jī)開發(fā)

近日，英偉達(dá)與谷歌Quantum AI宣布達(dá)成一項(xiàng)重要合作，旨在利用英偉達(dá)CUDA-Q平臺(tái)助力谷歌研究人員開發(fā)量子計(jì)算機(jī)的海量數(shù)字模型，共同解決量子計(jì)算處理器設(shè)計(jì)中的復(fù)雜難題。根…

NEWS
2024年11月19日
產(chǎn)品

英偉達(dá)Blackwell處理器災(zāi)情：因過熱問題致項(xiàng)目延期

當(dāng)?shù)貢r(shí)間周日，有外媒報(bào)道了關(guān)于英偉達(dá)Blackwell處理器災(zāi)情的消息。英偉達(dá)新一代Blackwell處理器在高容量服務(wù)器機(jī)架中遭遇了嚴(yán)重的過熱問題。這一技術(shù)難題不僅導(dǎo)致了設(shè)計(jì)上的…

AI
2024年11月18日
新聞

英偉達(dá)、軟銀深化AI合作，后者將接收全球首個(gè)正式版DGX B200系統(tǒng)

英偉達(dá)AISummitJapan2024上，英偉達(dá)與軟銀合作，軟銀將獲全球首個(gè)DGXB200系統(tǒng)建日本最強(qiáng)AI超算，并開發(fā)AI-RAN網(wǎng)絡(luò)提高電信容量利用率。雙方預(yù)計(jì)AI-RAN投資回報(bào)率高，推動(dòng)日本AI產(chǎn)業(yè)革命。

科技探索者
2024年11月14日
新聞

英偉達(dá)對(duì)云游戲GeForce Now服務(wù)進(jìn)行收費(fèi)調(diào)整

英偉達(dá)2025年1月1日起對(duì)GeForceNow會(huì)員設(shè)每月100小時(shí)游戲時(shí)間限，避免未來提價(jià)，影響6%會(huì)員。未用時(shí)間累積，超限需購額外時(shí)間或用基礎(chǔ)配。11月22日前享25%折扣。

蘋果派
2024年11月8日
商業(yè)

馬斯克旗下xAI計(jì)劃融資50億美元，估值或達(dá)450億美元

據(jù)知情人士透露，埃隆·馬斯克旗下的AI初創(chuàng)公司xAI正計(jì)劃以驚人的450億美元（當(dāng)前約3200.68億元人民幣）估值籌集50億美元資金。這一輪融資吸引了眾多頂級(jí)風(fēng)投公司的關(guān)注，包括…

商業(yè)頭條
2024年11月5日
AI

消息稱英偉達(dá)有意參與馬斯克旗下xAI數(shù)十億美元融資

埃隆?馬斯克旗下 AI 初創(chuàng)公司 xAI 正打算以約 450 億美元（當(dāng)前約 3200.68 億元人民幣）的估值籌集 50 億美元資金，投資者可能包括紅杉資本、Andreessen Horowitz 和 Vy Capital 等風(fēng)投公司。

蘋果派
2024年11月5日
新聞

英偉達(dá)布局印度市場(chǎng) 印度半導(dǎo)體產(chǎn)業(yè)“雄心”更近一步？

芯片巨頭英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛和印度信實(shí)工業(yè)（Reliance Industries）董事長(zhǎng)穆克什·安巴尼討論了人工智能基礎(chǔ)設(shè)施投資合作前景。英偉達(dá)表示，該公司將向信實(shí)工業(yè)在印度古吉拉特邦建造的一個(gè)數(shù)據(jù)中心提供Blackwell人工智能處理器。

科技探索者
2024年10月29日