馬斯克 xAI 大模型 Grok 2 登場? ? 能否撼動類 GPT-4 級別行業(yè)格局？

科技探索者 ? 2024年8月15日 15:42:14 ? AI

Grok-2系列包括兩個版本：Grok-2和Grok-2 mini。其中，Grok-2是該公司推理能力最強(qiáng)的語言模型，而輕量化模型Grok-2mini則是Grok-2試圖實(shí)現(xiàn)小參數(shù)體型下的強(qiáng)功能。

當(dāng)?shù)貢r間8月14日，?埃隆·馬斯克旗下AI初創(chuàng)公司xAI發(fā)布了一款新的聊天機(jī)器人Grok-2，聲稱其性能與競爭對手OpenAI、谷歌和Anthropic的產(chǎn)品相當(dāng)。此次發(fā)布的Grok-2系列包括兩個版本：Grok-2和Grok-2 mini。其中，Grok-2是該公司推理能力最強(qiáng)的語言模型，而輕量化模型Grok-2mini則是Grok-2試圖實(shí)現(xiàn)小參數(shù)體型下的強(qiáng)功能。

馬斯克 xAI 大模型 Grok 2 登場? ? 能否撼動類 GPT-4 級別行業(yè)格局？

Grok-2因何被稱為理解能力最強(qiáng)？

Grok-2被描述為“類GPT-4級別”的大模型，具備強(qiáng)大的推理、編程和聊天功能，在xAI內(nèi)部測試中表現(xiàn)出色。而Grok-2 mini則主打小巧精致，雖然在性能上不及Grok-2，但在響應(yīng)速度方面有著明顯優(yōu)勢，適合對速度要求較高的場景。

根據(jù)xAI的描述，Grok-2在模型推理能力上取得了顯著進(jìn)步，特別是在處理復(fù)雜任務(wù)時表現(xiàn)出色。與其前身Grok-1.5相比，Grok-2不僅在推理能力上有所提升，還在工具使用能力上展現(xiàn)出了更強(qiáng)的適應(yīng)性。例如，它能夠更準(zhǔn)確地識別缺失信息，通過事件序列進(jìn)行推理，并有效排除不相關(guān)的內(nèi)容。這些特性使得Grok-2在面對各種復(fù)雜任務(wù)時，能夠更加從容應(yīng)對。

在基準(zhǔn)測試方面，Grok-2的表現(xiàn)也相當(dāng)亮眼。根據(jù)xAI披露的數(shù)據(jù)，Grok-2在LMSYS排行榜上的得分超過了GPT-4 Turbo和Claude 3 Opus，甚至在某些測試中與GPT-4o和Llama 3-405B平分秋色。不過，這些成績也引發(fā)了外界的質(zhì)疑。有分析指出，xAI在公布基準(zhǔn)測試結(jié)果時，選擇了與五月份的GPT-4o得分進(jìn)行對比，存在利用時間差美化結(jié)果的嫌疑。這一做法無疑讓外界對Grok-2的真實(shí)性能產(chǎn)生了更多疑問。

Grok-2躋身前五大AI聊天機(jī)器人之列！

根據(jù)獨(dú)立AI基準(zhǔn)機(jī)構(gòu)的測試，這款模型已經(jīng)躋身前五大AI聊天機(jī)器人之列，僅落后于谷歌的Gemini和OpenAI的ChatGPT等模型。沃頓商學(xué)院教授、AI專家Ethan Mollick在X上發(fā)帖稱：“現(xiàn)在有五款GPT-4級別的AI模型：GPT-4o、Claude 3.5、Gemini 1.5、Llama 3.1和現(xiàn)在的Grok-2?！?Mollick還稱：“所有的測試實(shí)驗(yàn)室都表示，AI模型還有繼續(xù)大幅改進(jìn)的空間，但目前我們還沒有看到任何模型真正超越GPT-4。”

xAI表示，Grok-2是AI模型向前邁出的重要一步，在廣泛的任務(wù)中，無論是尋求答案、協(xié)同寫作，還是解決編碼任務(wù)，都更加直觀、可控和通用。根據(jù)AI模型評測機(jī)構(gòu)LMSYS的排名，Grok-2的表現(xiàn)被認(rèn)為優(yōu)于Meta和Anthropic的最強(qiáng)模型。 xAI表示，在內(nèi)部評估該模型的性能時，其重點(diǎn)是確保系統(tǒng)遵循用戶指示，并提供準(zhǔn)確、真實(shí)的信息。在此之前，Grok-2的上一代產(chǎn)品被專家批評為“AI幻覺”，即將虛假信息陳述為事實(shí)，這也一直視為企業(yè)采用AI系統(tǒng)的障礙。

與前代模型相比，Grok-2最大的變化之一是具備了直接生成圖像的能力。據(jù)xAI團(tuán)隊成員透露，Grok-2的圖像生成功能是基于近期廣受歡迎的FLUX.1模型開發(fā)的。這一功能的加入，使得Grok-2在X平臺上的應(yīng)用更加多樣化，也為用戶提供了更多的創(chuàng)作可能性。

馬斯克特別強(qiáng)調(diào)了Grok-2的圖像生成能力，并指出這一功能將在X平臺上逐步開放給Premium和Premium+訂閱用戶。值得注意的是，Grok-2的圖像生成功能沒有任何限制，這使得用戶可以利用這一功能創(chuàng)作各種類型的圖像，包括政治人物的照片等。這一功能的開放性在社交媒體上引發(fā)了廣泛討論，部分用戶對其潛在的濫用表示擔(dān)憂，而另一些用戶則對其創(chuàng)作自由度表示歡迎。

然而，Grok-2的圖像生成功能也并非毫無限制。根據(jù)用戶反饋，Premium用戶每月可以生成約20-30張圖像，而Premium+用戶則可以生成更多的圖像。盡管這一限制在一定程度上控制了資源的使用，但也引發(fā)了部分用戶的不滿，認(rèn)為這一限制可能影響用戶的創(chuàng)作體驗(yàn)。

寫在最后：

在Grok-2發(fā)布的同時，馬斯克也透露了xAI的未來計劃。根據(jù)他此前的公開發(fā)言，xAI正在全力開發(fā)Grok-3模型，預(yù)計將于今年年底發(fā)布。Grok-3的開發(fā)規(guī)模和資源投入令人矚目，據(jù)馬斯克透露，xAI團(tuán)隊為Grok-3的訓(xùn)練調(diào)用了10萬塊英偉達(dá)H100芯片，目標(biāo)是在今年年底前推出一款“按每項(xiàng)指標(biāo)衡量都是世界上最強(qiáng)大的人工智能模型”。

對于xAI而言，Grok-3的發(fā)布將是一次至關(guān)重要的挑戰(zhàn)。如果Grok-3能夠成功實(shí)現(xiàn)其目標(biāo)，xAI有望在AI行業(yè)中占據(jù)更為重要的地位。然而，考慮到目前AI行業(yè)的激烈競爭，以及OpenAI、Google等科技巨頭的強(qiáng)大實(shí)力，xAI要想真正突圍，仍需在技術(shù)創(chuàng)新和產(chǎn)品應(yīng)用上取得更大突破。

原創(chuàng)文章，作者：科技探索者，如若轉(zhuǎn)載，請注明出處：http://rponds.cn/article/674087.html

科技探索者管理團(tuán)隊

0 0

AI

OpenAI GPT-5研發(fā)受阻，成本高昂效果未及預(yù)期

近日，《華爾街日報》報道稱，OpenAI正在研發(fā)的下一代大型語言模型GPT-5遭遇研發(fā)難題，進(jìn)度滯后且成果未達(dá)預(yù)期。這一消息與此前有關(guān)GPT-5可能無法實(shí)現(xiàn)顯著性能飛躍的報道相呼應(yīng)…

AI
13小時前
AI

意大利對OpenAI罰款1500萬歐元，因ChatGPT數(shù)據(jù)隱私違規(guī)

近日，意大利數(shù)據(jù)保護(hù)機(jī)構(gòu)Garante發(fā)布公告，宣布對OpenAI處以1500萬歐元（約合1.14億元人民幣）的罰款。這一處罰是在對生成式AI應(yīng)用使用個人數(shù)據(jù)情況進(jìn)行調(diào)查后做出的。…

NEWS
1天前
AI

OpenAI更新macOS版ChatGPT，新增備忘錄及IDE支持

OpenAI近日對其macOS版ChatGPT應(yīng)用進(jìn)行了更新，新增了支持讀取macOS系統(tǒng)集成的備忘錄App（Apple Notes）及第三方備忘錄App如Notion等功能?，F(xiàn)在…

AI
1天前
AI

桌面版ChatGPT功能大升級：新增30余應(yīng)用支持

在OpenAI的“12天活動”進(jìn)入尾聲，在活動倒數(shù)第二天，公司展示了桌面版ChatGPT的功能改進(jìn)。此次演示強(qiáng)調(diào)，ChatGPT正逐步從聊天機(jī)器人向AI智能體工具轉(zhuǎn)變，旨在桌面環(huán)境…

AI
2天前
AI

OpenAI o1推理模型API向特定開發(fā)者開放，多項(xiàng)開發(fā)者工具同步更新

近日，在“OpenAI 12天”活動的第九天，OpenAI宣布了重要更新。其最新的“推理”人工智能模型o1已正式通過API向部分開發(fā)者開放。據(jù)了解，首批能夠使用o1 API的開發(fā)…

AI
4天前
AI

谷歌發(fā)布Veo 2視頻生成模型，分辨率是Sora模型的4倍

今日，谷歌公司發(fā)布公告，正式推出視頻生成模型Veo 2。據(jù)官方消息，這個新模型在理解現(xiàn)實(shí)世界物理、人類運(yùn)動和表達(dá)的細(xì)微差別方面表現(xiàn)更出色，從而能夠進(jìn)一步提升視頻整體的細(xì)節(jié)和逼真度?！?/p>

Google
5天前
AI

OpenAI向所有用戶開放ChatGPT搜索功能

在“OpenAI 12天”活動進(jìn)展到第8天的時候，OpenAI發(fā)布了一則重要消息，現(xiàn)在所有登錄用戶都能夠使用ChatGPT搜索功能了。 OpenAI此次免費(fèi)向所有用戶開放ChatG…

AI
5天前
AI

ChatGPT搜索引擎向所有用戶免費(fèi)開放：新增實(shí)時搜索和高級語音功能

OpenAI推出搜索引擎工具，ChatGPT搜索功能獲大量更新，由GPT-4o模型支持，可快速獲取實(shí)時內(nèi)容，支持高級語音模式，移動端使用效率提升40%以上。

潮玩君
5天前
新聞

Meta要求加州阻止OpenAI轉(zhuǎn)營利計劃

據(jù)《華爾街日報》今日報道稱，Meta已致信加州總檢察長Rob Bonta，要求阻止OpenAI轉(zhuǎn)型為營利性企業(yè)的計劃。此舉表明，Meta在硅谷兩大AI巨頭間的爭斗中站在了馬斯克一方…

NEWS
2024年12月14日
AI

OpenAI ChatGPT全球宕機(jī)，部分服務(wù)逐步恢復(fù)中

今日，全球知名的人工智能公司OpenAI遭遇了一次重大服務(wù)中斷，其備受歡迎的聊天機(jī)器人ChatGPT在全球范圍內(nèi)出現(xiàn)了宕機(jī)現(xiàn)象。此外，與ChatGPT相關(guān)的Sora服務(wù)及API接口…

AI
2024年12月12日
新聞

ChatGPT 高級語音模式研究員創(chuàng)立WaveForms AI 新公司估值達(dá) 2 億美元

近日，有媒體報道，曾主導(dǎo)開發(fā)ChatGPT高級語音模式的前OpenAI研究員Alexis Conneau宣布創(chuàng)立WaveForms AI。這家新公司已完成由Andreessen H…

潮玩君
2024年12月11日
AI

OpenAI推出Sora文生視頻AI模型，支持1080P高清視頻生成

昨日，OpenAI公司宣布正式推出其最新的Sora文生視頻AI模型。此次發(fā)布的新版本為Sora Turbo，相較于今年2月推出的預(yù)覽版，生成速度有了顯著提升。據(jù)了解，Sora T…

AI
2024年12月10日
AI

Sora二代實(shí)機(jī)演示曝光，支持圖生視頻功能

近日，關(guān)于Sora二代的實(shí)機(jī)演示視頻被曝光，展示了其強(qiáng)大的圖生視頻功能。據(jù)泄露視頻顯示，Sora v2不僅支持長達(dá)1分鐘的視頻輸出，還提供了三種生成模式，包括文本轉(zhuǎn)視頻、文本+圖像…

AI
2024年12月9日
AI

OpenAI新功能太強(qiáng)大，每月服務(wù)費(fèi)200美元

近日，OpenAI在其“12天12場直播”活動的首秀中，發(fā)布了推理大模型o1的滿血版本及進(jìn)階模式，并推出了ChatGPT Pro訂閱服務(wù)。這一服務(wù)每月收費(fèi)200美元，為用戶提供了前…

AI
2024年12月7日
AI

OpenAI首次在瑞士設(shè)立辦公室，招募翟曉華等3名谷歌工程師推進(jìn)研發(fā)多模態(tài)AI模型

OpenAI將在蘇黎世建新辦公室，拓展歐洲市場，吸納3位谷歌DeepMind AI專家推進(jìn)多模態(tài)AI研發(fā)。蘇黎世為科技中心，翟曉華為資深A(yù)I科學(xué)家，曾是VisionTransformer作者之一。

科技探索者
2024年12月7日
AI

馬斯克的xAI獲得約60億美元股權(quán)融資，目前估值已超400億美元

馬斯克xAI完成60億美元融資，估值超400億美元，計劃擴(kuò)增ColossusAI系統(tǒng)規(guī)模，整合百萬GPU，Grok聊天機(jī)器人已向X付費(fèi)用戶開放。

潮玩君
2024年12月7日
新聞

傳聞xAI已訂購價值10.8億美元英偉達(dá)GB200 AI服務(wù)器，將于2025年1月交付

據(jù)外媒最新報道，馬斯克旗下的xAI公司已經(jīng)訂購了價值10.8億美元的英偉達(dá)GB200 AI服務(wù)器。這些服務(wù)器預(yù)計將于2025年1月獲得交付。據(jù)了解，這批GB200 AI服務(wù)器已經(jīng)…

NEWS
2024年12月5日
AI

全球AI基礎(chǔ)設(shè)施支出將逐年增加預(yù)計2028年超過1000億美元

AI聊天機(jī)器人ChatGPT帶動AI領(lǐng)域投資增長，全球AI基礎(chǔ)設(shè)施投資預(yù)計連年增加，2028年將達(dá)1070億美元，上半年投資318億美元增37%，加速服務(wù)器比重將增至60%，5年復(fù)合年均增長率19%。

科技探索者
2024年11月30日
商業(yè)

OpenAI獲軟銀15億美元新投資，員工可在收購要約中出售股票

據(jù)外媒11月27日消息，OpenAI獲得了軟銀15億美元新投資。值得一提的是，這次投資允許OpenAI的員工在收購要約中出售他們的股票。據(jù)了解，員工們需要在12月24日之前決定是…

商業(yè)頭條
2024年11月27日
AI

OpenAI 首席產(chǎn)品官：ChatGPT 網(wǎng)頁端本周引入高級語音模式

OpenAI本周在ChatGPT網(wǎng)頁版上線高級語音模式，面向付費(fèi)用戶。依托GPT-4o模型，可感知非語言信號并模仿情緒。Plus和Teams用戶有語音使用上限。OpenAI正優(yōu)化交互方式，免費(fèi)用戶將有機(jī)會體驗(yàn)。

潮玩君
2024年11月25日

發(fā)表回復(fù)

登錄后才能評論

馬斯克 xAI 大模型 Grok 2 登場? ? 能否撼動類 GPT-4 級別行業(yè)格局？

相關(guān)推薦

發(fā)表回復(fù)