馬斯克旗下AI公司發(fā)布新模型Grok-2:躋身前五大AI模型

埃隆·馬斯克旗下AI初創(chuàng)公司xAI今日發(fā)布了一款新的聊天機(jī)器人Grok-2,聲稱(chēng)其性能與競(jìng)爭(zhēng)對(duì)手OpenAI、谷歌和Anthropic的產(chǎn)品相當(dāng)。

埃隆·馬斯克旗下AI初創(chuàng)公司xAI今日發(fā)布了一款新的聊天機(jī)器人Grok-2,聲稱(chēng)其性能與競(jìng)爭(zhēng)對(duì)手OpenAI、谷歌和Anthropic的產(chǎn)品相當(dāng)。

馬斯克旗下AI公司發(fā)布新模型Grok-2:躋身前五大AI模型

周三,xAI展示了這款最新的大型語(yǔ)言模型Grok-2。根據(jù)獨(dú)立AI基準(zhǔn)機(jī)構(gòu)的測(cè)試,這款模型已經(jīng)躋身前五大AI聊天機(jī)器人之列,僅落后于谷歌的Gemini和OpenAI的ChatGPT等模型。

沃頓商學(xué)院教授、AI專(zhuān)家Ethan Mollick在X上發(fā)帖稱(chēng):“現(xiàn)在有五款GPT-4級(jí)別的AI模型:GPT-4o、Claude 3.5、Gemini 1.5、Llama 3.1和現(xiàn)在的Grok-2?!?/p>

Mollick還稱(chēng):“所有的測(cè)試實(shí)驗(yàn)室都表示,AI模型還有繼續(xù)大幅改進(jìn)的空間,但目前我們還沒(méi)有看到任何模型真正超越GPT-4。”

xAI表示,Grok-2是AI模型向前邁出的重要一步,在廣泛的任務(wù)中,無(wú)論是尋求答案、協(xié)同寫(xiě)作,還是解決編碼任務(wù),都更加直觀、可控和通用。

根據(jù)AI模型評(píng)測(cè)機(jī)構(gòu)LMSYS的排名,Grok-2的表現(xiàn)被認(rèn)為優(yōu)于Meta和Anthropic的最強(qiáng)模型。

xAI表示,在內(nèi)部評(píng)估該模型的性能時(shí),其重點(diǎn)是確保系統(tǒng)遵循用戶(hù)指示,并提供準(zhǔn)確、真實(shí)的信息。

在此之前,Grok-2的上一代產(chǎn)品被專(zhuān)家批評(píng)為“AI幻覺(jué)”,即將虛假信息陳述為事實(shí),這也一直視為企業(yè)采用AI系統(tǒng)的障礙。

Grok-2將率先面向馬斯克旗下社交媒體平臺(tái)X的付費(fèi)用戶(hù)提供。此外,xAI還計(jì)劃本月向開(kāi)發(fā)人員發(fā)布該模型,以便他們構(gòu)建企業(yè)應(yīng)用程序。

xAI成立于去年3月,在大量投資的支持下,迅速提高了其技術(shù)能力。今年,xAI以180億美元的估值完成了一輪60億美元的融資。

馬斯克最近還示,他正在尋求特斯拉(201.38, -6.45, -3.10%)董事會(huì)批準(zhǔn)向該公司投資50億美元。這將使這家初創(chuàng)公司的投資接近OpenAI的130億美元,并超過(guò)Anthropic的近90億美元。

原創(chuàng)文章,作者:蘋(píng)果派,如若轉(zhuǎn)載,請(qǐng)注明出處:http://rponds.cn/article/673952.html

蘋(píng)果派的頭像蘋(píng)果派管理團(tuán)隊(duì)

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論