在人工智能領(lǐng)域,大型語言模型的發(fā)展一直備受關(guān)注。昨日,谷歌Google公司宣布推出其規(guī)模最大、功能最強(qiáng)大的新大型語言模型Gemini。該模型擁有最強(qiáng)大的TPU(張量處理單元)系統(tǒng)“Cloud TPU v5p”以及來自谷歌云的人工智能超級計(jì)算機(jī),是谷歌籌備了一年之久的GPT4真正競品。
在發(fā)布會(huì)上,谷歌DeepMind首席執(zhí)行官、Gemini團(tuán)隊(duì)代表德米斯·哈薩比斯正面談及GPT-4與Gemini的對比。他表示,谷歌運(yùn)行了32個(gè)完善的基準(zhǔn)測試來比較這兩個(gè)模型,從廣泛的整體測試到比較兩個(gè)模型生成Python代碼的能力,結(jié)果發(fā)現(xiàn)Gemini在32項(xiàng)基準(zhǔn)中的30項(xiàng)中大幅領(lǐng)先。
Gemini模型經(jīng)過海量數(shù)據(jù)訓(xùn)練,可以很好識(shí)別和理解文本、圖像、音頻等內(nèi)容,并可以回答復(fù)雜主題相關(guān)的問題。因此,非常擅長解釋數(shù)學(xué)和物理等復(fù)雜學(xué)科的推理任務(wù)。此外,Gemini可以生成和理解Python、Java、C++和Go等主流代碼,并在多個(gè)編碼基準(zhǔn)測試中表現(xiàn)出色。
除了在語言理解和編碼方面的能力,Gemini還具有多模態(tài)功能,可以在視覺理解、文本生成等方面表現(xiàn)出非常強(qiáng)的功能。例如,從數(shù)十萬字的小說中整理出重要觀點(diǎn),從200頁的金融報(bào)告中找出最有價(jià)值的內(nèi)容。這對于金融、科技、醫(yī)療等領(lǐng)域的科研和業(yè)務(wù)人員來說非常有幫助。
在一段公布的演示視頻中,桑達(dá)爾?皮查伊展示了Gemini對視頻、圖像的非同凡響的識(shí)別能力。Gemini可以非常自如地在圖像、音頻、視頻各模態(tài)之間轉(zhuǎn)換,展現(xiàn)了驚人的解鎖應(yīng)用場景與產(chǎn)品形態(tài)的潛力。
目前,Gemini Ultra是第一個(gè)在MMLU(大規(guī)模多任務(wù)語言理解)方面超越人類專家的模型。該模型綜合使用數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理學(xué)等57個(gè)科目來測試世界知識(shí)和解決問題的能力。谷歌在一篇博客文章中表示,Gemini Ultra可以理解復(fù)雜主題中的細(xì)微差別和推理。
對于未來發(fā)展,谷歌計(jì)劃將Gemini授權(quán)給客戶,供他們在自己的應(yīng)用程序中使用。從12月13日開始,開發(fā)者和企業(yè)客戶可以通過谷歌AI Studio或谷歌Cloud Vertex AI中的Gemini API(應(yīng)用程序編程接口)訪問Gemini Pro。安卓開發(fā)人員可以使用Gemini Nano完成構(gòu)建。
總之,Gemini作為谷歌最新的大型語言模型,具有強(qiáng)大的功能和靈活的適配能力。通過海量數(shù)據(jù)訓(xùn)練和多模態(tài)功能,它可以回答復(fù)雜問題、生成和理解代碼以及處理各種類型的數(shù)據(jù)。這些功能對于金融、科技、醫(yī)療等領(lǐng)域的科研和業(yè)務(wù)人員來說非常有幫助。隨著更多用戶開始使用Gemini,它有望在各個(gè)領(lǐng)域發(fā)揮更大的作用。
原創(chuàng)文章,作者:秋秋,如若轉(zhuǎn)載,請注明出處:http://rponds.cn/article/603297.html