谷歌推出Gemini 1.5 Pro模型：新增音頻理解及系統(tǒng)指令功能，引領(lǐng)AI技術(shù)新突破

Google ? 2024年4月11日 11:36:00 ? AI, 產(chǎn)品

近日，科技巨頭谷歌在AI領(lǐng)域再度邁出重要步伐，正式向全球180多個(gè)國(guó)家和地區(qū)推出其備受期待的Gemini 1.5 Pro模型。該模型不僅繼承了Gemini系列的一貫優(yōu)秀表現(xiàn)，還在原有基礎(chǔ)上實(shí)現(xiàn)了重大升級(jí)，特別新增了音頻理解能力，并引入了系統(tǒng)指令和JSON模式等新功能，為開(kāi)發(fā)者提供了更為強(qiáng)大和靈活的控制手段。

據(jù)悉，Gemini 1.5 Pro模型自兩個(gè)月前在Google Ai Studio中供部分開(kāi)發(fā)者測(cè)試以來(lái)，就憑借其1M上下文窗口的出色性能和原生的音頻理解能力受到了廣泛關(guān)注。此次全球范圍內(nèi)的正式推出，無(wú)疑將進(jìn)一步推動(dòng)AI技術(shù)在各個(gè)領(lǐng)域的應(yīng)用和發(fā)展。

在音頻理解方面，Gemini 1.5 Pro模型實(shí)現(xiàn)了對(duì)上傳的視頻圖像（幀）和音頻（語(yǔ)音）的推理能力，這一功能的解鎖為音頻和視頻處理領(lǐng)域帶來(lái)了新的用例和可能性。開(kāi)發(fā)者可以通過(guò)Google Ai Studio和Gemini API調(diào)用該模型，對(duì)音頻和視頻數(shù)據(jù)進(jìn)行深度分析和處理，從而開(kāi)發(fā)出更加智能和高效的應(yīng)用。

此外，Gemini 1.5 Pro模型還新增了系統(tǒng)指令功能，允許開(kāi)發(fā)者通過(guò)定義角色、格式、目標(biāo)和規(guī)則等方式，對(duì)模型的響應(yīng)進(jìn)行精確指導(dǎo)。這一功能的引入將極大地提高模型的可控性和適應(yīng)性，使得開(kāi)發(fā)者能夠針對(duì)不同用例對(duì)模型進(jìn)行更加精準(zhǔn)的引導(dǎo)。

同時(shí)，為了滿足開(kāi)發(fā)者對(duì)結(jié)構(gòu)化數(shù)據(jù)的需求，Gemini 1.5 Pro模型還支持JSON模式輸出。在JSON模式下，模型僅輸出為JSON對(duì)象，便于從文本或圖像中提取結(jié)構(gòu)化數(shù)據(jù)。開(kāi)發(fā)者可以使用cURL進(jìn)行調(diào)用，后續(xù)還將支持Python SDK，進(jìn)一步簡(jiǎn)化了數(shù)據(jù)處理的流程。

在函數(shù)調(diào)用方面，Gemini 1.5 Pro模型也進(jìn)行了改進(jìn)。開(kāi)發(fā)者現(xiàn)在可以選擇不同的模式來(lái)限制模型的輸出，從而提高輸出的可靠性和準(zhǔn)確性。無(wú)論是選擇文本、函數(shù)調(diào)用還是僅函數(shù)本身等模式，都能根據(jù)具體需求進(jìn)行靈活調(diào)整。

除了上述功能升級(jí)外，谷歌還推出了下一代文本嵌入模型text-embedding-004/text-embedding-preview-0409。據(jù)谷歌稱，該模型在MTEB基準(zhǔn)測(cè)試中實(shí)現(xiàn)了更強(qiáng)的檢索性能，并且優(yōu)于具有可對(duì)比緯度的現(xiàn)有模型。這一新嵌入式模型的推出將為文本處理和分析提供更加高效和精準(zhǔn)的工具。

總的來(lái)說(shuō)，Gemini 1.5 Pro模型的推出標(biāo)志著谷歌在AI技術(shù)領(lǐng)域的又一次重要突破。通過(guò)新增音頻理解、系統(tǒng)指令和JSON模式等功能，該模型為開(kāi)發(fā)者提供了更加強(qiáng)大和靈活的控制手段，將有望推動(dòng)AI技術(shù)在各個(gè)領(lǐng)域的應(yīng)用和發(fā)展。未來(lái)，我們期待看到更多基于Gemini 1.5 Pro模型的創(chuàng)新應(yīng)用和產(chǎn)品問(wèn)世，為人類生活帶來(lái)更多便利和驚喜。

原創(chuàng)文章，作者：Google，如若轉(zhuǎn)載，請(qǐng)注明出處：http://rponds.cn/article/645877.html

Gemini 1.5 Pro 谷歌

Google認(rèn)證作者

0 0

新聞

谷歌YouTube印度站將嚴(yán)厲打擊“標(biāo)題黨”“封面黨”

近日，谷歌在其YouTube印度博客網(wǎng)站上發(fā)布了一則重要公告，宣布將針對(duì)平臺(tái)上長(zhǎng)期存在的“標(biāo)題黨”“封面黨”視頻進(jìn)行嚴(yán)厲打擊。谷歌指出，這些視頻往往制作粗糙、內(nèi)容空洞，僅僅依靠夸…

Google
1天前
AI

谷歌Gemini AI深度研究模式新增支持中文等40多種語(yǔ)言

谷歌公司近日宣布，其旗下的Gemini AI深度研究模式現(xiàn)已新增支持中文等40多種語(yǔ)言。這一功能旨在為用戶提供強(qiáng)大的AI研究輔助能力，并已向Google One AI高級(jí)計(jì)劃用戶開(kāi)…

Google
1天前
AI

傳聞Google Tensor G5或?qū)売萌峭ㄓ嵞＝M，轉(zhuǎn)投聯(lián)發(fā)科T900

近日，有關(guān)Google Tensor G5處理器的最新消息傳出。據(jù)外媒報(bào)道，Google在綜合考慮了多種通訊模組選項(xiàng)后，決定在Tensor G5處理器上采用聯(lián)發(fā)科尚未發(fā)布的T900…

Google
5天前
AI

谷歌發(fā)布Veo 2視頻生成模型，分辨率是Sora模型的4倍

今日，谷歌公司發(fā)布公告，正式推出視頻生成模型Veo 2。據(jù)官方消息，這個(gè)新模型在理解現(xiàn)實(shí)世界物理、人類運(yùn)動(dòng)和表達(dá)的細(xì)微差別方面表現(xiàn)更出色，從而能夠進(jìn)一步提升視頻整體的細(xì)節(jié)和逼真度。…

Google
5天前
產(chǎn)品

谷歌Astra智能眼鏡曝光，將融合AI與AR技術(shù)

今日，有消息稱，谷歌DeepMind網(wǎng)站為Project Astra項(xiàng)目開(kāi)辟了新的測(cè)試頻道，打算邀請(qǐng)部分用戶對(duì)Astra智能眼鏡進(jìn)行測(cè)試。據(jù)了解，這款原型眼鏡融合了AI和AR技術(shù)，…

Google
5天前
新聞

谷歌推送Android 15 QPR2 Beta 2更新，多設(shè)備可享

今日，谷歌針對(duì)Pixel設(shè)備推出了Android 15 QPR2 Beta 2更新，版本號(hào)為BP11.241121.010。QPR是季度平臺(tái)發(fā)布，能讓用戶提前體驗(yàn)Pixel Fea…

Android
6天前
手機(jī)

谷歌Pixel 10系列傳聞：或采用聯(lián)發(fā)科T900調(diào)制解調(diào)器

有外媒近日?qǐng)?bào)道了一則關(guān)于谷歌Pixel 10系列傳聞的最新消息。據(jù)谷歌內(nèi)部消息人士透露，谷歌計(jì)劃在下一代Pixel手機(jī)中放棄高通和三星的調(diào)制解調(diào)器方案，轉(zhuǎn)而選擇聯(lián)發(fā)科尚未發(fā)布的T9…

Google
6天前
新聞

YouTube TV宣布將于2025年漲價(jià)，漲幅約為13.6%

據(jù)報(bào)道，當(dāng)?shù)貢r(shí)間周四，谷歌旗下視頻直播平臺(tái)YouTube TV向訂閱者發(fā)送郵件，宣布將于2025年1月13日起調(diào)整服務(wù)價(jià)格。據(jù)悉，YouTube TV的基礎(chǔ)套餐月費(fèi)將從目前的72…

Google
2024年12月15日
新聞

谷歌AI2.0：開(kāi)啟多模態(tài)、多步驟搜索新時(shí)代，明年將向全球開(kāi)放

谷歌發(fā)布AI模型Gemini2.0，整合進(jìn)AIOverviews中，實(shí)現(xiàn)多模態(tài)、多步驟搜索體驗(yàn)升級(jí)，計(jì)劃全球化布局，面對(duì)挑戰(zhàn)持續(xù)優(yōu)化，未來(lái)AI搜索將發(fā)揮重要作用。

蘋果派
2024年12月15日
新聞

谷歌 NotebookLM 新功能上線：用戶可與 AI 主播進(jìn)行互動(dòng)

谷歌NotebookLM推新功能，用戶可與AI“主持人”對(duì)話提問(wèn)，獲個(gè)性化回答。界面重設(shè)分三區(qū)，還推NotebookLMPlus訂閱服務(wù)，享更多資源、自定義回答等，已向企業(yè)學(xué)校等機(jī)構(gòu)開(kāi)放，預(yù)計(jì)2025年初加入GoogleOneAIPremium。

科技探索者
2024年12月14日
AI

谷歌發(fā)布Gemini 2.0模型及Deep Research新功能

谷歌官方近日宣布，正式推出其最新一代人工智能模型——Gemini 2.0。據(jù)了解，自當(dāng)?shù)貢r(shí)間12月11日起，谷歌已將Gemini 2.0開(kāi)放給開(kāi)發(fā)者及受信任的測(cè)試人員，并正積極推進(jìn)…

Google
2024年12月13日
新聞

傳聞谷歌或?qū)⒂诿髂?月啟動(dòng)新一輪裁員

近日，有傳聞稱，谷歌計(jì)劃于明年1月啟動(dòng)新一輪裁員，裁員標(biāo)準(zhǔn)也有所提高。據(jù)了解，谷歌將按照一定比例裁掉績(jī)效不佳的員工，盡管工程師整體生產(chǎn)力有所提升。此次谷歌裁員中，谷歌將績(jī)效考核“…

Google
2024年12月12日
手機(jī)

谷歌Pixel 9a規(guī)格曝光：搭載Tensor G4 芯片

昨日，有外媒曝光了谷歌Pixel 9a手機(jī)的完整規(guī)格信息。據(jù)了解，Pixel 9a將搭載Google Tensor G4處理器和Titan M2安全芯片，配備8GB LPDDR5X…

Google
2024年12月12日
新聞

谷歌支付遭美監(jiān)管機(jī)構(gòu)監(jiān)控提起訴訟反抗

近日，據(jù)路透社消息，美國(guó)消費(fèi)者金融保護(hù)局（CFPB）宣布將谷歌支付公司置于聯(lián)邦監(jiān)管之下，此舉或?qū)⒁l(fā)對(duì)谷歌類似于對(duì)銀行的例行檢查和監(jiān)控。 CFPB指出，該決定源于對(duì)谷歌支付業(yè)務(wù)的審…

Google
2024年12月8日
手機(jī)

谷歌將Pixel系列更新時(shí)間延長(zhǎng)至五年

近日，谷歌對(duì)Pixel系列用戶宣布，Pixel 6、Pixel 7以及原始Pixel Fold等設(shè)備將獲得五年的操作系統(tǒng)支持和安全更新。此前，谷歌承諾的是三年操作系統(tǒng)支持和五年安全…

Google
2024年12月6日
出海

如何提升Shopify商店流量？新手賣家的SEO優(yōu)化指南

在電商領(lǐng)域，流量就是基礎(chǔ)，對(duì)于即將或已經(jīng)進(jìn)入跨境電商的Shopify新手賣家來(lái)說(shuō)，如何在谷歌的自然搜索結(jié)果中獲得靠前的排名，從而吸引更多潛在客戶，是一個(gè)至關(guān)重要的問(wèn)題。下面小編將為…

秋秋
2024年12月5日
新聞

傳聞谷歌Chrome瀏覽器任務(wù)管理器將迎重大更新

據(jù)外媒昨日?qǐng)?bào)道，谷歌計(jì)劃為Windows 10和Windows 11版本的Chrome瀏覽器推出一次重要更新，此次更新的重點(diǎn)是內(nèi)置的任務(wù)管理器。據(jù)了解，全新版本的Chrome瀏覽…

Google
2024年11月29日
產(chǎn)品

谷歌推出Pixel Watch新表帶Performance Loop，專為運(yùn)動(dòng)而生！

當(dāng)?shù)貢r(shí)間11月26日，谷歌宣布為Pixel Watch推出了一款全新表帶——Performance Loop，售價(jià)59.99美元（約合435元人民幣）。谷歌表示，新款表帶特別適合…

Google
2024年11月27日
出海

百萬(wàn)年薪谷歌工程師逆襲：安克如何從‘中間商’變身百億跨境電商品牌？

2011年，在湖南長(zhǎng)沙的一間小平房中，放棄谷歌工程師百萬(wàn)年薪的陽(yáng)萌正坐在電腦前查看著各類商品的價(jià)格信息，沒(méi)錯(cuò)，他正在干著“中間商賺差價(jià)”的買賣。你敢信嗎？就是這樣一家依靠“中間商賺…

秋秋
2024年11月27日
手機(jī)

黑色星期五優(yōu)惠：谷歌Pixel 9牡丹版美國(guó)亞馬遜僅需548.98美元，優(yōu)惠250美元

在黑色星期五的購(gòu)物狂歡中，美國(guó)亞馬遜為我們帶來(lái)了最新優(yōu)惠——谷歌Pixel 9牡丹版僅需548.98美元，相較于原價(jià)節(jié)省了高達(dá)250.02美元，優(yōu)惠幅度達(dá)到31%。這一超值優(yōu)惠僅限…

Google
2024年11月25日