谷歌 DeepMind 展示 GenRM 技術(shù)，提升生成式 AI 推理能力

潮玩君 ? 2024年9月3日 10:57:00 ? AI

谷歌DeepMind發(fā)布GenRM技術(shù)，通過創(chuàng)新獎勵模型增強生成式AI推理能力，提高大語言模型性能。GenRM能無縫集成指令調(diào)整，支持思維鏈推理，優(yōu)化結(jié)果質(zhì)量。在推理任務(wù)中表現(xiàn)優(yōu)于傳統(tǒng)驗證器，標志著AI獎勵系統(tǒng)的重要演化。

9 月 3 日消息，谷歌 DeepMind 團隊于 8 月 27 日在 arxiv 上發(fā)表論文，介紹展示了 GenRM 生成式驗證器，創(chuàng)造性提出獎勵模型，從而提升生成式 AI 推理能力。

谷歌 DeepMind 展示 GenRM 技術(shù)，提升生成式 AI 推理能力

AI 行業(yè)內(nèi)，目前提高大語言模型（LLMs）的主流做法就是 Best-of-N 模式，即由 LLM 生成的 N 個候選解決方案由驗證器進行排序，并選出最佳方案。

這種基于 LLM 的驗證器通常被訓練成判別分類器來為解決方案打分，但它們無法利用預(yù)訓練 LLMs 的文本生成能力。

DeepMind 團隊為了克服這個局限性，嘗試使用下一個token 預(yù)測目標來訓練驗證器，同時進行驗證和解決方案生成。

DeepMind 團隊這種生成式驗證器（GenRM），相比較傳統(tǒng)驗證器，主要包含以下優(yōu)點：

無縫集成指令調(diào)整

支持思維鏈推理

通過多數(shù)投票利用額外的推理時間計算

在算法和小學數(shù)學推理任務(wù)中使用基于 Gemma 的驗證器時，GenRM 的性能優(yōu)于判別式驗證器和 LLM-as-a-Judge 驗證器，在使用 Best-of-N 解決問題的百分比上提高了 16-64%。

據(jù) Google DeepMind 報道，GenRM 相對于分類獎勵模型的邊標志著人工智能獎勵系統(tǒng)的關(guān)鍵演化，特別是在其容量方面，以防止新模型學成到的欺詐行為。這一進步突出表明，迫切需要完善獎勵模型，使人工智能輸出與社會責任標準保持一致。

原創(chuàng)文章，作者：潮玩君，如若轉(zhuǎn)載，請注明出處：http://rponds.cn/article/677866.html

潮玩君管理團隊

0 0

新聞

谷歌YouTube印度站將嚴厲打擊“標題黨”“封面黨”

近日，谷歌在其YouTube印度博客網(wǎng)站上發(fā)布了一則重要公告，宣布將針對平臺上長期存在的“標題黨”“封面黨”視頻進行嚴厲打擊。谷歌指出，這些視頻往往制作粗糙、內(nèi)容空洞，僅僅依靠夸…

Google
1天前
AI

谷歌Gemini AI深度研究模式新增支持中文等40多種語言

谷歌公司近日宣布，其旗下的Gemini AI深度研究模式現(xiàn)已新增支持中文等40多種語言。這一功能旨在為用戶提供強大的AI研究輔助能力，并已向Google One AI高級計劃用戶開…

Google
1天前
AI

傳聞Google Tensor G5或?qū)売萌峭ㄓ嵞＝M，轉(zhuǎn)投聯(lián)發(fā)科T900

近日，有關(guān)Google Tensor G5處理器的最新消息傳出。據(jù)外媒報道，Google在綜合考慮了多種通訊模組選項后，決定在Tensor G5處理器上采用聯(lián)發(fā)科尚未發(fā)布的T900…

Google
4天前
AI

谷歌發(fā)布Veo 2視頻生成模型，分辨率是Sora模型的4倍

今日，谷歌公司發(fā)布公告，正式推出視頻生成模型Veo 2。據(jù)官方消息，這個新模型在理解現(xiàn)實世界物理、人類運動和表達的細微差別方面表現(xiàn)更出色，從而能夠進一步提升視頻整體的細節(jié)和逼真度?！?/p>

Google
5天前
產(chǎn)品

谷歌Astra智能眼鏡曝光，將融合AI與AR技術(shù)

今日，有消息稱，谷歌DeepMind網(wǎng)站為Project Astra項目開辟了新的測試頻道，打算邀請部分用戶對Astra智能眼鏡進行測試。據(jù)了解，這款原型眼鏡融合了AI和AR技術(shù)，…

Google
5天前
新聞

谷歌推送Android 15 QPR2 Beta 2更新，多設(shè)備可享

今日，谷歌針對Pixel設(shè)備推出了Android 15 QPR2 Beta 2更新，版本號為BP11.241121.010。QPR是季度平臺發(fā)布，能讓用戶提前體驗Pixel Fea…

Android
5天前
手機

谷歌Pixel 10系列傳聞：或采用聯(lián)發(fā)科T900調(diào)制解調(diào)器

有外媒近日報道了一則關(guān)于谷歌Pixel 10系列傳聞的最新消息。據(jù)谷歌內(nèi)部消息人士透露，谷歌計劃在下一代Pixel手機中放棄高通和三星的調(diào)制解調(diào)器方案，轉(zhuǎn)而選擇聯(lián)發(fā)科尚未發(fā)布的T9…

Google
6天前
新聞

YouTube TV宣布將于2025年漲價，漲幅約為13.6%

據(jù)報道，當?shù)貢r間周四，谷歌旗下視頻直播平臺YouTube TV向訂閱者發(fā)送郵件，宣布將于2025年1月13日起調(diào)整服務(wù)價格。據(jù)悉，YouTube TV的基礎(chǔ)套餐月費將從目前的72…

Google
2024年12月15日
新聞

谷歌AI2.0：開啟多模態(tài)、多步驟搜索新時代，明年將向全球開放

谷歌發(fā)布AI模型Gemini2.0，整合進AIOverviews中，實現(xiàn)多模態(tài)、多步驟搜索體驗升級，計劃全球化布局，面對挑戰(zhàn)持續(xù)優(yōu)化，未來AI搜索將發(fā)揮重要作用。

蘋果派
2024年12月15日
新聞

谷歌 NotebookLM 新功能上線：用戶可與 AI 主播進行互動

谷歌NotebookLM推新功能，用戶可與AI“主持人”對話提問，獲個性化回答。界面重設(shè)分三區(qū)，還推NotebookLMPlus訂閱服務(wù)，享更多資源、自定義回答等，已向企業(yè)學校等機構(gòu)開放，預(yù)計2025年初加入GoogleOneAIPremium。

科技探索者
2024年12月14日
AI

谷歌發(fā)布Gemini 2.0模型及Deep Research新功能

谷歌官方近日宣布，正式推出其最新一代人工智能模型——Gemini 2.0。據(jù)了解，自當?shù)貢r間12月11日起，谷歌已將Gemini 2.0開放給開發(fā)者及受信任的測試人員，并正積極推進…

Google
2024年12月13日
新聞

傳聞谷歌或?qū)⒂诿髂?月啟動新一輪裁員

近日，有傳聞稱，谷歌計劃于明年1月啟動新一輪裁員，裁員標準也有所提高。據(jù)了解，谷歌將按照一定比例裁掉績效不佳的員工，盡管工程師整體生產(chǎn)力有所提升。此次谷歌裁員中，谷歌將績效考核“…

Google
2024年12月12日
手機

谷歌Pixel 9a規(guī)格曝光：搭載Tensor G4 芯片

昨日，有外媒曝光了谷歌Pixel 9a手機的完整規(guī)格信息。據(jù)了解，Pixel 9a將搭載Google Tensor G4處理器和Titan M2安全芯片，配備8GB LPDDR5X…

Google
2024年12月12日
新聞

谷歌支付遭美監(jiān)管機構(gòu)監(jiān)控提起訴訟反抗

近日，據(jù)路透社消息，美國消費者金融保護局（CFPB）宣布將谷歌支付公司置于聯(lián)邦監(jiān)管之下，此舉或?qū)⒁l(fā)對谷歌類似于對銀行的例行檢查和監(jiān)控。 CFPB指出，該決定源于對谷歌支付業(yè)務(wù)的審…

Google
2024年12月8日
手機

谷歌將Pixel系列更新時間延長至五年

近日，谷歌對Pixel系列用戶宣布，Pixel 6、Pixel 7以及原始Pixel Fold等設(shè)備將獲得五年的操作系統(tǒng)支持和安全更新。此前，谷歌承諾的是三年操作系統(tǒng)支持和五年安全…

Google
2024年12月6日
出海

如何提升Shopify商店流量？新手賣家的SEO優(yōu)化指南

在電商領(lǐng)域，流量就是基礎(chǔ)，對于即將或已經(jīng)進入跨境電商的Shopify新手賣家來說，如何在谷歌的自然搜索結(jié)果中獲得靠前的排名，從而吸引更多潛在客戶，是一個至關(guān)重要的問題。下面小編將為…

秋秋
2024年12月5日
新聞

傳聞谷歌Chrome瀏覽器任務(wù)管理器將迎重大更新

據(jù)外媒昨日報道，谷歌計劃為Windows 10和Windows 11版本的Chrome瀏覽器推出一次重要更新，此次更新的重點是內(nèi)置的任務(wù)管理器。據(jù)了解，全新版本的Chrome瀏覽…

Google
2024年11月29日
產(chǎn)品

谷歌推出Pixel Watch新表帶Performance Loop，專為運動而生！

當?shù)貢r間11月26日，谷歌宣布為Pixel Watch推出了一款全新表帶——Performance Loop，售價59.99美元（約合435元人民幣）。谷歌表示，新款表帶特別適合…

Google
2024年11月27日
出海

百萬年薪谷歌工程師逆襲：安克如何從‘中間商’變身百億跨境電商品牌？

2011年，在湖南長沙的一間小平房中，放棄谷歌工程師百萬年薪的陽萌正坐在電腦前查看著各類商品的價格信息，沒錯，他正在干著“中間商賺差價”的買賣。你敢信嗎？就是這樣一家依靠“中間商賺…

秋秋
2024年11月27日
手機

黑色星期五優(yōu)惠：谷歌Pixel 9牡丹版美國亞馬遜僅需548.98美元，優(yōu)惠250美元

在黑色星期五的購物狂歡中，美國亞馬遜為我們帶來了最新優(yōu)惠——谷歌Pixel 9牡丹版僅需548.98美元，相較于原價節(jié)省了高達250.02美元，優(yōu)惠幅度達到31%。這一超值優(yōu)惠僅限…

Google
2024年11月25日

發(fā)表回復

登錄后才能評論

谷歌 DeepMind 展示 GenRM 技術(shù)，提升生成式 AI 推理能力

相關(guān)推薦

發(fā)表回復