GenRM

  • 谷歌 DeepMind 展示 GenRM 技術(shù),提升生成式 AI 推理能力

    谷歌DeepMind發(fā)布GenRM技術(shù),通過創(chuàng)新獎勵模型增強生成式AI推理能力,提高大語言模型性能。GenRM能無縫集成指令調(diào)整,支持思維鏈推理,優(yōu)化結(jié)果質(zhì)量。在推理任務(wù)中表現(xiàn)優(yōu)于傳統(tǒng)驗證器,標(biāo)志著AI獎勵系統(tǒng)的重要演化。

    2024年9月3日