Meta推出Seamless Communication AI翻譯套件 支持近百種語言輸入

Meta推出Seamless Communication AI翻譯套件 支持近百種語言輸入

Meta 最近公布了 AI 翻譯套件 Seamless Communication,該套件由 4 款 AI 模型組成,可實現(xiàn)近百種語言輸入、同聲傳譯能力,并支持僅 2 秒延遲的翻譯。

Meta 表示,該 AI 套件能夠“精準再現(xiàn)說話者情緒”。其中,SeamlessM4T 模型可以在翻譯時自動聯(lián)想可能的后文,加速翻譯過程。

另一款模型 Seamless Expressive 則可以解決傳統(tǒng) AI 翻譯無法抓住用戶語調(diào)、停頓、讀詞重輕度的問題,保存用戶情緒、風格、說話速度、停頓和節(jié)奏,從而為翻譯內(nèi)容帶來更多“情感信息”。

Seamless Streaming 是同聲翻譯模型,主打 2 秒延遲的語音和文字翻譯,支持口譯、聽寫翻譯及自動語音識別功能。而綜合模型 Seamless 則整合了上述三種語言模型,便于通用場景。

目前 Meta 已經(jīng)將示例視頻發(fā)布在 GitHub 以及 HuggingFace 網(wǎng)站上,感興趣的小伙伴們可以點此進行查看。

原創(chuàng)文章,作者:若安丶,如若轉(zhuǎn)載,請注明出處:http://rponds.cn/article/602032.html

若安丶的頭像若安丶管理團隊

相關(guān)推薦

發(fā)表回復

登錄后才能評論