Meta 最近公布了 AI 翻譯套件 Seamless Communication,該套件由 4 款 AI 模型組成,可實現(xiàn)近百種語言輸入、同聲傳譯能力,并支持僅 2 秒延遲的翻譯。
Meta 表示,該 AI 套件能夠“精準再現(xiàn)說話者情緒”。其中,SeamlessM4T 模型可以在翻譯時自動聯(lián)想可能的后文,加速翻譯過程。
另一款模型 Seamless Expressive 則可以解決傳統(tǒng) AI 翻譯無法抓住用戶語調(diào)、停頓、讀詞重輕度的問題,保存用戶情緒、風格、說話速度、停頓和節(jié)奏,從而為翻譯內(nèi)容帶來更多“情感信息”。
Seamless Streaming 是同聲翻譯模型,主打 2 秒延遲的語音和文字翻譯,支持口譯、聽寫翻譯及自動語音識別功能。而綜合模型 Seamless 則整合了上述三種語言模型,便于通用場景。
目前 Meta 已經(jīng)將示例視頻發(fā)布在 GitHub 以及 HuggingFace 網(wǎng)站上,感興趣的小伙伴們可以點此進行查看。
原創(chuàng)文章,作者:若安丶,如若轉(zhuǎn)載,請注明出處:http://rponds.cn/article/602032.html