近日,Meta發(fā)布了一個(gè)名為SeamlessM4T的人工智能(AI)模型,可以翻譯和轉(zhuǎn)錄近百種語言。據(jù)Meta介紹,SeamlessM4T可以翻譯近100種語言的語音到文本和文本到文本。對(duì)于語音轉(zhuǎn)語音和文本轉(zhuǎn)語音的操作,它可以識(shí)別100種輸入語言,并將其轉(zhuǎn)換為35種輸出語言。
SeamlessM4T是根據(jù)知識(shí)共享許可(CC) 協(xié)議4.0發(fā)布的,允許研究人員對(duì)其進(jìn)行迭代。
對(duì)于SeamlessM4T模型,Meta研究人員在一篇研究論文中表示,他們從400萬小時(shí)的原始音頻中收集了音頻訓(xùn)練數(shù)據(jù),這些音頻來自一個(gè)公開的抓取網(wǎng)絡(luò)數(shù)據(jù)存儲(chǔ)庫,但沒有說明是哪個(gè)存儲(chǔ)庫。Meta表示,SeamlessM4T代表了一個(gè)重大突破,因?yàn)檫@個(gè)模型可以一次性完成整個(gè)翻譯任務(wù),而不像其他大型翻譯模型那樣,將翻譯分成不同的系。
SeamlessM4T建立在Meta之前的翻譯模型之上。Meta去年發(fā)布了支持200種語言的文本到文本的翻譯模型。它開發(fā)了用于多語言語音到語音翻譯的數(shù)據(jù)集,以及用于語音識(shí)別的大規(guī)模多語言語音。Meta去年展示了它的通用語音翻譯器,可將閩南語轉(zhuǎn)化為英語。
本文來自投稿,不代表科技訊立場,如若轉(zhuǎn)載,請(qǐng)注明出處:http://rponds.cn/article/577012.html