Meta发布新AI模型SeamlessM4T  支持100种语言翻译 包括闽南语
2023-08-23 18:18 文章来自:IFTNews科技 收藏(0) 阅读(18339) 评论(0)
IFTNews科技 8月23日讯:Meta平台公司(纳斯达克股票代码:Meta)宣布推出一款新的人工智能模型,允许用户通过不同语言的语音和文本轻松交流。这种多语言模型被称为SeamlessM4T,支持大约100种语言。它可以执行语音到文本、语音到语音、文本到语音和文本到文本的翻译。

SeamlessM4T在研究许可下发布,允许研究人员和开发人员在此基础上进行构建。除了SeamlessM4T, Meta还引入了SeamlessAlign的元数据,这是迄今为止最大的开放多模态翻译数据集,总计挖掘了27万小时的语音和文本。

Meta的研究科学家经理Paco Guzmán评论道:

它甚至支持动态切换语言。这使它能够更好地支持那些在日常讲话中自然混合语言的人群。”

Meta希望SeamlessM4T单一方法减少错误和延迟,提高了翻译过程的效率和质量。该公司根据之前类似项目的发现开发了这个模型。

去年,Meta推出了“无语言掉队”(No Language Left Behind,简称NLLB),这是首创的人工智能模型,可以直接在200种语言之间进行翻译。且这种模式是免费的,它让用户有机会访问他们母语的网络内容,并在任何地方与任何人交流。

Meta开发的另一个项目是通用语音翻译器,它针对的是闽南语——一种在海外华人中广泛使用的语言,没有标准的书面形式。在现存的7000多种语言中,40%以上的语言主要是口头语言,没有标准的或广为人知的书写系统。因此,Meta想出了一个解决方案,可以从闽南语扩展到其他不成文的语言。

今年早些时候,Meta宣布了大规模多语言语音模型,该模型支持1100多种语言的自动语音识别(ASR)和文本到语音合成(TTS),以及4000多种语言的语言识别(LID)。

人工智能驱动的翻译产业

由于人工智能的蓬勃发展,翻译行业发生了革命性的变化,语言障碍被消除,翻译变得更加容易。通过利用神经网络,人工智能翻译工具可以检测数据中的模式,并准确地将文本从一种语言翻译成另一种语言。人工智能提供了极其快速、大量的翻译,这些翻译越来越准确和精确,这使得讲不同语言的人能够有效地交流。

最广泛使用的人工智能翻译工具包括Google Translate、Microsoft Translator、DeepL、systeman、Trados Enterprise、Sonix、Alexa Translations等。

随着人工智能技术的不断发展,我们可以期待在翻译领域看到重大进步。未来,人工智能翻译工具有望变得更加个性化,允许用户定制他们的翻译以满足他们的需求。全球机器翻译市场规模预计将从2021年的8.126亿美元增至2030年的近41亿美元。