语音模型的GPT时刻:MetaAI发布的基础语音大模型Voicebox简介及其模型说明
大规模生成式AI模型在自然语言处理领域和计算机视觉领域已经诞生了类似GPT、Stable Diffusion这样的基础大模型,极大地推动了相关领域的AI进展。但是,在语音处理领域,目前还没有这样的模型可以像GPT那样用一个基础模型解决一系列的语音处理任务。

今天,MetaAI发布了一个新的语音处理领域的生成式大模型Voicebox,可以像GPT那样用生成式的方式处理语音(speech)数据的相关任务,包括语音编辑、跨风格语音生成等语音数据处理相关的很多任务。这可能就是语音处理领域的GPT时刻!
Voicebox在DataLearner上模型信息卡地址:https://www.datalearner.com/ai/pretrained-models/Voicebox
看完这个模型,我就一个感觉,这个Voicebox是影视公司的福音,骗子的狂欢,普通大众的祸福难料啊!





