亚马逊开发出有史以来最大的文本转语音模型
2024-07-05 22:11:20 阅读(8631)
2 月 18 日消息,亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在 arXiv 预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。
近年来,像 ChatGPT 这样的“大型语言模型”凭借其智能回答问题和生成高级文本的能力而备受关注。然而,人工智能也在逐步融入其他主流应用领域。在这个新项目中,研究人员尝试通过增加参数数量和扩充训练数据集来提升文本转语音应用的能力。
据IT之家了解,这个名为“可扩展流式文本转语音模型”(BASE TTS)的新模型拥有 9.8 亿个参数,并使用 10 万小时的录音(来自公共网站)进行训练,其中大部分为英语语音。研究人员还向模型提供了其他语言的单词和短语示例,使其能够正确发音一些常见的表达,例如“au contraire” 和 “adios, amigo”。
亚马逊团队还测试了使用较小数据集的模型,希望能从中发现人工智能领域所说的“涌现能力”。这种能力是指人工智能应用,无论是大型语言模型还是文本转语音模型,突然突破到更高智能水平的现象。他们发现,对于文本转语音应用而言,这种飞跃发生在参数量达到 1.5 亿的中型数据集上。
研究人员还指出,这种飞跃涉及一系列语言属性,例如使用复合名词、表达情感、使用外语词、应用语音学和标点符号以及正确强调句子中的关键词等能力。
研究团队表示,出于对潜在滥用风险的担忧,BASE TTS 将不会向公众开放,他们计划将其作为学习应用,并期望将学到的知识应用于改善文本转语音应用的整体音质。
上一篇: 阿里巴巴获“抄底王”大幅增持
相关阅读
拓展阅读
抖音电商节盟计划相信有部分商家听说过,而就在今年抖音这边也对节盟计划进行了升级,曝光了全新的计划,目的也是为了帮助品牌方共同实现营销目标的大促,但凡是想参与的商家其实现在都可以开始报名了。
2023-09-15 14:18:12 阅读(8077)
9月也是消费的高潮期,为此抖音生活服务也是开始整活了,通过官方直播间联合商家为用户提供官方优化商品,带用户们了解各地优质的商品,深入文化旅游的期间也为大家带来更多出行的介绍。
2023-09-14 11:56:32 阅读(7924)
抖音生活服务频道主要是为了下线的商家服务,当然随着抖音知名度的提升,其实不少的餐饮商家也意识平台的重要性,进入平台的也越发多了起来为了更垂直的发展,抖音也上线了生活服务饮品经营解决方案。
2023-09-11 10:04:14 阅读(8656)
如今的食品生鲜行业也是各大平台都非常重视的,比如说淘宝天猫也是在呼唤召开双11视频生鲜行业大会,平台这边也宣布投入数亿元来支持商家们,这也是目前来说平台在这个行业里最大规模的投入。
2023-09-10 15:40:06 阅读(5133)
热门文章
推荐阅读
最新专题
热门搜索