亚马逊开发出有史以来最大的文本转语音模型

2024-07-05 22:11:20 阅读(8631)

2 月 18 日消息,亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在 arXiv 预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。

近年来,像 ChatGPT 这样的“大型语言模型”凭借其智能回答问题和生成高级文本的能力而备受关注。然而,人工智能也在逐步融入其他主流应用领域。在这个新项目中,研究人员尝试通过增加参数数量和扩充训练数据集来提升文本转语音应用的能力。

据IT之家了解,这个名为“可扩展流式文本转语音模型”(BASE TTS)的新模型拥有 9.8 亿个参数,并使用 10 万小时的录音(来自公共网站)进行训练,其中大部分为英语语音。研究人员还向模型提供了其他语言的单词和短语示例,使其能够正确发音一些常见的表达,例如“au contraire” 和 “adios, amigo”。

亚马逊团队还测试了使用较小数据集的模型,希望能从中发现人工智能领域所说的“涌现能力”。这种能力是指人工智能应用,无论是大型语言模型还是文本转语音模型,突然突破到更高智能水平的现象。他们发现,对于文本转语音应用而言,这种飞跃发生在参数量达到 1.5 亿的中型数据集上。

研究人员还指出,这种飞跃涉及一系列语言属性,例如使用复合名词、表达情感、使用外语词、应用语音学和标点符号以及正确强调句子中的关键词等能力。

研究团队表示,出于对潜在滥用风险的担忧,BASE TTS 将不会向公众开放,他们计划将其作为学习应用,并期望将学到的知识应用于改善文本转语音应用的整体音质。

相关阅读
拓展阅读
淘宝网店的竞争日益激烈,如果想要做好网店运营的工作,那自然也需要学会具体的运营方法,而且还需要琢磨和研究打造爆款商品的技巧,这样才能爆单,具体应该怎么操作呢
2023-09-01
拼多多稳定出评,一号一拍,指定评语和晒图,出评率95%以上。
2023-09-01
从抖音矩阵账号准备,如何低成本制作视频以及在进行内容制作时,如何高效运作批量账号等大家比较关心的话题,给你一一讲明白。
2023-12-01
抖音生活服务最近也是上线了大家都比较关注的探店会用到的撮合产品“探店宝”,而且它会同步在全国的34个城市里上线,这个产品最简单的就是规范了商达准入的标准,让合作双方可以获得更有保障的结果。
拼多多大促通常都是一个活动或者两个活动联合,而这次也是迎来了三连大促,所以,这次的活动时间和热度也是非常高的,作为商家来说现在已经可以开始报名了,在接下来的国庆期间可以期待下。
2023-09-17 10:15:24 阅读(10124)
快手在AI上也是做了很多的功课,之前也是推出了对话功能,此次也在短视频区域宣布测试快手AI玩评功能,大家可以尝试输入内容,让系统自动生成图文让给大家可以更好的在评论区里互动。
2023-09-16 15:46:50 阅读(10801)
关注有礼、定向促销、收藏加购、动态红包、预热打折、智能推荐、手机海报、评价管理等等....淘宝拼多多开店必备!现在免费送!
2022-04-01
抖音电商节盟计划相信有部分商家听说过,而就在今年抖音这边也对节盟计划进行了升级,曝光了全新的计划,目的也是为了帮助品牌方共同实现营销目标的大促,但凡是想参与的商家其实现在都可以开始报名了。
9月也是消费的高潮期,为此抖音生活服务也是开始整活了,通过官方直播间联合商家为用户提供官方优化商品,带用户们了解各地优质的商品,深入文化旅游的期间也为大家带来更多出行的介绍。
抖音电商最近也是上线了品牌力标准内容,通过系统对于几个指标的考核为各品牌打分,商家们可以通过品牌力知道自己目前的大概情况,而且品牌力也是分了标准的,大家可以根据标准来调整。
抖音app最近也是做功能和板块的测试,比如说就有媒体曝出最近在测试“不喜欢”和“长视频”板块的功能,通过这些板块的反馈,其实,可以更好的了解用户的需求,再之后的功能设置上,平台也会更有针对性。
抖音生活服务频道主要是为了下线的商家服务,当然随着抖音知名度的提升,其实不少的餐饮商家也意识平台的重要性,进入平台的也越发多了起来为了更垂直的发展,抖音也上线了生活服务饮品经营解决方案。
如今的食品生鲜行业也是各大平台都非常重视的,比如说淘宝天猫也是在呼唤召开双11视频生鲜行业大会,平台这边也宣布投入数亿元来支持商家们,这也是目前来说平台在这个行业里最大规模的投入。
京东“9.9超省日”主会场也是又一轮的低价活动,对于此次活动比较期待的朋友们可以在今晚8点进入到会场里去看看,目前参与的商品也是几乎覆盖了全品类,而且活动期间还有不少优惠券送出。
2023-09-09 15:15:53 阅读(5879)
热门文章
推荐阅读
最新专题