品牌知名度调研问卷>>

阿里巴巴发布语音合成技术 从多个方面改进语音合成

本文章由注册用户 名品资讯 上传提供 评论 发布 纠错/删除 版权声明 0

阿里巴巴发布语音合成技术KAN-TTS,基于KAN-TTS技术的合成语音可将该数据提高到97%以上。融合了端到端TTS技术和传统TTS技术,从多个方面改进了语音合成。普通用户定制“AI声音”的门槛更低了。


  • 阿里巴巴发布语音合成技术KAN-TTS据介绍,该技术可大幅提高合成语音与真人发声的相似度,并将语音合成定制成本降低10倍以上。

    KAN-TTS技术由达摩院机器智能实验室自主研发。阿里方面称,基于KAN-TTS技术的合成语音可将该数据提高到97%以上。

    据悉,KAN-TTS深度融合了端到端TTS技术和传统TTS技术,从多个方面改进了语音合成。传统语音合成定制需要10小时以上的数据录制和标注,对录音人和录音环境要求很高。从启动定制到最终交付,项目周期长成本高。

    阿里利用Multi-Speaker ModelSpeaker-aware Advanced Transfer Learning相结合的方法,将语音合成定制周期压缩3倍以上。也就是说,用1小时有效录音数据和不到两个月制作周期,就能完成一次标准TTS定制。

    此外,这使得普通用户定制AI声音”的门槛更低。只需手机录音十分钟,就能获得与录制声音高度相似的合成语音。

推荐阅读
网站提醒和声明
本网站为注册用户提供信息存储空间服务。除Maigoo网官方发布内容外,用户自主上传的文章、文字、图片等均不代表本站立场,本站亦不主动修改编辑,不对其真实性、合法性、准确性负责。如涉侵权、违法虚假等问题,权利人可通过平台投诉并提交相关证明,平台将依法履行通知和删除义务。 申请删除>> 纠错>> 投诉侵权>> 平台自有内容(文字、图片、界面、榜单、商标、LOGO 等)知识产权归本站所有,未经书面许可,禁止复制、转载、商用。
提交说明: 快速提交发布>> 提交资讯帮助>> 注册登录>>
最新评论
相关推荐
未来可能被AI取代的十大职业 人工智能将来会淘汰哪些行业[2026]
麦肯锡报告预测50%的工作将在2030-2060年被AI取代,那些需要大量重复性劳动的工作几乎必然被淘汰,那人工智能将来会淘汰哪些行业呢?小编为大家整理了未来可能被AI取代的十大职业,如:数据录入员、客户服务与销售、会计与审计员、放射科医生、传统流水线工人、收银员、翻译员等,一起来看看吧。
虹膜识别安全吗 识别不出来怎么办 虹膜识别常见问题汇总
随着社会科技的发展进步,各种各样的安全防护方法也层出不穷,膜识别技术已经应用在手机、门禁等电子产品上,那么虹膜识别是否真的安全,虹膜识别在使用中都存在哪些问题呢?下面大家来看看吧。
【民用无人机】新一代"飞行革命" 玩无人机航拍也要考驾驶证!
无人机是一种由无线电遥控设备或自身程序控制装置操纵的无人驾驶飞行器,无人机最早开发是在一战后,而二战后则有了较普遍的军事应用。无人机最初扮演的是侦察角色,随着技术进步,无人机在军事上有了更多的应用,如今,无人机在民用领域的作用也越来越多,有着广阔的发展前景,不仅能上天还能下海!究竟无人机都能做些什么?无人机航拍怎么玩?无人机也要考驾照吗?无人机哪家好?下面,就来了解下无人机的相关知识。
“刷脸”真的安全吗 一文读懂如何保护人脸识别带来的隐私风险
你用过人脸识别吗?相信在小区门禁、手机解锁、刷脸支付、身份认证等场景,大家已经使用过或者见识过人脸识别技术了。人脸识别技术在生活应用中展现出了明显的优势,但同时也存在一些安全性和隐私性问题。大家在感受人脸识别的良好使用体验的同时,也在担心一些存在的风险。那么“刷脸”真的安全吗?使用技术的同时别忘了保护自己的信息,下面带大家了解如何保护人脸识别带来的隐私风险。
人脸识别 AI人工智能 ★★★★
682 1
人机交互有几种方式 手机隔空操作原理 盘点常见交互方式有哪些
随着科技的进步,人工智能应用在了很多领域上,一大表现特征就是我们与产品之间的联系方式变得更加丰富。比如操作一个手机,我们不仅可以用手指去触摸点击,我们还可以通过说话去操作、用隔空手势去操作,甚至用你的眼睛就可以操作手机屏幕,这就是人机交互的常见几种方式。本期专题,小编就和你聊聊人机交互这个技术。