百度大脑语音能力引擎论坛在京召开,现场,百度语音首席架构师贾磊正式提出基于复数CNN网络的语音增强和语音识别一体化端到端建模技术,该方法抛弃了数字信号处理学科和语音识别学科的各种先验假设,消除学科间壁垒,直接端到端进行一体化建模。相较于传统基于数字信号处理的麦克阵列算法,错误率降低超过30%。
这项技术无需任何数字信号处理和语音识别学科的先验假设,复数CNN网络内存占用少于200K,可以内置到百度鸿鹄芯片内部。利用进场数据和纯粹依靠仿真数据,就可以获得足量的远场训练数据,整个过程是从原始多麦克信号到识别文字的一个端到端训练,整个优化过程只有字错误率两集一个优化准则。
百度语音首席架构师贾磊表示,“这项技术完成了数字信号处理和语音识别这两个领域的技术革命,用端到端一个声学模型,不需要任何领域行业的支持,解决两个跨领域的语音识别问题。”
百度AI生态合作伙伴计划即“燎原计划”,旨在为合作伙伴提供技术、客户、营销、企业运作和投资支持等支持,助力合作伙伴开拓创新,共创AI技术生态的未来。
百度AI开放平台,是面向企业、机构、创业者、研发者,将百度在人工智能领域积累的技术以API或SDK等形式对外共享的在线平台。提供全球前沿的语音识别与合成、OCR、人脸识别、NLP等数十项服务,开放DuerOS、Apollo两大行业生态,享应用场景和解决方案,帮您提升竞争力,开创未来。
提供全球精良的语音、图像、NLP等多项人工智能技术,开放对话式人工智能系统、智能驾驶系统两大行业生态,共享AI领域新的应用场景和解决方案,您提升竞争力。
提起硅谷,你最先想到什么?美国、高科技、创业,还是世界的中心?这些都没错,硅谷之所以成为硅...
深圳是一座高速发展的城市,马上要成为中国、乃至于整个亚洲的科技、金融中心,在这里有着许许多...
跨境支付正在变得越来越流行,但凡有过跨境购物、出国旅游或留学的人,或多或少都会接触过。但是...
国家互联网信息办公室发布了第一批境内区块链信息服务备案编号, 根据《区块链信息服务管理规定...
互联网现如今迎来了内容创业的风潮,付费社区、音频问答、在线课程等知识付费产品表现抢眼,喜马...
在2017杭州云栖大会上,阿里巴巴宣布成立达摩院,3年投入1000亿元探索前沿科技,以科技...