解析深度学习:语音识别实践》是首部介绍语音识别中深度学习技术细节的专著。全书首先概要介绍了传统语音识别理论和经典的深度神经网络核心算法。接着全面而深入地介绍了深度学习在语音识别中的应用,包括“深度神经网络-隐马尔可夫混合模型”的训练和优化,特征表示学习、模型融合、自适应,以及以循环神经网络为代表的若干先进深度学习技术。
上传时间: 2022-07-24
上传用户:qdxqdxqdxqdx
·语音处理与识别是利用计算机对语音信号进行分奸和综和,实现对人类语音的自动理解和处理的一门学科.本书共八章,即语音信号数字处理基础、语音信号时域处理方法、语音波形数字编码、短时博里叶分析、语音信号同态处理及线性预测编码、语音识别方法与系统等。本书可作通信工程、无线电技术和计算机应用科字等专业的本科生、研究生以及科技人员参考。
上传时间: 2013-08-04
上传用户:Divine
语音处理与识别_胡光锐 【语言】:中文 【页数】: 332 【何人(公司)所著】: 胡光锐 【文件格式】: PDF 【文件原名】: print 语音处理与识别_胡光锐 【摘要或目录】: 1语音信号数字处理基础 2语音信号时域处理方法 3语音波形的数字编码 4短时傅里叶分析方法 5语音信号的同态处理 6语音信号的线性预测编码 7语音识别方法与系统 8语音处理与识别的其他方法
上传时间: 2013-12-21
上传用户:zhengzg
通过MATLAB平台建立一个GUI界面,接着对一组语音信号的输入进行预处理及端点检测,提取特征参数(MFCC),形成参考模块。然后再对一组相同的语音信号输入进行同样的操作作为测试模块,与参考模块进行DTW算法进行匹配,输出匹配后的识别结果。
上传时间: 2016-06-15
上传用户:sjr88
设计了一个具有语音识别功能的遥控小车。采用16 位凌阳单片机SPCE061A 和红外发射芯片TX-2B 构成遥控电路。由SPCE061A 实现语音的采集、识别;红外发射/接收芯片TX-
上传时间: 2013-07-11
上传用户:guanliya
语音识别技术是信息技术领域的重要发展方向之一,小词汇量非特定人孤立词语音识别是语音识别领域中一个具有广泛应用背景的分支,在家电遥控、智能玩具、人机交互等领域有着重要的应用价值.语音识别芯片从20世纪90年代开始出现,目前的语音识别芯片都是以DSP为核心集成的语音识别系统,算法主要通过软件实现,为了提高速度和降低成本,下一代语音识别芯片将设计成软硬件协同实现,本文的目的是使用全硬件方法实现语音识别算法,为软硬件协同实现的方案提供参考.本论文主要完成了以下工作:(1)在选定的FPGA平台上,完成了整个系统的硬件设计.(2)对于硬件中难于实现而且占用较多资源的乘法器、求对数、求平方根以及快速傅立叶变换等关键模块,本文都根据电路的具体特点,给出了巧妙的实现方案,完成了算法需要的功能.(3)设计中使用了模块复用和流水线技术.(4)根据设计结果,给出了各个模块占用的硬件资源和运行速度.实验结果表明,本文所设计的硬件系统能够正常工作,在速度和面积方面都达到了设计要求.
上传时间: 2013-06-12
上传用户:01010101
随着语音技术应用的发展,语音信号数字处理的实时性要求越来越突出。这就要求在系统设计中,对系统的硬件环境要求更高。随着语音处理算法的日益复杂,用普通处理器对语音信号进行实时处理,已经不能满足需要。专用语音信号处理芯片能解决实时性的要求,同时对器件的资源要求也是最低的。 论文利用Altera公司的新一代可编程逻辑器件在数字信号处理领域的优势,对语音信号的常用参数—LPC(线性预测编码,Linear Predictive Coding)参数提取的FPGA(现场可编程门阵列,Field Programmable Gate Array)实现进行了深入研究。论文首先对语音的离散数学模型和短时平稳特性进行了分析,深入讨论了语音线性预测技术。第二,对解线性预测方程组的自相关法和协方差斜格法进行了比较,提出了一种基于协方差斜格法的LPC参数提取系统的总体设计方案。第三,对Altera公司的Cyclon系列可编程器件的内部结构进行了研究,分析了在QuartusⅡ开发平台上进行FPGA设计的流程。第四,对系统的各个功能模块进行了设计,所有算法通过Verilog硬件描述语言实现,并对其工作过程进行了详细的分析。最后,在Altera FPGA目标芯片EP1C6Q240C8上,对LPC参数提取系统进行了仿真验证。 系统具有灵活的输入输出接口,能方便地同其它语音处理模块相连,构成一个完整的语音处理专用芯片,可以应用于语音编解码、语音识别等系统。
上传时间: 2013-04-24
上传用户:TI初学者
·详细说明:本程序将指定的16K采样的语音数据文件转换为经G.723编解码后的8K语音数据。降采样前先使用180阶的FIR滤波器对语音数据进行频率压缩,然后进行抽取,并对抽取的数据进行G.723编解码。该程序在非特定语音识别的库文件处理中使用,也可扩展至其他用途。文件列表: 16kto8k .......\16kto8k.dsp .......\16kto8
上传时间: 2013-04-24
上传用户:qw12
·详细说明:本程序包含语音压缩和语音识别领域所需的LPCC,MFCC特征提取算法以及语音端点检测源码。在对语音数据进行特征提取前,可对语音数据进行16K到8K的降采样率处理,包含180阶FIR滤波器的频率压缩程序。文件列表: LPCC&MFCC&VAD .............\endpointD .............\.......
上传时间: 2013-07-06
上传用户:windwolf2000
钟是现代人类日常生活必不可少的工具,语音时钟更是现在电子时钟多功能化发展的一个方向。语音电子钟具有突出的播报时间的功能,它被广泛用在生活中的各种场合。本设计就是从日常生活中常见的事物入手,通过对语音电子钟的设计,让我认识到单片机已经深入到我们生活的每个领域。 本文从语音电子钟的设计原理、设计方案入手,详细介绍了系统硬件设计、软件设计及调试。在语音电子钟的设计中,要处理好以下几个关键:D/A(数/模)转换,语音识别,人机接口,程序设计。D/A(数/模)和语音识别技术关系到时间的正确播报,人机接口是播报时间和调整时间的关键。利用凌阳SPCE061A单片机在语音识别和处理方面的优点,结合实践,设计出有特色的语音电子钟。
上传时间: 2013-10-30
上传用户:feitian920