线性预测技术作为一种基于全极点模型假定和均方预测误差最小准则下的波形逼近技术。本文简要介绍了LPC 技术的基本原理,并利用MATLAB 这一有力工具对语音信号进行了LPC 分析,并对阶数的选取
上传时间: 2013-05-26
上传用户:博雅abcd
语音识别是通过识别和理解过程把人类的语音信号转变为文本或命令的技术。近年来语音识别技术由于其重要性和研究难度成为研究的热点。随着嵌入式的发展,嵌入式语音识别技术成为语音识别领域发展的新的重要方向。 在此背景下,本课题进行基于ARM的嵌入式语音识别系统的研究。论文分别从理论分析、系统硬件平台的总体设计、系统软件的分析定制等方面,对语音识别在ARM上的应用做了研究。 1、在理论上,详细介绍了语音识别的发展历史与研究现状;具体阐述语音识别技术的基本原理和主要研究方法,并推导了语音识别技术中最常用到的两种算法DTW和HMM的数学模型,为进一步的语音识别研究打下基础。 2、在硬件平台方面,本文分析设计了语音识别系统的总体方案,主要包括以下三部分:语音识别系统的控制部分、语音的输入输出部分以及语音程序的存储部分;文中详细介绍了各部分的作用以及它们之间的连接方式,此外根据实际需要,选择确定了语音芯片等外围电路芯片的型号并扩展了外围电路。 3、在系统软件选择定制方面,不仅要求各部分自身功能完善,能够满足本课题的需求,而且要求各部分相互之间满足一定的兼容性,即定制的系统具有稳定性,可以有效的工作。考虑到以上的因素,本课题针对特定的语音识别系统的需求,对交叉编译环境、U-boot、内核、根文件系统等均进行了量身定制。最终选用Crosstool来制作专门编译Linux-2.6.22.6的交叉编译工具;选用比较稳定的支持tftp下载的u-boot-1.2.0作为引导程序;选用Linux-2.6.22.6作为嵌入式操作系统内核,并对其进行剪裁定制,特别是增加了UDA1341TS音频驱动和网卡驱动部分;选用了带有mdev功能的busybox-1.9.1来制作根文件系统。 在以上三方面的基础上,本课题对语音识别程序系统进行了实验研究。实验包括音频驱动、语音录制、语音训练、语音识别程序的编译以及语音识别等程序在ARM上的移植。 最后,本论文采用DTW模型,完成了语音模板的训练和语音识别的任务。经过实验测试,该系统有效完成了预期的语音识别任务。
上传时间: 2013-05-30
上传用户:wsx123
利用ARM处理器开发处理音频信号的设备很多,如移动电话、MD(MiniDisc),DVD播放器、MP3音频译码器等;同样,基于ARM处理器的网络设备也很多,如网络调制解调器、网络电脑、因特网设备等。但利用ARM处理器把语音处理和网络通信功能结合起来无疑是一种新的尝试,它的设计成功会给网络留言技术的开发提供一种新的思路。 本文通过一个ARM9芯片S3C2410作为处理器的嵌入式语音采集系统,详细阐述了嵌入式系统的设计与开发过程,其中包括: 交叉编译环境的搭建:交叉编译环境是嵌入式开发工具的集合,搭建该环境就是在系统中编译安装开发工具链。 操作系统内核的移植:这是嵌入式开发的主要单元之一,移植内核主要是对内核进行重新配置,使它符合特定系统的需要,然后重新编译生成可执行的内核镜像文件。 文件系统的移植:文件系统是操作系统对数据进行管理的有效和必要的助手。移植文件系统包括制作文件系统镜像、在Flash上为文件系统分配存储空间以及文件系统与嵌入式操作系统的有效配合。 驱动程序的设计:驱动是操作系统与硬件沟通的桥梁,驱动设计就是编写具体硬件的读写控制函数并向操作系统提供统一的接口。 本文更着重于介绍实际开发中使用的技术以及遇到的问题和解决方法。在第4章中结合语音芯片UDA1341TS阐述了语音数据的采集与处理;结合网卡控制芯片CS8900A阐述了网络通信和网卡的驱动,以及网络开发中遇到的问题和解决方法。
上传时间: 2013-07-11
上传用户:luopoguixiong
美国ISD公司的2500芯片,按录放时间60秒、75秒、90秒和120秒分成ISD2560、2575、2590和25120四个品种。ISD2500系列和1400系列语音电路一样,具有抗断电、音质好,使
上传时间: 2013-06-01
上传用户:hank
设计了一个具有语音识别功能的遥控小车。采用16 位凌阳单片机SPCE061A 和红外发射芯片TX-2B 构成遥控电路。由SPCE061A 实现语音的采集、识别;红外发射/接收芯片TX-
上传时间: 2013-07-11
上传用户:guanliya
变电站电压无功综合控制是通过自动调节有载变压器的分接头和投切并联补偿电容器组来实现的,它是确保电压质量和无功平衡、提高供电网可靠性和经济性的重要措施。采用九区图控制策略的电压无功综合控制,实际运行时存在着频繁调节变压器分接头和投切电容器组的缺陷,甚至可能会出现震荡现象。 本文针对上述不足,根据有功功率和无功功率的负荷预测曲线,以降损收益最大为适配值函数,以电压约束、电气极限约束和控制约束为约束条件,提出了一种改进的禁忌搜索算法。引入最低收益阈值来限制调节次数的增加,在此基础上建议了一种确定最佳调整次数的方法。还建议了一种有约束线性最小二乘算法,基于变电站内的量测数据以及变压器的参数来估计系统电压和系统阻抗参数。算例结果表明建议的方法是可行的,并且具有可以有效地减少调节次数的特点。基于ARM的LPC2292微控制器和嵌入式实时操作系统(μC/OS-II),采用ADS1.2开发工具进行编程,实现了变电站内电压无功综合控制功能。软件模块开发主要包括:嵌入式实时操作系统(μC/OS-II)和图形用户界面GUI移植,数据读取任务,数据处理任务,电压无功控制任务,基于GPRS/CDMA的通讯任务、键盘扫描和液晶显示任务等。采用信号发生器产生电能信号,采用继电器的动作模拟变压器分接头档位的调节和电容器组的投切,构建了一个变电站内的电压无功控制模拟测试台,对提出的设计方案进行了全面的功能测试,测试结果表明提出的设计方案是可行的。
上传时间: 2013-04-24
上传用户:pinksun9
语音识别技术是信息技术领域的重要发展方向之一,小词汇量非特定人孤立词语音识别是语音识别领域中一个具有广泛应用背景的分支,在家电遥控、智能玩具、人机交互等领域有着重要的应用价值.语音识别芯片从20世纪90年代开始出现,目前的语音识别芯片都是以DSP为核心集成的语音识别系统,算法主要通过软件实现,为了提高速度和降低成本,下一代语音识别芯片将设计成软硬件协同实现,本文的目的是使用全硬件方法实现语音识别算法,为软硬件协同实现的方案提供参考.本论文主要完成了以下工作:(1)在选定的FPGA平台上,完成了整个系统的硬件设计.(2)对于硬件中难于实现而且占用较多资源的乘法器、求对数、求平方根以及快速傅立叶变换等关键模块,本文都根据电路的具体特点,给出了巧妙的实现方案,完成了算法需要的功能.(3)设计中使用了模块复用和流水线技术.(4)根据设计结果,给出了各个模块占用的硬件资源和运行速度.实验结果表明,本文所设计的硬件系统能够正常工作,在速度和面积方面都达到了设计要求.
上传时间: 2013-06-12
上传用户:01010101
有噪声的语音信号分析与处理设计设计内容: 1) 选择一个语音信号作为分析对象,或录制一段语音信号; 2) 对语音信号进行采样,画出采样后语音信号的时域波形和频谱图; 3) 利用MATLAB中的随机函数产生噪声加入到语音信号中,使语音信号被污染,然后进行频谱分析; 4) 设计FIR和IIR数字滤波器,并对被噪声污染的语音信号进行滤波,画出滤波前后信号的时域波形和频谱,并对滤波前后的信号进行比较,分析信号的变化; 5) 回放语音信号、给出相应处理程序及输出相应语音波形。
上传时间: 2013-06-01
上传用户:wao1005
matlab程序实现的语音识别,能够较好的实现语音匹配
上传时间: 2013-04-24
上传用户:h886166
语音编码技术始终是语音研究的热点。语音编码作为多媒体通信中信息传输的一个重要环节,越来越受到广泛的重视。G729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的,国际电信联盟(ITU-T)于1995年11月正式通过了G729。96年ITU-T又制定了G729的简化方案G729A,主要降低了计算的复杂度以便于实时实现。因其具有良好的合成语音质量、适中的复杂度、较低的时延等优点,G729A标准已被广泛应用在VOIP网关、IP电话中。 论文利用Altera公司的新一代可编程逻辑器件在数字信号处理领域的优势,对G729A语音编码中的线性预测(LP)滤波器系数提取的FPGA(现场可编程门阵列,Field Programmable Gate Array)实现进行了深入研究。论文首先对语音信号处理及其发展进行介绍,深入讨论了G729A语音编解码技术。第二,对Altera公司的Stratix系列可编程器件的内部结构进行了研究,分析了在QuartusII开发平台上进行FPGA设计的流程。第三,基于FPGA,对G729A编码系统的LP分析部分做了具体设计,其中包括自相关函数和杜宾(Durbin)递推两个主要功能模块,并对其工作过程进行了详细的分析。第四,针对系统所使用的除法运算都是商小于1的特点,设计并实现了一个系统专用的除法器模块。最后,在Altera FPGA目标芯片EP1S30F780C7上,对LP分析系统进行了验证,证明了方案的可行性。
上传时间: 2013-04-24
上传用户:miaochun888