本文对家用电器中语音识别技术的DSP实现进行了研究。文章介绍了语音识别技术的基本概念,讨论了语音识别系统的组成和实现的技术;详细分析了构成语音识别系统的四个组成部分,包括语音信号数字化与预处理、语音的端点检测、特征提取与模式匹配。着重介绍了实现端点检测的短时平均能量与短时平均过零率分析,语音信号的线性预测分析及在此基础之上的倒谱特征参数,以及实现模式匹配的常用的矢量量化技术、动态时间规整技术和隐马尔可夫模型;根据提出的语音识别系统的构成,介绍了在MATLAB6.5上实现了采用动态时间规整算法的识别系统的仿真分析。
上传时间: 2013-04-24
上传用户:zwei41
现实生活中的语音不可避免的要受到周围环境的影响,背景噪声例如机械噪声、街头音乐噪音,其他说话者的话音等均会严重地影响语音信号的质量:此外传输系统本身也会产生各种噪声,因此接收端的信号为带噪语音信号。混叠在语音信号中的噪声按类别可分为环境噪声等的加法性噪声及电器线路干扰等的乘法性噪声;按性质可分为平稳噪声和非平稳噪声。 语音增强的根本目的就是净化语音质量。把不需要的噪音减低到最小程度。但是由于噪音的复杂性,很难归纳出一个统一的特征,因此不可能寻求一种算法完全适应于所有的噪音消除,因此语音增强是一个复杂的工程。 有关抗噪声技术的研究以及实际环境下的语音信号处理系统的开发,在国内外已经成为语音信号处理非常重要的研究课题,已经作了大量的研究工作,取得了丰富的研究成果。本文仅对加性噪声下的语音增强技术做了较为仔细的讨论,我们先给出语音信号处理的基本理论,它是语音增强算法研究和实现的理论基础,在此基础总结了自适应信号处理技术的特点以及在语音增强方面的应用。选取工程领域最常用的自适应LMS滤波算法和RLS滤波算法作为研究对象,提出了利用最小均方误差意义下自适应滤波器的输出信号与主通道噪声信号的等效关系,得到滤波器最佳自适应参数的方法,并分析了在平稳和非平稳噪声环境下,L M S滤波器族和R L S滤波器在不同噪音输入下的权系数收敛速度、权系数稳定性、跟踪输入信号的能力和信噪比的改善等特性。 研究了MATLAB语言程序设计和使用MALTLAB对语音算法进行仿真、并输入了多种实际环境下的噪音进行滤波仿真并对仿真的结果进行比较和分析。总结出了LMS、NLMS、SIGN-ERROR-LMS、RLS自适应滤波器在语音滤波方面的特点 和应用情况。 最后在MATLAB仿真的基础上,利用Altera公司的Cyclone2系列FPGA芯片和多种EDA工具,完成了L M S自适应滤波器的FPGA设计。 关键词:语音增强,背景噪音,自适应滤波器,LMS,RLS,FPGA
上传时间: 2013-04-24
上传用户:lijianyu172
在实际工作现场,常常需要在一个非常恶劣的环境中进行通话,随着CAN总线在工业生产的应用越来越广泛,想到了把CAN总线应用于电话通信上来.CAN总线具有极高的总线利用率,这有可能使得我们只需要用两根CAN总线,就可以把需要通话的节点电话连接起来,从而实现语音通信. 本文主要论述了基于CAN总线的多节点语音通信系统设计.该系统使用MC14LC5480作为语音采集编解码器,AT90CAN128作为处理器,使用处理器自带的CAN模块实现多个CAN节点间的通信,最终达到实现多节点间语音通信的功能. 本文的前半部分介绍了CAN总线技术和语音信号的数字处理技术,评价了用CAN总线传输语音信号的优点.本文后半部分详细介绍了该系统的硬件结构和软件设计,通过分析系统所涉及的芯片对该系统的各个功能模块做了详细的说明,包括语音编解码电路,语音数字信号处理电路,CAN总线传输电路等.通过该系统,能够实现在实验室条件下多个CAN节点间的语音通信.
上传时间: 2013-04-24
上传用户:mingaili888
高速发展的DSP技术为语音信号处理领域提供了良好的发展平台,使得实时实现各种复杂的算法称为可能。G.729语音编码是国际电信联盟(ITU-T)于1996年获准通过的采用共轭结构代数码激励线性预测技术的具有8 kbit/s码速率的语音算法建议,广泛应用于数字移动通信、IP电话和数字卫星通信中。本文研究了G.729语音编码原理和在TMS320C5416定点DSP芯片上实时实现该编码器过程中的软、硬件设计。主要涉及有以下几方面内容: 1.介绍语音编码技术和DSP技术的发展概况。 2.研究了基于CELP结构的G.729编码的算法原理。 3.根据G.729声码器实时实现的需要,介绍硬件平台的组成,研究了系统软件的设计和基于算法和实时需要的软件优化。 4.利用DSP代码调试工具对系统性能进行分析,得出测试结果。
上传时间: 2013-07-11
上传用户:woshiayin
近年来,语音识别研究大部分集中在算法设计和改进等方面,而随着半导体技术的高速发展,集成电路规模的不断增大与各种研发技术水平的不断提高,新的硬件平台的推出,语音识别实现平台有了更多的选择。语音识别技术在与DSP、FPGA、ASIC等器件为平台的嵌入式系统结合后,逐渐向实用化、小型化方向发展。 本课题通过对现有各种语音特征参数与孤立词语音识别模型进行研究的基础上,重点探索基于动态时间规整算法的DTW模型在孤立词语音识别领域的应用,并结合基于FPGA的SOPC系统,在嵌入式平台上实现具有较好精度与速度的孤立词语音识别系统。 本系统整体设计基于DE2开发平台,采用基于Nios II的SOPC技术。采用这种解决方案的优点是实现了片上系统,减少了系统的物理体积和总体功耗;同时系统控制核心都在FPGA内部实现,可以极为方便地更新和升级系统,大大地提高了系统的通用性和可维护性。 此外,由于本系统需要大量的高速数据运算,在设计中作者充分利用了Cyclone II芯片的丰富的硬件乘法器,实现了语音信号的端点检测模块,FFT快速傅立叶变换模块,DCT离散余弦变换模块等硬件设计模块。为了提高系统的整体性能,作者充分利用了FPGA的高速并行的优势,以及配套开发环境中的Avalon总线自定义硬件外设,使系统处理数字信号的能力大大提高,其性能优于传统的微控制器和普通DSP芯片。 本论文主要包含了以下几个方面: (1)结合ALTERA CYCLONE II芯片的特点,确定了基于FPGA语音识别系统的总体设计,在此基础上进行了系统的软硬件的选择和设计。 (2)自主设计了纯硬件描述语言的驱动电路设计,完成了高速语音采集的工作,并且对存储数据芯片SRAM中的原始语音数据进行提取导入MATLAB平台测试数据的正确性。整个程序测试的方式对系统的模块测试起到重要的作用。 (3)完成高速定点256点的FFT模块的设计,此模块是系统成败的关键,实现高速实时的运算。 (4)结合SOPC的特性,设计了人机友好接口,如LCD显示屏的提示反馈信息等等,以及利用ALTERA提供的一些驱动接口设计完成用户定制的系统。 (5)进行了整体系统测试,系统可以较稳定地实现实时处理的目的,具有一定的市场潜在价值。
上传时间: 2013-05-23
上传用户:ABCD_ABCD
语音编码技术始终是语音研究的热点。语音编码作为多媒体通信中信息传输的一个重要环节,越来越受到广泛的重视。G729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的,国际电信联盟(ITU-T)于1995年11月正式通过了G729。96年ITU-T又制定了G729的简化方案G729A,主要降低了计算的复杂度以便于实时实现。因其具有良好的合成语音质量、适中的复杂度、较低的时延等优点,G729A标准已被广泛应用在VOIP网关、IP电话中。 论文利用Altera公司的新一代可编程逻辑器件在数字信号处理领域的优势,对G729A语音编码中的线性预测(LP)滤波器系数提取的FPGA(现场可编程门阵列,Field Programmable Gate Array)实现进行了深入研究。论文首先对语音信号处理及其发展进行介绍,深入讨论了G729A语音编解码技术。第二,对Altera公司的Stratix系列可编程器件的内部结构进行了研究,分析了在QuartusII开发平台上进行FPGA设计的流程。第三,基于FPGA,对G729A编码系统的LP分析部分做了具体设计,其中包括自相关函数和杜宾(Durbin)递推两个主要功能模块,并对其工作过程进行了详细的分析。第四,针对系统所使用的除法运算都是商小于1的特点,设计并实现了一个系统专用的除法器模块。最后,在Altera FPGA目标芯片EP1S30F780C7上,对LP分析系统进行了验证,证明了方案的可行性。
上传时间: 2013-06-20
上传用户:pwcsoft
本文对G.729语音编码算法的基本原理和实现系统开发方面进行了深入研究。针对G.729语音编码算法在实际应用中存在的一些问题,在大量分析和实验的基础上,提出了新的改进算法。G.729语音编码算法硬件实现方面,国内外现在主要以DSP为实现平台,这是由于DSP以其卓越的运算能力为数字语音信号处理领域的研究及开发提供了有力的工具。但G.729语音编码算法具有计算复杂和数据存储量大的固有缺陷,随着通信量的不断增加和服务的扩展,对G.729语音编码实时性的要求也越来越高。随着微电子制造工艺的发展,越来越多的语音编码平台采用DSP与FPGA或MCU相互结合的系统,通过进行软硬件协同设计提高编码效率。
上传时间: 2013-06-30
上传用户:ccclll
随着通信、网络等技术的不断发展,对车内(机内)通话系统提出了更高的要求。本文以军用车内通话系统为主要应用背景,实现对现有车内通话系统的升级和改造,主要涉及系统结构、软件流程、相关接口及通信协议等内容。 早期模拟车内通话系统已经不能满足数字化建设的需要。现役的数字式车内通话系统普遍功能单一,不具备数据传输等功能。而且系统组成单体设备种类多、接口不统一、兼容性差,较难实现通用化设计。 本文提出一种基于ARM+DSP架构的多功能车内通话系统。主要由多个语音终端、一个主控盒以及头戴通信帽等硬件组成,最大可支持车内16个乘员之间通话,具有群呼、组呼、选呼、强呼、数据传输等功能,系统内乘员还可以通过主控盒与车外网络的用户进行通话或通信。 论文共分七章,主要内容包括:(1)车内通话系统的国内外发展现状和趋势;(2)语音终端系统设计,包括软硬件实现、通信协议等;(3)语音终端设计中几个关键技术的分析和研究。 本文设计的语音终端话音质量高,扩展功能强大,成本相对低廉,除适合在军用通信领域外,在商用领域也具有良好的市场前景。
上传时间: 2013-05-17
上传用户:TF2015
随着经济的发展,城市交通的压力越来越大,很多城市都开始建设地铁项目,发展地下轨道交通事业。在地铁列车上,驾驶员需要方便、快捷地控制各种语音功能,保障列车可靠、安全的运行,从而为乘客提供优质的服务。驾驶员语音控制器就是为了满足这一需求而提出来的。 在描述列车乘客信息系统的发展、介绍了公共广播系统的功能的之后,本文分析了驾驶员语音控制器的设计需求,设计了一种具有人机交互功能的驾驶员语音控制器。它带有LCD显示屏和输入键盘;能够在内部存储路线、站点和紧急信息等用户数据。通过窗口菜单以图形化的方式向驾驶员显示列车运行信息。通过通信端口,按照双方约定的通讯格式,将运行模式,路线站点,紧急信息等内容发送给列车显示与广播控制单元,完成语音及显示控制。根据需求分析,提出了一种基于ARM的控制器设计平台。设计了该控制器的硬件和软件的整体方案,采用模块化设计的思想给出了系统各主要模块的具体设计与实现方法,并给出了相关电路的实现原理图。最后介绍了本控制器的测试方法与过程,并给出了具体应用。该驾驶员语音控制器实现了人工广播、司机对讲、紧急对讲和系统设置等功能。具有操作方便、便于维护、可配置、成本低等优点,满足了驾驶员以及列车语音与显示控制的实际需求。关键词:ARM;RS485;乘客信息系统;图形用户界面;嵌入式系统
上传时间: 2013-07-30
上传用户:电子世界
模拟语音存储技术将传统的数码语音电路带到了高保真、高音质、低噪声的新境界。我国台湾公司新近推出了APR9600 语音芯片, 该芯片具有更方便的手动控制方式、更灵活的音质时间需求和更便宜的价格。本文较详
上传时间: 2013-04-24
上传用户:kr770906