语音识别技术就是能使计算机“听懂”人类的语言,然后根据其含义来执行相应的命令,从而实现为人类服务。 随着语音识别的深入研究,对它的技术应用主要有两个方面: 一个方向是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与电话网或者互联网相结合的语音信息查询服务系统,这些系统都是在计算机平台上实现的; 另外一个重要的发展方向是小型化、便携式语音产品的应用,这些应用系统大都使用专门的硬件系统实现。 随着后PC年代的到来,后一种发展将成为语音识别技术和嵌入式系统交叉研究的一个非常热门的话题,将进一步推动语音识别技术往智能化方向发展。 论文主要研究语音识别系统及其在ARM嵌入式平台上的实现。 根据嵌入式系统平台的特性和系统的实际需求,对目标平台的硬件和软件系统进行适当的剪裁定制,并且对语音识别中的算法进行改进和优化,同时为了加强系统的交互性,增加了控制界面,为实际应用提供很好的人机交互操作。 首先论文对嵌入式系统及嵌入式操作系统进行研究,通过实际比较后选用嵌入式Linux作为系统的操作系统; 然后对语音识别技术进行研究,并根据实际要求,采用Mel倒谱参数作为系统语音参数提取算法,DTW作为系统识别的模式匹配方法,并根据ARM嵌入式平台的要求,分别对上述两个算法进行优化设计,同时利用QT跨平台语言对应用控制程序进行代码实现,并移植到目标板上,构建出一个完整的嵌入式语音识别系统。 最后,对整个系统进行整体测试,通过实验结果表明,系统达到了预期设计的便携、智能及很好的交互性的目的。
上传时间: 2013-04-24
上传用户:1054154823
通用的2.1多媒体音箱电原理图。有很多品牌的计算机多媒体音箱使用本图
上传时间: 2013-07-04
上传用户:com1com2
语音通信是人类通信的重要组成部分,伴随着数字通信技术和计算机技术的发展,特别是Internet的出现,基于因特网的数字语音通信技术得了到迅速的发展。由于设备、环境、人为操作等因素的影响,网络上传输的语音信号可能出现忽大忽小的情况,为了得到较好的语音信号输出效果,需要在接收端对语音信号进行处理。针对以上情况,本文研究并实现了基于ARM的网络语音AGC系统。 本文结合嵌入式系统和AGC技术的发展,设计实现了一个基于ARM的网络语音AGC系统。本文首先对AGC算法进行了深入研究,在对LMS算法进行研究的基础上提出了一种基于LMS的数字语音AGC算法,通过Matlab软件对算法进行了仿真;设计了一个由AT91RM9200微处理器、网络控制器、音频芯片构成的嵌入式AGC处理终端硬件平台,构建了嵌入式Linux操作系统,并在此基础上设计实现了网络语音AGC系统的下位机终端。该终端主要实现了用基于LMS的数字语音AGC算法实时地处理从网络上传过来的忽大忽小的数字语音信号,取得良好的语音信号输出,并且稳定性可靠;设计实现了上位PC机程序,上位机实现了通过网络将数字语音信号实时地传送到嵌入式终端的功能。 本设计采用高性能微处理器,配合嵌入式Linux强大支持功能的实现方案,具有高性能、低成本、小型化、实时性强等诸多优点。相比传统的实现架构,该设计具有更好的灵活性和操作性,性价比更高,功能更强大,同时可扩展性和可移植性也更好,具有一定的技术先进性和广泛的应用前景。
上传时间: 2013-06-11
上传用户:几何公差
多媒体正在使我们的生活变得越来越丰富多彩。报纸,相片,CD机,电视,电影已经被PC机很好地整合到了一起,而互联网又使得多媒体资源的交流成为可能。跨越网络时代、信息时代、多媒体时代,后PC时代的到来,呼唤新一代的多媒体系统,它体积更小,功能更全,界面更友好。本系统就是面向这一需求而设计的。 嵌入式多媒体系统除了具有播放音乐,视频,浏览图片,电子书的基本功能外,一些方案还集成了视频录制、数码相机、数码摄像机、FM收音机、卫星定位导航系统、掌上游戏机和移动电视等等各种附加功能以满足不同的市场需求。本课题开发一套具有音频、视频、图片和电子书等功能的嵌入式多媒体系统解决方案,硬件部分以ARM处理器S3C241O为核心,软件部分以Linux操作系统为核心进行开发,系统具有体积小,成本低等特点。 本论文按照硬件、固件、软件三个层面分析了基于ARM Linux的嵌入式多媒体系统的设计和实现。硬件部分分处理器和外围电路两部分进行介绍。固件部分包括引导加载程序vivi的移植,Linux 2.6内核的移植,配置Cramfs根文件系统,Linux设备驱动程序开发。软件部分对Linux应用开发作出了讨论,包括系统的功能模块和软件构架,重点是基于MiniGUI的图形界面设计。在论文的最后,分析了系统的优缺点,以及单片解决方案和多处理器方案的比较,并展望了嵌入式多媒体系统的发展方向。
上传时间: 2013-06-03
上传用户:xfbs821
线性预测技术作为一种基于全极点模型假定和均方预测误差最小准则下的波形逼近技术。本文简要介绍了LPC 技术的基本原理,并利用MATLAB 这一有力工具对语音信号进行了LPC 分析,并对阶数的选取
上传时间: 2013-05-26
上传用户:博雅abcd
语音识别是通过识别和理解过程把人类的语音信号转变为文本或命令的技术。近年来语音识别技术由于其重要性和研究难度成为研究的热点。随着嵌入式的发展,嵌入式语音识别技术成为语音识别领域发展的新的重要方向。 在此背景下,本课题进行基于ARM的嵌入式语音识别系统的研究。论文分别从理论分析、系统硬件平台的总体设计、系统软件的分析定制等方面,对语音识别在ARM上的应用做了研究。 1、在理论上,详细介绍了语音识别的发展历史与研究现状;具体阐述语音识别技术的基本原理和主要研究方法,并推导了语音识别技术中最常用到的两种算法DTW和HMM的数学模型,为进一步的语音识别研究打下基础。 2、在硬件平台方面,本文分析设计了语音识别系统的总体方案,主要包括以下三部分:语音识别系统的控制部分、语音的输入输出部分以及语音程序的存储部分;文中详细介绍了各部分的作用以及它们之间的连接方式,此外根据实际需要,选择确定了语音芯片等外围电路芯片的型号并扩展了外围电路。 3、在系统软件选择定制方面,不仅要求各部分自身功能完善,能够满足本课题的需求,而且要求各部分相互之间满足一定的兼容性,即定制的系统具有稳定性,可以有效的工作。考虑到以上的因素,本课题针对特定的语音识别系统的需求,对交叉编译环境、U-boot、内核、根文件系统等均进行了量身定制。最终选用Crosstool来制作专门编译Linux-2.6.22.6的交叉编译工具;选用比较稳定的支持tftp下载的u-boot-1.2.0作为引导程序;选用Linux-2.6.22.6作为嵌入式操作系统内核,并对其进行剪裁定制,特别是增加了UDA1341TS音频驱动和网卡驱动部分;选用了带有mdev功能的busybox-1.9.1来制作根文件系统。 在以上三方面的基础上,本课题对语音识别程序系统进行了实验研究。实验包括音频驱动、语音录制、语音训练、语音识别程序的编译以及语音识别等程序在ARM上的移植。 最后,本论文采用DTW模型,完成了语音模板的训练和语音识别的任务。经过实验测试,该系统有效完成了预期的语音识别任务。
上传时间: 2013-05-30
上传用户:wsx123
利用ARM处理器开发处理音频信号的设备很多,如移动电话、MD(MiniDisc),DVD播放器、MP3音频译码器等;同样,基于ARM处理器的网络设备也很多,如网络调制解调器、网络电脑、因特网设备等。但利用ARM处理器把语音处理和网络通信功能结合起来无疑是一种新的尝试,它的设计成功会给网络留言技术的开发提供一种新的思路。 本文通过一个ARM9芯片S3C2410作为处理器的嵌入式语音采集系统,详细阐述了嵌入式系统的设计与开发过程,其中包括: 交叉编译环境的搭建:交叉编译环境是嵌入式开发工具的集合,搭建该环境就是在系统中编译安装开发工具链。 操作系统内核的移植:这是嵌入式开发的主要单元之一,移植内核主要是对内核进行重新配置,使它符合特定系统的需要,然后重新编译生成可执行的内核镜像文件。 文件系统的移植:文件系统是操作系统对数据进行管理的有效和必要的助手。移植文件系统包括制作文件系统镜像、在Flash上为文件系统分配存储空间以及文件系统与嵌入式操作系统的有效配合。 驱动程序的设计:驱动是操作系统与硬件沟通的桥梁,驱动设计就是编写具体硬件的读写控制函数并向操作系统提供统一的接口。 本文更着重于介绍实际开发中使用的技术以及遇到的问题和解决方法。在第4章中结合语音芯片UDA1341TS阐述了语音数据的采集与处理;结合网卡控制芯片CS8900A阐述了网络通信和网卡的驱动,以及网络开发中遇到的问题和解决方法。
上传时间: 2013-07-11
上传用户:luopoguixiong
美国ISD公司的2500芯片,按录放时间60秒、75秒、90秒和120秒分成ISD2560、2575、2590和25120四个品种。ISD2500系列和1400系列语音电路一样,具有抗断电、音质好,使
上传时间: 2013-06-01
上传用户:hank
嵌入式系统应用于智能设备、工业控制领域实现各种信号的处理与控制,是近年来技术研究和产品开发的热点。同时,随着以太网技术的迅速发展,工业控制中过程监控层和现场设备层信号传输网络开始逐步采用以太网,基于网络的远程监控使整个企业网络呈现高度统一性、开放性和透明性。将嵌入式技术和基于网络的远程监控技术应用于电梯,可以有效地提高产品和服务的质量。 本文旨在研制和开发一套应用于电梯的智能多媒体显示与远程监控系统,硬件设计中,在以嵌入式微处理器S3C2410X、Flash、SDRAM构成的最小系统核心板外,扩展了串行口、网口、LCD接口等外围硬件资源,设计了RS-232转换成RS-422接口界面的硬件电路板,针对核心板RTC时钟问题,采用PCF8563芯片设计了时钟/日历小板。 软件平台方面,首先分析了系统启动引导程序Bootloader,参照嵌入式Linux内核源代码以及对S3C2410X的支持代码,根据本系统的硬件配置对Linux内核进行裁剪移植,修改了音频驱动和LCD驱动,在内核中添加了对Yaffs文件系统类型的支持。然后准备了根文件系统内容,在其中添加了交叉编译过的Qt/Embedded3.1的库,使用Cramfs、RAMdisk和Yaffs相结合的根文件系统格式。在此基础上,向嵌入式平台移植了Linux下开源的多媒体播放器Mplayer和嵌入式数据库SQLite。 设计编写Qt GUI界面和串口数据采集模块,构建了电梯间多媒体显示系统,显示界面划分为串口数据采集显示、动画播放、系统时间、文本信息、滚动字幕、商标图片六个显示区域。使用Boa在ARM平台上构建了嵌入式Web服务器,Web服务器通过HTTP协议与监控端浏览器软件进行信息交互,提供服务器应用程序模块的访问界面和现场设备的信息访问和控制界面,并借助SQLite数据库的支持,实现了基于网络的电梯远程监控系统的功能。监控端通过Web页面激活服务器的相应应用程序模块,传递信息服务请求和控制命令。将本系统应用与电梯设备,取得了用户的好评。
上传时间: 2013-04-24
上传用户:564708051@qq.com
设计了一个具有语音识别功能的遥控小车。采用16 位凌阳单片机SPCE061A 和红外发射芯片TX-2B 构成遥控电路。由SPCE061A 实现语音的采集、识别;红外发射/接收芯片TX-
上传时间: 2013-07-11
上传用户:guanliya