语音识别

语音识别是一门交叉学科。近二十年来，语音识别技术取得显著进步，开始从实验室走向市场。人们预计，未来10年内，语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。语音识别技术所涉及的领域包括：信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

基于SPCE061A的智能语音处理系统设计

本论文基于凌阳16 位单片机SPCE061A 和外扩存储器SPR 模组，采用语音识别技术，设计完成了一款能够执行语音指令并进行简单语音对话的交互式智能语音处理系统。系统设计包括硬件和软件两个方面：硬件部分基于凌阳SPCE061A 精简开发板，以SPR 模组作为语音资源的外部存储器；软件方面主要包括语音资源库的建立和系统的程序设计。该系统能够实现唱歌、背诵唐诗、简单特定对话和才艺表演等交互功能，还可按要求实现内部资源的更新，具有较大的灵活性和软硬件可扩展性。

标签： SPCE 061A 061 智能语音

上传时间： 2013-10-17

上传用户：nunnzhy
神经网络（模式识别模块）软件开发包!!!可以识别任何事物

神经网络（模式识别模块）软件开发包!!!可以识别任何事物，适用于图像识别、语音识别、自动控制等诸多领域，具有简单、易学、开发周期短、识别率高等特点。

标签： 神经网络模式识别模块开发包

上传时间： 2015-02-22

上传用户：youth25
本书是清华大学自动化教材,主要讨论统计模式识别理论和方法,包括了贝叶斯决策理论、线性和非线性判别函数、近邻规则、经验风险最小化、特征提取和选择、聚类分析、人工神经网络、模糊模式识别、模拟退火和遗传算法

本书是清华大学自动化教材,主要讨论统计模式识别理论和方法,包括了贝叶斯决策理论、线性和非线性判别函数、近邻规则、经验风险最小化、特征提取和选择、聚类分析、人工神经网络、模糊模式识别、模拟退火和遗传算法，以及统计学习理论和支持向量机等内容，还介绍了模式识别在人脸识别、说话人语音识别及字符识别等中的应用实例。

标签： 清华大学教材判别函数

上传时间： 2014-01-04

上传用户：qw12
基于语音的图书资料查询汉语接口研究

基于语音的图书资料查询汉语接口研究，适合对语音识别感兴趣的人员查阅

标签： 语音图书查询接口

上传时间： 2014-01-17

上传用户：yan2267246
本文是设计一个基于凌阳61A单片机的语音报时系统

本文是设计一个基于凌阳61A单片机的语音报时系统，利用凌阳61A板这样一种本身就带有语音识别和播放功能的单片机来进行时间的播报。把凌阳61A板单片机的语音播报功能加入到设计中，通过对它的运用来了解一个带语音的系统应如何设计。在语音报时系统的设计中，要处理好以下几个关键：DA转换，语音识别，人机接口，程序设计。DA和语音识别技术关系到时间的正确播报。人机接口是播报时间和调整时间的关键。因此，利用凌阳61A单片机在语音识别和处理方面的优点，结合实践，设计出有特色的语音报时系统。

标签： 61A 凌阳单片机语音

上传时间： 2017-08-19

上传用户：ippler8
讯飞语音Linux SDK包

讯飞语音Linux SDK包，用于Linux环境下的语音识别和语音合成。为开发者提供了语音云平台的网络接口

标签： 语音识别 语音合成 Linux 讯飞语音多媒体语音

上传时间： 2015-07-21

上传用户：fsx343725265
LD3320芯片语音模块资料包括LD3320芯片设计论文+STM32单片机软件驱动代码: LD332

LD3320芯片语音模块资料包括LD3320芯片设计论文+STM32单片机软件驱动代码:LD3320并行串行读写辅助说明.pdfLD3320开发手册.pdfLD3320数据手册.pdf其他共享配套参考程序模块介绍、应用提高语音识别技术论文资料MSP430 源程序.zip凌阳单片机部分程序.c基于STM32 的 LD3320基本驱动程序.zip官方开发板配套程序官方开发板配套程序.zip语音识别 AVR参考.zip语音识别模块 STM32＋SD卡＋LD3320工程.zip

标签： ld3320 语音模块

上传时间： 2021-11-09

上传用户：
XFS5152CE语音合成芯片用户开发指南

XFS5152CE是一款高集成度的语音合成芯片，可实现中文、英文语音合成；并集成了语音编码、解码功能，可支持用户进行录音和播放：除此之外，还创新性地集成了轻量级的语音识别功能，支持30个命令词的识别，并且支持用户的命令词定制需求。支持任意中文文本、英文文本的合成，并且支持中英文混读芯片支持任意中文、英文文本的合成，可以采用GB2312、GBK、BIG5和UNICODE四种编码方式。每次合成的文本量最多可达4K字节。芯片对文本进行分析，对常见的数字、号码、时间、日期、度量衡符号等格式的文本，芯片能够根据内置的文本匹配规则进行正确的识别和处理；对一般多音字也可以依据其语境正确判断读法；另外针对同时有中文和英文的文本，可实现中英文混读。支持语音编解码功能，用户可以使用芯片直接进行录音和播放芯片内部集成了语音编码单元和解码单元，可以进行语音的编码和解码，实现录音和播放功能。芯片的语音编解码具备高压缩率、低失真率、低延时的特点，并且可以支持多种语音编码解码速率。这些特性使它非常适合于数字语音通信、语音存储以及其它需要对语音进行数字处理的场合。如：车载微信、指挥中心等。支持语音识别功能可支持30个命令词的识别。芯片出默认设置的是30个车载、预警等行业常用识别命令词。客户如需要更改成其他的识别命令词，可进行命令词定制。

标签： xfs5152ce 语音合成

上传时间： 2022-06-22

上传用户：
语音信号数字处理

语音信号处理书籍，第一章绪论，第二章语音信号的表示，第三章听觉系统与语音识别，第四章同态处理与线性预测第五章矢量量化，第六章隐马尔可夫，第七章语音信号的波形编码……

标签： 语音信号数字处理

上传时间： 2022-07-24

上传用户：
智能语音触发器资料

智能语音触发器资料，“Hey Siri”功能允许用户启动Siri。一个很小的语音识别器一直在运行并监听这两个单词。当它检测到“Hey Siri”时，Siri将余下的语音作为命令或查询进行解析。“Hey Siri”探测器使用深度神经网络（DNN）将每个时刻的声音的声学模式转换为语音声音的概率分布。然后，它计算你所说的短语是“Hey Siri”的可能性分数。如果得分足够高，Siri会被唤醒。整个系统有几个部分。Siri的大部分实现都是“在云端”，包括主要的自动语音识别，自然语言解释和各种信息服务。还有一些服务器可以提供检测器使用的声学模型的更新。我们主要关注探测器：一个专门的语音识别器，它只关注“Hey Siri”

标签： 智能语音触发器

上传时间： 2022-07-26

上传用户：