本文完成了对唇动身份识别技术几个基本问题的理论研究,并对整个系统加以实现.作为本文研究的实验基础,我们建立了唇动方式身份识别数据库(HITLUDB),
该库目前包含30个说话人每人20个汉语词的音视频语料.数据库的扩充与完善工作仍在不断的进行之中.在嘴唇检测方面,
我们对自适应色度过滤模型进行改进,提高了算法的鲁棒性,完成了对嘴唇的精确定位.结合DCT变换与K-L变换的各自特点,
我们提出了特征提取算法,使用较少维数的特征完成了对嘴唇区域主要信息的刻画.由于唇动信息同时包含了生理特征与行为特征,
我们使用静念动念混合建模的方式,完成了对说话人唇动个性特点的精确描述.在HMM训练时,我们提出了特征的归一化处理方法,提高了HMM在实际应用中的性能.
最后,我们分别对身份辨认系统与身份确认系统的基本理论进行了叙述,并完成了系统的实践工作.
关 键 词:身份识别 唇动 特征提取 隐马尔可夫模型 K-L变换
标签:
HITLUDB
身份识别
实验
上传时间:
2014-01-14
上传用户:wsf950131