学位论文 > 优秀研究生学位论文题录展示

基于统计方法的多模态信号处理在语音-视觉信号上的应用

作 者: 韩玮
导 师: 苑波
学 校: 上海交通大学
专 业: 计算机应用技术
关键词: 多模态信号 高斯混合模型 时间序列推测 判别式训练 语音-视觉信号
分类号: TN911.7
类 型: 硕士论文
年 份: 2011年
下 载: 18次
引 用: 0次
阅 读: 论文下载
 

内容摘要


这篇论文主要研究多模态信号的推测问题:如果两个信号在自然现象中总是同时发生,那么在只能获得一个信号情况下,如何用推测得到另一个缺失的信号。本文基于高斯混合模型,使用统计方法进行推测。这个问题又主要分为使用模型的推测以及对模型的训练两部分。对于使用模型进行推测,文中讨论了直接应用条件概率、使用动态特征、以及使用滑动窗口三种方法,并且从性能和实时性两方面进行了分析对比。对于模型的训练,文中介绍了生成式训练和判别式训练两种截然不同的训练法则,以及相应的优化算法。由于判别式训练依赖于模型推测方法,文中又为动态特征推测和滑动窗口推测分别推导出了判别式训练法则。最后文中的方法被应用在语音-视觉信号的推测上,并且在一个公开的数据集上对不同方法进行了测试。在实验结果中判别式训练法则显著地提高了高斯混合模型在推测当中的性能。

全文目录


相似论文

  1. 面向智能交通的视频车辆检测、跟踪和识别算法研究,TP391.41
  2. 运动目标检测与跟踪方法研究,TP391.41
  3. 说话人识别中集外话者的拒识方法研究,TN912.34
  4. 基于小波变换的说话人语音特征研究,TN912.34
  5. 视频分割与融合技术研究,TP391.41
  6. 基于条件高斯混合模型的宽带ISF参数分裂矢量量化研究,TN912.3
  7. 基于锚空间的音频场景识别方法研究,TN912.34
  8. 自动语种识别系统设计与实现,TP391.4
  9. 说话人识别鲁棒性增强研究,TN912.34
  10. 基于图像的特征信息提取与目标识别,TP391.41
  11. 基于独立成分分析的非结构化道路的特征提取和分割,TP391.41
  12. 基于PCI视频监控系统的背景提取及更新算法研究及其实现,TP391.41
  13. 面向生物医学领域的双语对齐技术研究,TP391.12
  14. 复杂纹理背景的织物疵点检测与定位研究,TP391.41
  15. 宽带音频的非线性频带展宽技术,TN912.3
  16. 检测代替分类的脑机接口研究,TN911.7
  17. 会议室环境下基于音频视频信息融合的多说话人识别,TN912.34
  18. 语种识别中的若干问题研究,TN912.34
  19. 基于排序GMM的说话人确认的研究,TN912.34
  20. 图像中模糊边界目标的阈值分割方法研究,TP391.41

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 通信理论 > 信号处理
© 2012 www.xueweilunwen.com