数据通信2019,Issue(3) :9-15.

基于稀疏DBN和双向LSTM的视觉语音识别算法

王一鸣 陈恳
数据通信2019,Issue(3) :9-15.

基于稀疏DBN和双向LSTM的视觉语音识别算法

王一鸣 1陈恳1
扫码查看

作者信息

  • 1. 宁波大学信息科学与工程学院 浙江宁波315211
  • 折叠

摘要

唇部视觉信息作为语音识别的辅助信息一直受到广泛关注,为更好的提取唇部视觉信息,提出一种基于稀疏深度信念网络(Deep Belief Network,DBN)和双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)的视觉语音识别算法.该算法通过在DBN的目标函数后引入混合的l1/2范数和l1范数来实现DBN的稀疏表示,以此稀疏DBN对唇部视觉信息进行稀疏瓶颈特征的提取,再将提取的瓶颈特征送入BiLSTM进行特征的学习分类.实验表明,该算法能有效的识别唇部视觉信息.

关键词

稀疏深度信念网络/双向长短期记忆网络/视觉语音识别/稀疏表示

引用本文复制引用

基金项目

国家自然科学基金资助项目(No.60972063)

宁波市自然科学基金资助项目(No.2014A610065)

宁波大学科研基金(理)/学科资助项目(No.XKXL1308)

出版年

2019
数据通信
数据通信科学技术研究所

数据通信

影响因子:0.361
ISSN:1002-5057
被引量4
参考文献量21
段落导航相关论文