蒙古语语音识别相关问题研究

设为首页

收藏本站

网站地图 | English | 公务邮箱

远程访问

NSTL服务站

蒙古语语音识别相关问题研究

详细信息本馆镜像全文| 推荐本文 | | 获取CNKI官网全文

英文题名：Research on Mongolian Speech Recognition
作者：牧仁高娃
论文级别：博士
学科专业名称：中国少数民族语言文学
中文关键词：蒙古语 ; 自动注音器 ; 声学模型 ; 语言模型 ; 语音识别系统
英文关键词：Mongolian ; Automatic Phonetic Notation ; Acoustic
英文关键词：Model ; Speech Recognition System
学位年度：2013
导师：白音门德 ; 朱维彬
学科代码：050107
学位授予单位：内蒙古大学
论文提交日期：2013-06-04

摘要

本文将在前人研究的基础上,用实验语音学的理论和方法,以及计算语言学的方法,分析在蒙古语标准音语音识别研究中所遇到的相关问题以及朗读文本语料库设计、蒙古语标准音语音库建立、注音词典的建立、自动注音器的建立、语音库的注音、建立蒙古语语音识别系统等的相关问题。
     本论文的研究成果主要有：
     一、建立了蒙古语语音识别的语音数据库和相应的标注文本库。该库包含3299条句子,共30多个小时的语音以及相应的标注读音文本。
     二、建立了蒙古语注音词典。该词典包含2万5千多个词条,是由蒙古语书面语转写为相应蒙古语标准音的自动注音器的核心之一,并且是蒙古语语音识别系统的核心资源基础。
     三、研制了蒙古语自动注音器。其功能为完成由蒙古语书面语到音标的实时动态转换。该研究也填补了无蒙古语自动注音的空白。
     四、建立了基础的蒙古语标准音语音识别系统。
     五、从蒙古语自身的语音学特点出发分析和研究了影响识别率的原因。针对蒙古语语音识别错误造成的原因,提出了相应的解决方法和建议。
     六、提出了蒙古语大词汇量连续语音识别系统的难点问题。
This article analyses the problems related to the Mongolian speech recognition using the theory and methods of experimental phonetics and computational linguistics, such as design of building the corpus for Mongolian speech recognition, building the lexicon for Mongolian speech recognition, developing the automatic phonetic notation program, building the acoustic model and so on.
     The mainly achievement of this article are:
     1. Building the corpus for Mongolian speech recognition including3299sentence (approximate30hours) and the transcripts for it.
     2. Building the lexicon for Mongolian speech recognition including more than25k items, which is the essential part not only of automatic phonetic notation but also Mongolian speech recognition.
     3. Developing the automatic phonetic notation program, which can automatic transcript the written Mongolian to the phonetic symbol online. There is no one have done this before.
     4. Building the basic Mongolian speech recognition system.
     5. Analysing the factors that affect the recognition rate from the Mongolian phonetics features. Proposing the solution to improve the recognition rate.
     6. Prompting the difficulties of building Mongolian large vocabulary speech recognition system.

引文

[1]艾霞.面向语音识别的蒙古语语言模型的研究,内蒙古大学计算机学院硕士毕业论文,2007年.
    [2]敖敏.基于韵律的蒙古语语音合成研究,内蒙古大学蒙古学学院博士毕业论文,2012年.
    [3]包世恩.蒙古语非特定人大词汇量连续语音识别系统的研究与实现,内蒙古大学计算机学院硕士毕业论文,2005年.
    [4]毕力格图.基于HMM建模的蒙古语语音识别系统的研究与实现,内蒙古大学计算机学院硕士论文,2006年.
    [5]朝木日乐格.基于支持向量基的蒙古语语音端点检测方法研究,内蒙古大学计算机学院硕士毕业论文,2011年.
    [6]陈肖霞,李爱军,孙国华.面向言语工程的语音研究,第六届全国人机语音通讯学术会议论文集,中国深圳,2001年.
    [7]方棣棠,李树青.现代汉语语音学与言语工程,第六届全国现代语音学学术会议论文集(下),2003年.(豆丁网)
    [8]飞龙.蒙古语语音识别系统的研究与优化,内蒙古大学计算机学院硕士论文,2009年.
    [9]冯丽娟,吾守尔斯拉木.维吾尔语连续语音识别技术研究,现代计算机.
    [10]高升,徐波,黄泰翼.基于决策树的汉语三音子模型,声学学报,2000年11月,25(6)
    [11]哈斯其劳.面向语音识别的蒙古语语音模型的研究,内蒙古大学计算机学院硕士毕业论文,2008年.
    [12]韩纪庆,张磊,郑铁然.语音信号处理,清华大学出版社,2004年.
    [13]华沙宝,对蒙古文语料库的此类标注系统—AYIMAG,内蒙古大学学报(人文·哲学版),1999(05)
    [14]候宏旭.基于语料库的汉蒙机器翻译关键技术研究,中国科学院技术计算研究生博士学位论文,2008.
    [15]李净,徐明星.汉语连续语音识别中声学模型基元比较：音节、音素、声韵母,第六届全国人机语音通讯学术会议,深圳,2001年.
    [16]林焘,王理嘉.语音学教程,北京大学出版社,1992年.
    [17]吕国云.基于三音子动态贝叶斯网络模型的大词汇量连续语音识别,数据采集与处理,2009年01期.
    [18]孟和吉雅.蒙古语标准音水平测试系统研究,内蒙古大学蒙古学学院博士毕业论文,2010年.
    [19]内蒙古大学蒙古学学院蒙古语文研究所,现代蒙古语,1964年.
    [20]那顺乌日图.蒙古文词干、词尾的自动切分系统,内蒙古大学学报,1997年第2期.
    [21]那顺乌日图.蒙古语语法信息词典框架设计,内蒙古大学博士学位论文,2000年5月
    [22]那顺乌日图.蒙文信息处理理论与方法的若干问题(斯拉夫蒙古文),乌兰巴托,2004
    [23]那顺乌日图,刘群,巴达玛敖德斯尔.关于“汉蒙机器翻译系统”,
    [24]那顺乌日图,雪艳,叶嘉明.现代蒙古语语料库加工技术的新进展新一代蒙古语词语自动切分与标注系统,第十届全国少数民族语言文字信息处理学术研讨会,2005.7,西宁.
    [25]那斯尔江·吐尔逊,吾守尔·斯拉木,麦麦提艾力.维吾尔语大词汇量连续语音识别研究语音语料库的建立.
    [26]倪崇嘉,刘文举,徐波.汉语大词汇量连续语音识别系统研究进展,中文信息学报,2009年1月,第23卷第1期.
    [27]清格尔泰.蒙古语语法,内蒙古人民出版社,1992年.
    [28]申广忠.蒙古语语音识别系统语言模型的设计,微计算机信息(管控一体化),2007年第卷期20.23 4-3
    [29]淑琴.“蒙古语语法信息词典附加成分分库”的设计与实现,内蒙古大学硕士学位论文,2005年6月.
    [30]斯·劳格劳,关于蒙古文纠错转写系统[J].内蒙古大学学报(哲学社会科学蒙文版),2009(01)
    [31]斯·劳格劳,华沙宝,萨如拉.基于NFA的蒙古语词法分析算法研究,少数民族青年自然语言信息处理技术研究语进展—第三届全国少数民族青年自然语言信息处理、第二届全国语言知识库建设联合学术研讨会论文集,2010年
    [32]王斯日古楞.基于混合策略的汉蒙机器翻译及相关技术研究,内蒙古大学蒙古学学院博士毕业论文,2009年.
    [33]王天庆,李爱军.连续汉语语音识别语料库的设计,第六届全国现代语音学学术会议论文集(下),2003年.
    [34]王晓龙,关毅.计算机自然语言处理,清华大学出版社,2005年4月出版.
    [35]乌仁曹都.汉蒙电子词典开发平台的设计与实现,内蒙古大学蒙古学学院硕士生毕业论文,2009年.
    [36]吴宗济,林茂灿.实验语音学概要高等教育出版社,1989年.
    [37]肖云鹏.基于HTK的汉语声学模型训练与优化,北京交通大学本科生毕业论文,2010年.
    [38]雪艳,那顺乌日图.蒙古语语料库综述,2004年.
    [39]杨行峻,迟惠生等.语音信号数字处理,北京：电子工业出版社,1995年.
    [40]叶嘉明.基于规则的蒙古语词法分析研究与实现,北京大学硕士学位论文,2005年6月.
    [41]伊·达瓦,旬坂芳典,卢绪刚.中村哲,蒙古语连续语音识别在不同结构语言模型下精度的讨论,NCMMSC'2009,(第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会论文摘要集).
    [42]伊·达瓦,匂坂芳典,中村哲.语料资源缺乏的连续语音识别方法的研究,自动化学报,2010年4月,第36卷,第4期.
    [43]伊·达瓦,大川茂树,白井克彦.蒙古语多方言语音识别及共享识别模型探索,中央民族大学学报(人文社会科学版),2001年第4期第28卷.
    [44]伊·达瓦,黄浩,那斯尔江,吾守尔.语音处理技术在语言及任务的扩展应用研究,少数民族青年自然语言信息处理技术研究语进展—第三届全国少数民族青年自然语言信息处理、第二届全国语言知识库建设联合学术研讨会论文集,2010年.
    [45]语音识别技术：http://www.iflytek.com/Html/gyxf/hxjs/sb/.
    [46]张家騄.汉语人机语音通信基础上海科学技术出版社,2010年.
    [47]张雄伟,陈亮,杨箕斌.现代语音处理技术及应用,机械工业出版社,2009年.
    [48]张雪英.数字语音处理及仿真电子工业出版社,2011年.
    [49]赵力.语音信号处理(第版),机械工业出版社,2011年
    [50]朱维彬.数字语音处理课件,2012年.
    [92]Daniel Jurafsky, James H. Martin. Speech ang Language Processing:An Introduction to Natrual Language Processing, Computational Linguistics, and Speech Recognition, ISBN:0130950696,2000.
    [93]Reichl.W and Chou. W.Robust decision tree state tying for continous speech recognition. IEEE Transations On Speech and Audio Procesiing,2000,8(5).
    [94]S. J. Young, J. J. Odell, P. C. Woodland. Tree-Based state tying for high accuracy acoustic modeling. Speech and Audio Processing,2000.
    [95]Woodland P C, Odell J J, Valtchev V, et al. Large vocabulary continuous speech recognition using HTK[C]//Acousties, Speech, and Signal Processing,1994. ICASSP-94.,1994 IEEE International Conference on. IEEE,1994,2:11/125-Ⅱ/128 vol.2.
    [96]Young S.. Large Vocabulary Continuous Speech Recognition:a Review. In:Proc. Of the IEEE Workshop on Automatic Speech Recognition and Understanding, Utah:Snowbird, December 1995.

地址：北京市海淀区学院路29号邮编：100083

电话：办公室：(+86 10)66554848；文献借阅、咨询服务、科技查新：66554700