用户名: 密码: 验证码:
基于语料库的蒙古语简单句施事和当事语义角色特征研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
蒙古语语义角色标注是浅层语义分析的一种实现方式,也是从浅层语义分析到深层语义分析的必经之路。论文从蒙古语依存树库中选取5087个简单动词谓语句,抽取施事和当事的特征,归纳施事和当事的识别规则,进行了施事和当事的自动标注。自动标注的召回率为87.62%,准确率为93.0%。
     全文由导论、主要章节、结论等部分组成。
     导论部分,阐述了选题意义、研究概况、研究对象,研究目标、方法和语料来源。
     第一章,介绍了基于依存语法的蒙古语语义角色分类及其标记的确定和标注的具体步骤。
     第二章,基于标注依存关系语料,根据依存关系、词性分类、语义分类、词语搭配,对蒙古语施事和当事的特征进行了归纳研究。
     第三章,基于蒙古语依存关系,归纳了蒙古语施事和当事的识别规则。
     第四章,进行了蒙古语施事和当事的自动标注,分析了标注结果并提出了存在的问题以及解决方法。
     结论部分,总结全文并提出了今后要研究的问题。
Mongolian semantic role labeling is a realization way of shallow semantic parsing and entry from shallow to in-depth study.
     In this Papers, on the basis of5087simple verb predicate sentence we extracted the features of agent and experiencer which collected from the Mongolian dependency tree-bank, and describe the automatic recognition rules and develop the program.Therefore, the performance of the system is improved effectively, for the system gets its result with87.62%recall and93.0%precision.
     This paper consists of an introduction, the main parts and conclusion.
     The introduction part, main aspect, including the meaning, preview, objectives, goal, methodology and data sources is introduced.
     The first chapter, classification of semantic roles, tagging-set and process using dependency grammar is discussed.
     The second chapter, features of Mongolian agent and experiencer according to the their dependent relation, part of speech, semantic classification, and collocation based on labeled dependency data is summarized.
     The third chapter, annotation of Mongolian agent and experiencer based on the dependency grammar is established.
     The fourth chapter, we annotated the Mongolian agent and experiencer, and also discussed the annotation results and puts forward the existing problems and solutions.
     At the last section, brief summary together with the future directions are indicated.
引文
[1]车万翔,刘挺,李生:《浅层语义分析》,全国第八届计算语言学联合学术会议论文集,2005年(JSCL-2005),154-160页。
    [2]刘怀军,车万翔,刘挺:《中文语义角色标注的特征工程》,中文信息学报,2007年1期,79-84页。
    [13]其木格:《蒙汉语常用语义格对比研究》,中央民族大学硕士学位论文,2008年。
    [14]那顺乌日图:《蒙古语语法信息词典框架设计》,内蒙古大学博士学位论文,2000年。
    [16]德·萨日娜,那顺乌日图:《<蒙古语语义信息词典>的初步构建》,中国计算机语言学研究前沿进展(2007-2009)(山东烟台),2009年,339-344页。
    [22]华沙宝:《蒙古语短语标注策略》,中央民族大学学报,2003年5期,98-100页。
    [23]达胡白乙拉:《面向信息处理的现代蒙古语名词短语结构规则研究》,内蒙古大学硕士学位论文,2002年。
    [25]斯琴,张建梅:《面向信息处理的时位词短语结构规则研究》,《中国少数民族多文种信息处理研究与进展》(呼和浩特),2004年。
    [26]达胡白乙拉:《蒙古语基本动词短语自动识别研究》,内蒙古大学博士学位论文,2005年。
    [30]张建梅:《基于语料库的现代蒙古语简单陈述句句型分析研究》,内蒙古大学博士学位论文,2010年。
    [31]斯·劳格劳:《现代蒙古语依存句法分析研究》,内蒙古大学博士学位论文,2011年。
    [32]那顺乌日图:《关于面向信息处理的蒙古语语义研究》,内蒙古大学学报,2002年5期,43-48页。
    [1]张育,王红玲,周国栋:《基于两种句法分析的语义角色标注比较研究》,计算机应用与软件,2010年8期,13-16页。
    [3]斯·劳格劳:《现代蒙古语依存句法分析研究》,内蒙古大学博士学位论文,2011年,89页。
    [4]C.J.费尔墨著,胡明扬译:《“格”辨》,商务印书馆,2002年,27页。
    [5]温宾利:《当代句法学导论》,外语教学与研究出版社,2002年9月,51页。
    [6]C.J.费尔墨著,胡明扬译:《“格”辨》,商务印书馆,2002年,28页。
    [18]袁毓林:《汉语动词的配价研究》,江西教育出版社,1998年。
    [19]吴竸存,梁伯枢:《现代汉语句法结构分析》,语文出版社,1992年。
    [20]林杏光:《词汇语义和计算语言学》,语文出版社,1999年。
    [21]侯敏:《计算语言学与汉语自动分析》,北京广播大学出版社,1999年。
    [22]贾彦德:《汉语语义学》,北京大学出版社,1999年。
    [23]冯志伟,.《计算语言学基础》,商务印书馆,2001年。
    [24]靳光瑾:《现代汉语动词语义计算理论》,北京大学出版社,2001年。
    [25]黄昌宁,李涓子:《语料库语言学》,商务印书馆,2002年。
    [26]C.J.费尔墨著,胡明扬译:《二格二辨》,商务印书馆,2002年。
    [27]温宾利:《当代句法学导论》,外语教学与研究出版社,2002年。
    [28]姚天顺,朱靖波、张琍等:《自然语言理解》(第2版),清华大学出版社,2002年。
    [29]徐烈炯:《生成语法理论》,上海外语教育出版社,2007年。
    [30]彭玉海:《语义动态分析方法探索》,中国社会科学出版社,2009年。
    [31]袁毓林:《汉语配价语法研究》,商务印书馆,2010年。
    [32]周明强:《现代汉语歧义识别与消解的认知研究》,浙江大学出版社,2010年。
    [33]赤间世纪:《自然言语·意味论·论理》,共立出版株式会社,1998年
    [21]张善能:《日语语义分类与语义关系》,浙江丝绸工学院学报,1989年2期,63-68页。
    [22]黄昌宁,童翔:《汉语真实文本的语义自动标注》,语言文字应用,1993年4期,18-25页。
    [23]那顺乌日图:《蒙古语语法信息词典框架设计》,内蒙古大学博士学位论文,2000年。
    [24]王鑫,孙微微,穗志方:《基于浅层句法分析的语义角色标注》,中文信息学报,2001年1期,116-122页。
    [25]陈志平:《构造一部改进的日语述语语义词典的初步设想》,日语学习与研究,2002年2期,8-13页。
    [26]袁毓林:《论元角色的层级关系和语义特征》,世界汉语教学,2002年3期,10-22页。
    [27]达胡白乙拉:《面向信息处理的现代蒙古语名词短语结构规则研究》,内蒙古大学硕士学位论文,2002年。
    [28]那顺乌日图:《关于面向信息处理的蒙古语语义研究》,内蒙古大学学报,2002年5期,43-48页。
    [29]华沙宝:《蒙古语短语标注策略》,中央民族大学学报,2003年5期,98-100页。
    [30]华沙宝:《关于蒙古语语料库建设》,少数民族语言信息技术研究进展,中国少数民族语言信息技术与语
    言资源库建设学术讨论会论文集(北京),2004年4月,134-137页。
    [31]斯琴,张建梅:《面向信息处理的时位词短语结构规则研究》,那顺乌日图,陈玉忠主编,《中国少数民族
    多文种信息处理研究与进展》(呼和浩特),2004年。
    [32]达胡白乙拉:《蒙古语基本动词短语自动识别研究》,内蒙古大学博士学位论文,2005年。
    [33]达胡白乙拉,华沙宝:《对蒙古语语料库基本名词短语的定界与统计分析》,《中文信息学报》,2005年5
    期,54-60页。
    [34]高莲花:《试论蒙古语语义格》,中央民族大学硕士学位论文,2005年。
    [35]李毅:《基于标注语料库的句子语义成分研究》,烟台大学硕士毕业论文,2005年。
    [36]那顺乌日图,雪艳,叶嘉明:《现代蒙古语语料库加工技术的新进展—新一代蒙古语词语自动切分与标注
    系统》,第十届全国少数民族语言文字信息处理学术研讨会论文集,2005年,122-127页。
    [37]华沙宝;《对蒙古语语料库的短语标注》,中央民族大学学报,2006年5期,64-67页。
    [38]车万翔,刘廷,李生:《浅层语义分析》,中国中文信息学会成立织周年学术年会,2006年,161-171页。
    [39]周俏丽:《面向汉语单句的依存句法分析研究》,沈阳航空工业学院硕士学位论文,2006年。
    [40]张伯江:《施事喝受事的语义语用特征及其句式中的实现》,复旦大学博士学位论文,2007年。
    [41]刘怀军,车万翔,刘廷:《中文语义角色标注的特征工程》,中文信息学报,2007年2期,79-85页。
    [42]刘廷,车万翔,李生:《基于最大嫡分类器的语义角色标注》,软件学报,2007年3期,565-573页。
    [43]袁毓林:《语义角色的精细等级及其在信息处理中得应用》,中文信息学报,2007年4期,10-20页。
    [44]徐默凡:《建立语义特征体系的一种途径——以处所性语义特征为例》,中文自学指导,2007年4期,46-50页。
    [45]连乐新,胡仁龙,杨翠丽等:《基于中文宾州树库的浅层语义分析》,计算机应用研究,2008年3期,674-680页。
    [46]车万翔:《基于核方法的语义角色标注研究》,哈尔滨工业大学博士学位论文,288年。
    [47]其木格:《蒙汉语常用语义格对比研究》,中央民族大学硕士学位论文,2008年。
    [48]丁伟伟,常宝宝:《基于最大嫡原则的汉语语义角色分类》,中文信息学报,2008年6期,20-26页。
    [49]华沙宝:关于《现代蒙古语树库的构建》,语言学研究与应用,2008年11期,3-6页。
    [50]汪红林:《基于依存分析的语义角色标注研究》,苏州大学硕士学位论文,2009年。
    [51]胡禹轩:《基于依存句法分析的语义角色标注》,哈尔滨工业大学硕士学位论文,2009年。
    [52]文益民,赵海,李建,黄晗文:《基于字符级特征的日文依存句法自动分析算法》,中南大学学报,2009年4期,1035-1039页。
    [53]斯劳格劳:《构建“基于依存语法的现代蒙古语树库”的设想》,社科研究(香港),2009年9月。
    [54]丁伟伟,常宝宝:《基于语义组垮分析的汉语语义角色标注》,中文信息学报,2009年5期,53-61页。
    [55]德·萨日娜,那顺乌日图:《《蒙古语语义信息词典》的初步构建》,中国计算机语言学研究前沿进展
    (2007-2009)(山东烟台),2009年,339-344页。
    [56]邵艳秋,穗志方,吴云芳:《基于词汇语义特征的中文语义角色标注研究》,中文信息学报,2009年6期,3-10页。
    [57]王步康,王红玲,袁晓红,周国栋:《基于依存句法分析的语义角色标注》,中文信息学报,2010年1期,25-29页。
    [58]张建梅:《基于语料库的现代蒙古语简单陈述句句型分析研究》,内蒙古大学博士学位论文,2010年。
    [59]袁晓红:《基于依存关系的中文语义角色标注研究》,苏州大学硕士学位论文,2010年。
    [60]安强强,张蕾:《基于依存树库的中文语义角色标注》,计算机工程,2010年4期,161-163页。
    [61]冯文贺,姬东鸿:《命题库:分析与展望》,外语电化教学,2010年6期,25-38页。
    [62]张育,王红玲,周国栋:《基于两种句法分析的语义角色标注比较研究》,计算机应用与软件,2010年8期,13-16页。
    [63]斯·劳格劳:《现代蒙古语依存句法自动分析研究》,内蒙古大学博士学位论文,2011年。
    [64]杨敏,常宝宝:《基于北京大学中文网库的语义角色分类》,中文信息学报,2011年3期,3-8页。
    [65]包晓荣,华沙宝:《基于依存语法的蒙古语语义角色分类及其标记研究》,第六届青年计算语言学会议论文集(上海),2012年,51-55页。

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700