用户名: 密码: 验证码:
连词“和”的自动识别规则研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
本文目的在于设计出连词“和”的计算机自动识别的算法,这是中文信息处理这个大工程中的一个细小的组成部分,但是这个小工作也是做好大工程的必要的环节。本文分五个部分对这个问题进行了研究。
     第一部分是本文的绪论,这部分提出本课题研究的意义以及我们选择这个题目的原因。
     第二部分是本文的第一章,这一章对连词及连词个案“和”的相关研究进行了回顾,同时也对自动识别的前人研究成果做了相应的综述。指出了前人研究成果中可以借鉴的地方和一些不足。
     第三部分是本文的第二章,这一章主要研究“和”的性质以及连词“和”的功能用法。基于自动识别的目的,我们对“和”的性质进行了研究,列举了语料中出现的“和”的所有情况,这个是下一步识别算法设计的基础。然后给出了“和”所连接的各种成分及其比例,并且列举了“和”类联合短语所能充当的句法成分。最后使用数理逻辑的语言对“和”的功能进行了表示。
     第四部分是本文的第三章,这部分是本文的核心之所在。前面所做的工作都是为了这一部分做准备的,在这一章里笔者给出了识别的算法,而这些算法可以直接应用某程序语言编写程序。
     第五部分是本文的第四章,是本文的总结。这一章指出了本文的特点以及研究过程中使用的方法,并且对相关表格进行了说明。
This thesis aims to propose an automatic acquisition arithmetic of conjunction "he" , which is one small unit of the Chinese information processing which is a great project ,however this "small unit" is the essential part of the "great project" . The full text consists of five parts.
     Part one is the exordium ,this part come up with the significance and the reason of this thesis.
     Part two is the chapter one of the text, in this section we have a review of the concerning research on the conjunction and "he" .Meanwhile we summarize the research on the automatic acquisition .
     Part three is the chapter two of the text ,in this section we do some research on the usage of conjunction "he " . In order to achieve theautomatic acquisition, we do some research on the character of "he ", list all the instances appear in the corpus which is the basis of the automatic acquisition .Then the text list all the components that can be connected by "he " and the ratio . And give all the syntactic structures "he " can be .Finally the text describes the functions of "he" in symbolic logic.
     Part four is the chapter three of the text. This is key part of the thesis which give the automatic acquisition arithmetic .That arithmetic can be applied in any programming language to program .
     Part five is the chapter four which sums up the text . This chapter gives the character of the paper and the method used in the thesis , meanwhile, makes some explanations of the forms in the thesis .
引文
北京大学中文系1955、1957级语言班1982《现代汉语虚词例释》,北京:商务印书馆
    陈昌来2000《现代汉语句子》,上海:华东师范大学出版社
    储泽祥等2002《汉语联合短语研究》北京:商务印书馆
    房玉清1992《实用汉语语法》北京:北京语言学院出版社
    范开泰,张亚军2000《现代汉语语法分析》,上海:华东师范大学出版社
    葛伯莲1994介词与连词的区别,《南通师专学报》第10卷第三期
    胡光斌1996“和”类连词的特殊功用,《黔南民族师专学报》(哲社版)第一期
    胡裕树1995《高等学校文科教材 现代汉语(重订本)》上海:上海教育出版社
    胡明扬1996《词类问题考察》北京:北京语言学院出版社
    侯学超1998《现代汉语虚词词典》北京:北京大学出版社
    黄伯荣 廖序东2002《现代汉语(增订二版)》下册北京:高等教育出版社
    景士俊1980《现代汉语虚词》呼和浩特:内蒙古人民出版社
    黎锦熙1982《中国文法要略》北京:商务印书馆
    李绍群2001连字等于连词吗—<马氏文通>连字质疑,《常德师范学院学报》第26卷第四期
    李英哲、卢卓群1997汉语连词发展过程中的若干特点,《湖北大学学报》(哲学社会科学版)第四期
    李明尧2002试析假设连词“所”字用法的嬗变,《大理学院学报》第一卷第6期
    刘月华2001年《实用现代汉语语法(增订版)》北京:商务印书馆
    陆俭明2004词语句法、语义的多功能性:对“构式语法”理论的解释,《外国语》(上海外国语大学学报)
    陆俭明1985《现代汉语于虚词散论》北京:北京大学出版社
    陆俭明2004词的具体意义对句子意思理解的影响,《汉语学习》
    陆俭明1998对外汉语教学中经常要思考的问题,《语言文字应用》
    吕叔湘2003年《语法研究入门》北京:商务印书馆
    吕叔湘1999《现代汉语八百词》(增订本)北京:商务印书馆
    马清华2003并列连词的语法化轨迹及其普遍性,《民族语文》第一期
    彭小川、赵敏2004连词“并”用法考察,《暨南大学学报》(人文科学与社会科学版)第一期
    齐沪扬2000《现代汉语短语》,上海:华东师范大学出版社
    王少莹、杨白云2000谈并列连词“和”的用法及其新发展,《福建教育学院学报》第一期
    芜菘2002浅谈连词“再”,《语文学刊》第三期
    吴云芳2005“和”“与”“并”“而”连接谓词性成分时的区别,《语文研究》第一期
    薛健2002试析连词“与”的分界功能,《汉语学习》第三期
    邢福义2001《汉语复句研究》北京:商务印书馆
    邢福义1996《中国现代语言学丛书汉语语法学》北京:东北师范大学出版社
    杨云1997虚词“和”词性的判定,《云南教育学院学报》第十三卷第四期
    郑军2004现代汉语连词研究概述,《龙岩师专学报》第22卷第一期
    郑军2002也说现代汉语连词范围,《淮北煤炭师范学院学报》(哲学社会科学版)第二期
    周刚2003连词产生和发展的历史要略,《安徽大学学报》(哲学社会科学版)第一期
    张斌1998《汉语语法学》上海:上海教育出版社
    张斌2001《现代汉语虚词词典》北京:商务印数馆
    张斌、张谊生2000《现代汉语虚词》,上海:华东师范大学出版社
    张谊生1996交互类短语与连介兼类词的分化,《中国语文》第五期
    张迺忠1996“和跟与同的词性辨别”,《滨州师专学报》第12卷第三期
    安娜,刘海涛,侯敏2004语料库中熟语的标记问题,《中文信息学报》
    陈小荷2002“把……HVP”的计算分析,《世界汉语教学》2002年第一期(总第59期)
    冯志伟2001确定切词单位的某些非语法因素,《中文信息学报》
    冯志伟1995《自然语言机器翻译新论》北京:语文出版社
    冯志伟1999《应用语言学综论》,广州:广东教育出版社
    龚沛曾等2001《Visual Basic程序设计教程(6.0版)》北京:高等教育出版社
    孔祥龙、卢鹏、陆汝占、刘绍明2004西方姓名译名的自动识别研究,《计算机仿真》第八期
    孔祥龙 卢鹏 陆汝占 刘绍明 2004西方姓名译名的自动识别研究,《计算机仿真》
    李丽双 黄德根 陈春荣 杨元生2005用支持向量机进行中文地名识别的研究,《小型微型计算机系统》
    刘开瑛 2001《中文文本自动分词和标注》北京:北京语言学院出版社
    刘颖2002《计算语言学》北京:清华大学出版社
    刘源等1994《信息处理用现代汉语分词规范及自动分词方法》北京:清华大学出版社
    莫绍揆 徐永森 沈百英1984《数理逻辑》北京:高等教育出版社
    任海波2000基于语料库的现代汉语短语自动切分规则研究,上海师范大学博士学位论文
    孙茅松、黄昌宁、方捷1997汉语搭配定量分析初探,《中国语文》第一期
    王霞2005汉语动宾搭配自动识别研究,《语言文字应用》第一期
    王永成1991《中文信息处理技术及其基础》上海:上海交通大学出版社
    谭红叶 郑家恒 刘开瑛2002中国地名自动识别系统的设计与实现,《计算机工程》
    宇缨 王晓龙 刘秉权2006一种基于SVM/RS的中文机构名称自动识别方法,《电子与信息学报》
    方芳2006基于语料库的量名短语识别初探,《乐山师范学院学报》
    王霞2005 汉语动宾搭配自动识别研究,《语言文字应用》
    刘秉伟 黄萱菁 郭以昆 吴立德2000基于统计方法的中文姓名识别,《中文信息学报》
    张锋 樊孝忠 许云2004基于统计的中文姓名识别方法研究,《计算机工程与其应用》
    黄德根 岳广玲 杨元生 2003基于统计的中文地名识别,《中文信息学报》
    吕雅娟 赵铁军 杨沐昀 于浩 李生2000基于分解与动态规则策略的汉语未登录词识别,《中文信息学报》
    冯敏萱 杨翠兰 陈小荷 2006带后缀“者”的派生词识别,《语言文字应用》
    吴云芳,陆俭明 2004面向中文信息处理的现代汉语并列结构研究,语言文字应用
    吴云芳2004 V+V形成的并列结构,《语言研究》
    王伟2004并列结构中名词性成分的语义量级类型,《周口师范学院学报》
    李洁2004拉祜语的并列结构复合词,《民族语文》
    张剑2004论用HNC理论进行中文信息处理与知识处理,《湘南学院学报》
    马清华2004层次关系中的破界,《语文研究》
    亢世勇,徐艳华2004基于语料库的新词语识别规则研究《烟台师范学院学报》(哲学社会科学版)
    史树敏2004机器翻译发展综述,《内蒙古科技与经济》
    郭曙纶2004动词的类义及其层级——动词类义系列研究之一,《井冈山师范学院学报》
    陆俭明2004有关词性标注的一点意见,《语言文字应用》
    陆俭明2002乔姆斯基句法理论与汉语研究,《外国语》(上海外国语大学学报)
    陆俭明2001关于句处理中所要考虑的语义问题,《语言研究》
    隋岩,张普2005基于“动态流通语料库”的“有效字符串”提取研究,《语言文字应用》
    余祖波 高庆狮 方淼2006中文姓名自动识别系统的设计与实现,《计算机工程与应用》
    杨泉 冯志伟2005面向中文信息处理的现代汉语“V+V”结构歧义问题研究,《语言文字应用》第一期
    殷军2004浅析“VN”结构动态层面——兼论民族学生学习“VN”结构存在的问题,《喀什师范学院学报》
    赵玲2000地名识别浅谈,《问题探讨》
    郑泽之 张普 杨建国 2004基于语料库的字母词自动提取研究,《中文信息学报》
    周正宇,李宗葛2001一种新的基于统计的词典扩展方法,《中文信息学报》
    张普,石定果2003论历时中包含有共时与共时中包含有历时,《语言教学与研究》
    张锦文2003关于汉语借词的分类问题,《辞书研究》
    Abney, Steven 1991 "Parsing by Chunks" in Principle-Based Parsing, Berwick, Adney andTenny (Eds), Kluwer
    Church, Kenneth 1998 A Stochastic Parts Program and Noun Phrase Parser for Unrestricted Text. In Proceedings, Third Conference on Applied Natural Language Processings
    Noam Chomsky 1957 Syntactic Structure
    James Allen 1986 Natual Language Understanding The Benjamin/Cummings publishing Company, Inc.
    董振东、董强 1999“知网”http://www.keenage.com
    www.baidu.com
    www.google.com

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700