用户名: 密码: 验证码:
基于进化神经网络的真核生物基因启动子位点确定模型的建立
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
人类基因组计划的开展,产生了巨量的基因组信息。分析这些信息是人类基因组研究必不可少的重要工作。作为其中的一个工作,真核生物基因启动子区域的识别是一个难点。
    为了从基因中分割外显子序列,启动子这一提供生物学功能的富含信息的信号序列是必不可少的。本文在分析了真核生物基因启动子的相对保守序列的基础上,利用真核生物基因启动子的TATA盒、CAAT盒和GC盒的相对保守性和其统计学事实,结合进化神经网络建立了真核生物基因启动子的识别模型,并且设计了计算机仿真程序。主要的工作和结论如下:
    (1) 由于真核生物基因启动子区域的保守序列具有一定的假阳性,利用传统的基于物理化学原理的方法无法把序列间的关系和相关特征表现出来,神经网络这一具有自学习、自适应能力的系统可以很好的解决此弊病。但是神经网络存在训练速度慢,易陷入局域极小值和全局搜索能力弱等缺点。在研究了遗传算法后,发现它可以较好地改进以上的缺点。所以在此基础上,利用进化神经网络,采取BP算法和遗传算法建立了真核生物基因启动子识别模型。
    (2) 对设计好的识别模型进行了计算机仿真程序设计,利用从EPD(真核生物启动子数据库)下载的数据对建立好的识别模型进行了训练,然后用对于模型未知的数据对模型进行了预测,结果表明识别模型的建立是比较成功的。
    (3) 为非编码区其它组分的智能确定模型的建立提供了一个通用的模版。
With the development of HGP, lots of genome information are acquired. It is an important and necessary work to analyze the information for HGP study. As a part of which, the recognition of promoter field in eukaryote's gene is very hard.
    For getting exon from gene, it is necessary to having promoter, which provides signal series of biologic function. On the basis of analyzing relative conservative series of promoters in eukaryote's gene, the conservative property of TATA box、CAAT box and GC box in the promoters of eukaryote's gene and there statistical truth are used in this paper, combined with evolutionary NN to build recognition model of promoter in eukaryote's gene, emulate computer program was designed too. The main work and conclusions in this paper are as follow:
    (1) Because the conservative series in promoter field of eukaryote's gene display false positive, it can not be found the relations and correlative feature among series using old physical and chemical methods. Neural network system which can self study and self adapt can well solve the shortcoming, there still have the shortcoming of low training speed,apt to get into local minimal value and poor macrocosm searching ability for neural network .After studying genetic algorithms, it was found that GA can better mend the shortcoming. On the basis of evolutionary neural network, the recognition model of promoter in eukaryote's gene was built using BP algorithms and genetic algorithms.
    (2) The designed recognition model is used to program emulator, and trained the model with download data from EPD(eukaryote promoter database),then predict unknown data for model, the result indicate the building of recognition model is relatively successful.
    (3) Giving a common stencil-plate for intelligent ascertaining model of other component in non-coding region.
引文
[1] Jacob F,Monod Monod J. Genetic regulatory mechanisms in the synthesis of proteins. J.Mol.Biol. 1961,3:318-352
    [2] Lee R.C,The C.elegans heterochronic gene lin-14 encodes small RNAs with antisense complementarity to lin-14. Cell. 1993,75:843-854
    [3] Pretridge D.S. Signal Scan:a computer program that scans sequences for eukaryotic transcriptional elements. Comput. Applic. Biosci. 1991,7:203-206
    [4] Andreas D.Baxevanis,B.F.Francis Ouellette. 生物信息学-基因和蛋白质分析的实用指南北京. 清华大学出版社. 2000:220-222
    [5] Fickett J.W,Hatzigeorgiou,A.G. Eukaryotic promoter recognition. Genome Res. 1997,7:861-878
    [6] von Hippel P.H. Protein-DNA recognition: New perspectives and underlying themes. Science. 1994,263:769-770
    [7] Jun Xu,Runsheng CHen,Lunjiang Ling,Ruqun SHen,Jian Sun. Conincident indices of exons and introns. Comput. Biol. Med. 1993,23:333-343
    [8] 曹凯鸣,李碧羽,彭泽国. 核酸化学导论. 上海. 复旦大学出版社 1991:122-124
    [9] 云庆夏. 进化算法. 北京. 冶金工业出版社. 2000:22-196
    [10] 赵林明,胡浩云. 多层前向人工神经网络. 北京. 黄河水利出版社. 1999:10-15
    [11] 袁曾任. 人工神经元网络及其应用. 北京. 清华大学出版社. 1999:1-130
    [11] 靳藩,范俊波,谭永东. 神经网络与神经计算机原理应用. 成都. 西南交通大学出版社. 1991:279-284
    [12] 姜天戟,袁曾任. 基于BP和统计的混合法的前馈型神经网络及其在预估问题中的应用.软件学报. 1996,7(6):379-384
    [13] 赵林明,胡浩云,魏德华. 多层前向人工神经网络. 郑州. 黄河水利出版社. 1999:23-37
    [14] 袁曾任,姜莉楠. 基于人工神经元网络的控制系统模型简化的专家系统. 信息与控制. 1992,10(5):278-282
    [15] Nachbar R.B. Genetic programming. The mathematical Jouranl. 1995,5(3):44-55
    [16] 李岳峰. 基于遗传优化算法研究及应用探索. 震动工程学报. 1994,7(4):313-321
    [17] 吴端恭,林熙. 遗传算法及其研究的本质探索. 集美大学学报. 1999,4(4):7-11
    [18] 张益群. 遗传优化技术初阶. 昆明理工大学学报. 1999,24(3):41-45
    [19] 席裕庚,柴天佑. 遗传算法综述. 控制理论及应用. 1996,13(6):697-707
    [20] 潘正君,康立山,陈煜屏. 演化计算. 北京. 清华大学出版社. 1998:26-29
    [21] 孟庆春,贾培发. 关于Gennetic算法的研究及应用现状. 清华大学学报. 1995,35(5):44-48
    
    
    [22] 徐宗本,陈志平. 遗传算法基础理论研究的新近发展. 数学进展. 2000,29(2):97-113
    [23] 张文修,梁怡. 遗传算法的数学基础. 西安. 西安交通大学出版社. 2000:20-32
    [24] 陈国良,王煦法,庄镇泉,王东生. 遗传算法及其应用. 北京. 人民邮电出版社. 2000:28-35
    [25] 李孝安,康继昌. 进化神经网络研究进展. 控制与决策. 1998,13(6):617-623
    [26] 潘卫东. 利用遗传技术辅助设计人工神经网络. 模拟识别与人工智. 1994,17(1):72—77
    [27] 胡瑞敏,徐正全,姚天任. 人工神经网络的智能神经元模型. 电子学报. 1996,24(4):86-90
    [28] 方建安,邵世煌. 采用遗传算法学习的神经网络控制器. 控制与决策. 1993,8(3):208-212
    [29] Kenneth DeJong. Learning with Genetic Algorithms:An Overview. Machine Learning. 1988,3:121-138
    [30] Zhang B T,Muhlenbein H. Evolution optimal neural networks using genetic algorithms with occam's Razor. Complex System. 1993,7(3):199-220
    [31] Rumelhart D. E,Hinton G.E ,Williams.R.J. Learning internal representations by error propagation.Parallel Distributed Processing:Explorations in Microstructures of Cognition. 1986,1(1):318-362
    [32] 王洪燕,杨敬安. 并行进化BP神经网络. 合肥工业大学学报. 1999,22(3):21-25
    [33] 李彤红,罗四维. 一种训练神经网络的新型遗传算法. 北方交通大学学报. 1995,19(4):528-532
    [34] 罗四维. 遗传算法神经网络的学习方法. 北方交通大学学报. 1995,19(4):541-543
    [35] Howard L M.D,JD Angelo. TheGA-P:A genetic algorithm and genetic programming hybrid.IEEE Expert. 1995(6):11-15
    [36] Harrald P G,M Kamstra. Evolving artificial neural networks to combine financial forecasts. IEEE Trans on Evolutionary Computation. 1997,1(1):40-52
    [37] 陈惟昌,陈志华,陈志义. 遗传密码和DNA序列的高维空间数字编码. 生物物理学报. 2000,16(4):760-767
    [38] 王文清,周成,刘枫. 遗传密码表与易经. 北京大学学报. 1998,4(4):471-480
    [39] 陈惟昌,陈志华,陈志义. 遗传密码的简并及其高维空间的拓扑结构. 自然科学进展. 1999,9(2):175-178
    [40] Xiaofeng Qi,Francesco Palmieri. Theoretical analysis of evolutionary algorithms with an definite population size in continuous space. IEEE Trans On Neural Networks. 1994,5(1):102-119
    [41] 严蔚敏,吴伟民. 数据结构. 北京. 清华大学出版社. 1999:44-118

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700