基于散列辞典的蛋白质二级结构预测方法OACSTPCD
A Protein Secondary Structure Prediction Method Based on Hash-Dictionary
提出一种易于修改的蛋白质二级结构预测算法.以蛋白质数据银行中PDB文本数据作为数据源,提取所有蛋白质氨基酸序列并以此建立样本数据库,然后针对α-螺旋、β-折叠分别利用基于散列辞典的不同改进方法编程实现蛋白质二级结构序列片段预测,在预测过程中,随机抽取68 421个蛋白质中部分样本作为测试集,对未知序列根据建立的散列辞典中的片段使用正向最大匹配分词法进行切分对比.从实验结果来看,对未知序列片段预测的准确度达到了83.9%,而且能够较好地体现片段之间的连接顺序.
This paper proposes a kind of easy to modify protein secondary structure prediction algorithm. Using PDB files from Protein Data Bank as a data source, extract all the protein amino acid sequences and build up a database, then for a-helix, [3-sheet, use different improved methods based on hash dictionary to implements the fragments prediction of protein' s secondary structure. During the forecasting process, taking 68 421 samples as part of the protein in th…查看全部>>
南雨宏;陈绮
海南大学信息科学技术学院,海南海口570228海南大学信息科学技术学院,海南海口570228
信息技术与安全科学
蛋白质二级结构序列片段散列辞典α-螺旋β-折叠
protein secondary structuresequence fragmentshash dictionaries a-helix B-sheet
《计算机技术与发展》 2011 (10)
168-170,175,4
海南省自然科学基金资助项目(609003)
评论