基于层级和全局特征结合的蛋白质序列EC编号预测
EC number prediction of protein sequences based on combination of hierarchical and global features
酶功能的识别对理解生命活动的机制、推进生命科学的发展有重要作用.然而现有的酶EC编号预测方法,并未充分利用蛋白质序列信息,在识别精度上仍有所不足.针对上述问题,本研究提出一种基于层级特征和全局特征的 EC 编号预测网络(EC number prediction network using hierarchical features and global features,ECPN-HFGF).该方法首先通过残差网络提取蛋白质序列通用特征,并通过层级特征提取模块和全局特征提取模块进一步提取蛋白质序列的层级特征和全局特征,之后结合两种特征信息的预测结果,采用多任务学习框架,实现酶EC编号的精确预测.计算实验结果表明,ECPN-HFGF方法在蛋白质序列EC编号预测任务上性能最佳,宏观F1值和微观F1值分别达到95.5%和99.0%.ECPN-HFGF方法能有效结合蛋白质序列的层级特征和全局特征,快速准确预测蛋白质序列EC编号,比当前常用方法预测精确度更高,能够为酶学研究和酶工程应用的发展提供一种高效的思路和方法.
更多- 浏览:0
- 被引:0
- 下载:0
相似文献
- 中文期刊
- 外文期刊
- 学位论文
- 会议论文