首页

通知公告

当前位置: 首页 > 通知公告 > 正文

陈子欣博士论文答辩公告

作者:    来源:    发布时间:2026-05-13    点击量:

陈子欣博士论文答辩公告

答辩博士生:陈子欣

指导老师:徐焕良教授

论文题目:基于深度特征融合的抗菌肽挖掘与应用研究

答辩委员会:

主席:

皮德常 教授/博导 南京航天航空大学

委员:

林相泽 教授/博导 南京农业大学

钱国良 教授/博导 南京农业大学

陆明洲 教授/博导 南京农业大学

朱正礼 教授/博导 南京林业大学

秘书:

翟肇裕 南京农业大学

答辩时间:202652314:30

答辩地点:滨江校区12号楼A863

论文简介:

抗菌素耐药性已成为全球公共卫生和食品安全面临的严峻挑战。抗菌肽(Antimicrobial Peptides, AMPs)不仅具有广谱抗菌活性,还因其不易产生耐药性的独特抗菌机制,被视为抗生素的替代方案之一。传统的抗菌肽发现依赖于天然产物的分离纯化,耗时长、成本高且通量低,而基于序列比对的方法覆盖面窄且准确率低,均难以满足高通量筛选需求。近年来,人工智能(Artificial IntelligenceAI)为抗菌肽的高通量挖掘提供了新的技术路径,但现有研究仍面临数据分布偏差、模型泛化能力不足、靶向性预测能力有限、作用机制解释不足以及农业特定病原体样本稀缺等问题。

针对上述挑战,本研究以基于人工智能技术推动抗菌肽在农业场景下的挖掘及应用为目标,融合深度学习架构、多组学数据挖掘与分子动力学模拟技术,构建了从数据集构建、预测模型开发、全基因组挖掘到机制解析的一体化研究框架。

研究的主要内容和成果包括:

1构建了高质量的抗菌肽数据集与UniAMP系列靶向性抗菌肽预测框架。

整合了8个主流数据库,构建了面向铜绿假单胞菌、白色念珠菌、沙门氏菌、镰刀菌及广谱抗菌活性的5个专用数据集,并针对正负样本序列长度分布偏差和高相似性问题进行了修正。在特征表示方面,引入多源蛋白质语言模型(Protein Language Model, PLM)提取深层序列特征,并通过消融实验验证其互补性。在模型构建方面,UniAMP采用Transformer编码器实现高维PLM特征交互,并结合动态重采样与类别加权策略缓解数据偏差。面向真实场景的泛化需求,UniAMP2进一步引入基于Small-BERT的可训练适配器和基于双向交叉注意力机制的特征融合模块,将拼接式的浅层融合提升为注意力驱动的深度融合,实现了冻结的PLM全局特征与可训练的本地特征的动态交互。实验结果表明,UniAMP在综合性能上优于全部基线模型和同类预测工具,证明了其设计的有效性,为其他蛋白质功能预测的小样本场景提供了参考。

2基于UniAMP建立了面向特定病原体的靶向性抗菌肽挖掘流程,并从3个不同来源成功挖掘出15条新型抗菌肽。

本研究通过构建专用数据集与靶向性预测模型,将抗菌肽挖掘从广谱识别推进到特定病原体的定向挖掘,直接面向农业场景中"精准抗菌"的实际需求。基于UniAMP系列预测框架,针对三种不同基因组来源建立了差异化的挖掘流程:针对健康鸡粪便宏基因组,采用重组装策略获得109,917条候选序列,筛选合成16条多肽,其中7条具有抗沙门氏菌活性;针对稻瘟病菌基因组,采用全基因组ORF预测策略获得447,190条候选序列,筛选合成20条多肽,其中6条具有抗镰刀菌活性;针对番茄根际土壤宏基因组,采用"健康vs发病"T检验显著性分析获得63,012条候选序列,筛选合成6条多肽,其中2条具有抗镰刀菌活性。经Blast比对,上述15条抗菌肽均未被报道且与已知序列同源性较低。三个示例分别覆盖了基因组与宏基因组、细菌与真菌、家禽与作物等不同应用场景,验证了该靶向性挖掘流程的有效性,且可作为范式推广至其它场景。

3开展了新型抗菌肽作用机制解析与安全性预测。

针对挖掘得到的新型抗菌肽MAP-26,使用了AlphaFold3预测其三维结构,并通过CHARMM-GUI构建了真菌细胞膜模型。通过GROMACS开战粗粒化与全原子的多尺度分子动力学(Molecular Dynamics, MD)模拟,重现了MAP-26与细胞膜的互作过程。其动力学特征符合“地毯模型”的作用机制,且与扫描电镜下观察到的细胞膜皱缩、塌陷现象高度吻合,支持了MD模拟作为“干实验”手段在机制解析中的作用。在安全性方面,基于XGBoost和多项手工特征构建了抗菌肽毒性分类模型与溶血性HC50回归预测模型,为候选抗菌肽的后续筛选与优化提供了参考。

主要创新点如下:

1)提出了基于多源PLM深度特征融合的UniAMP系列抗菌活性预测框架。UniAMP通过融合多源PLM推理特征并采用Transformer编码器实现高维特征的深度交互,UniAMP2进一步通过基于双向交叉注意力机制的深度特征融合模块实现了冻结PLM全局特征与可训练适配器本地特征的动态交互。同时,提出了"动态重采样"策略以消除长期被忽视的正负样本长度分布偏差。UniAMP在各项测试中表现优异,且核心设计可迁移至其他蛋白质功能预测的小样本任务。

2)建立了面向特定病原体的靶向性抗菌肽挖掘流程。现有抗菌肽挖掘工作大多为广谱预测,或针对革兰氏阴性菌、病毒等病原体大类进行区分,而不针对具体病原菌。本研究通过构建针对不同病原体的专用数据集与靶向性预测模型,建立了涵盖"候选获取—靶向性预测—实验验证"的完整流程,并在三个不同来源上验证了该流程的有效性与可推广性。

3)从三个不同来源发现了15条新型低同源性抗菌肽。经Blast比对验证,上述抗菌肽均未被报道且与已知序列同源性较低,且其中5条具有强抗菌活性,属于全新的抗菌活性分子。

4)将多尺度分子动力学模拟嵌入抗菌肽挖掘流程。目前已有的抗菌肽挖掘相关研究普遍止步于活性验证,这也导致了作用机制、毒性等数据的缺乏,本研究针对挖掘到的新型抗菌肽构建了面向目标真菌的特异性细胞膜模型,通过粗粒化与全原子多尺度模拟推测了其"地毯模型"作用机制,并与SEM图像互为佐证。