近日,微生物所尹文兵研究团队与北京大学前沿交叉学科研究院定量生物学中心/生命科学联合中心李志远研究团队在PLOS Computational Biology合作发表文章,题为Knowledge-guided data mining on the standardized architecture of NRPS: subtypes, novel motifs, and sequence entanglements,提出非核糖体多肽合酶(NRPS)中结构域的基序和基序间结构可作为其划分的标准,这种“标准化”能够系统地评估大量NRPS序列的功能偶联,从而发现新的基序,解决功能域的边界不清及标准混乱的问题,为NRPS的重编程及相关药物工程化设计提供理论基础。
研究团队对16,820个细菌基因组和2,505个真菌基因组中的NRPS序列进行了系统性分析,利用已知文献中的保守序列(motif)建立了NRPS的标准化框架。该团队对已知的缩合功能域(Condensation domain, C domain)实现了基于序列特征的预测,且首次对真菌C domain subtype进行了预测,并将已知的CT domain按照功能和序列特征细分成三个亚型(CT, CT-DCL, CT-A)。此外,团队还基于序列保守性鉴定了三个新motif,同时对于其中关键的G-motif的重要性进行了功能验证。通过定点突变及定向次级代谢产物检测等手段,在烟曲霉fmq基因簇中NRPS的G-motif进行功能验证,结果显示G-motif对NRPS的功能有关键作用。随后,作者通过序列统计和分析解释了NRPS难以被重编程和底物预测准确率低的原因。最后,构建了用户友好的在线工具“NRPS motif Finder” (http://www.bdainformatics.org/page?type=NRPSMotifFinder),可以对NRPS进行结构域的边界进行标准化鉴定和C domain亚型预测。
中科院微生物所尹文兵研究员和北京大学李志远教授为该论文的共同通讯作者。北京大学博士研究生贺若霖为第一作者,微生物所博士研究生张金玉为第二作者。本研究得到了科技部重点研发计划、国家自然科学基金、国家博士后创新人才支持计划、北京大学临床医学+X青年专项、中央高校基本科研业务费专项、中国科学院生物资源计划和中国科学院前沿科学重点研究计划的资助。