近日,深圳大学人工智能学院李坚强教授和团队成员杜智华老师与华大基因肖敏凤研究员团队合作在期刊Nature Communications上发表了题为“High-resolution phage-host assignment through key proteins using large language models”的研究论文。人工智能学院李坚强教授和华大基因肖敏凤、李俊桦研究员为共同通讯作者,杜智华老师为共同第一作者,深圳大学为论文第一完成单位。

噬菌体是肠道微生态中最丰富、也最难解析的生物组分之一。随着宏基因组测序的发展,大量噬菌体序列被不断发现,但其中绝大多数仍属于“病毒暗物质”:能够被测到,却难以判断其感染宿主,也难以进一步挖掘其潜在功能。宿主解析能力不足,已成为制约肠道噬菌体基础研究和应用转化的重要瓶颈。针对这一难题,研究团队开发了VirHost Hunter 框架,为海量未知噬菌体的宿主解析与功能挖掘提供了新方法。该框架成功为大量此前无法归类的“病毒暗物质”找到了对应宿主,其中包括与肠道健康密切相关的阿克曼氏菌(Akkermansia)和普雷沃氏菌(Prevotella)等重要菌属相关噬菌体。在此基础上,团队进一步建立了噬菌体裂解蛋白数据库,成功合成并验证了一种能够精准杀灭特定肥胖相关细菌的裂解蛋白。这项研究将大语言模型、深度学习与微生物组学问题紧密结合,为肠道微生态研究、噬菌体治疗开发以及精准医学应用提供了新的方法学支撑。

该研究得到国家重点研发计划、国家自然科学基金等项目的资助与支持。
原文链接:https://www.nature.com/articles/s41467-026-70613-x