科研进展

天津工业生物技术研究所开发基于深度学习的密码子优化模型DeepCodon

发布时间:2025-09-11

字号:【大】 【中】 【小】

在合成生物学与工业生物制造领域,密码子优化是提升外源基因表达水平的关键环节。然而,传统方法往往依赖高频密码子替换,这一策略虽然能够在一定程度上提高表达效率,但可能破坏自然序列中与蛋白折叠和翻译动力学密切相关的“稀有密码子簇”,从而产生不表达或低表达现象。

近日,中国科学院天津工业生物技术研究所江会锋研究员带领的新酶设计研究团队在密码子优化研究方面取得重要进展。研究团队开发了一种基于深度学习的密码子优化模型DeepCodon。该模型在提升密码子偏好性的同时,尽可能保留功能相关的稀有密码子特征,为工程菌株的序列设计提供了新的思路。

DeepCodon以人工智能学习密码子选择规律为基础,建立了从蛋白质到编码序列的“翻译映射”。在大规模序列数据训练的基础上,研究团队对高表达基因进行微调,使模型在生成合理密码子序列的同时能够兼顾高表达性能。进一步,DeepCodon引入条件概率策略,优先保护进化上保守、与功能相关的稀有密码子簇,从而避免传统方法中过度使用高频密码子所带来的翻译拥堵和错误折叠风险。

在实验验证中,研究团队分别利用DeepCodon与传统方法优化了20个基因并在大肠杆菌中表达,结果显示9DeepCodon优化的基因表达显著高于传统方法,10个基因与传统方法相当,仅1个低于传统方法,充分展示了该模型在实际应用中的潜力。目前,该工具主要面向大肠杆菌应用场景,并提供免费在线密码子优化服务:https://deepcodon.biodesign.ac.cn/

研究得到了中国科学院战略性先导科技专项、国家自然科学基金、COMSATS工业生物技术联合中心基金、天津市合成生物技术创新能力提升行动以及合成生物学海河实验室重大研究项目基金的支持。相关成果已发表于国际期刊BioDesign Research。论文的共同第一作者为中国科学院天津工业生物技术研究所联合培养硕士研究生韩旭东和邵晓彤,江会锋研究员、程健副研究员和廖小平研究员为论文的通讯作者。

文链接

DeepCodon示意图