当前位置:   article > 正文

NAR|吴华君/郑小琪/黄超兰团队开发AI辅助的DNA柔性预测工具BendNet

NAR|吴华君/郑小琪/黄超兰团队开发AI辅助的DNA柔性预测工具BendNet

DNA与蛋白质的相互作用对于DNA复制、染色质形成、转录调控等许多关键细胞进程至关重要,这些细胞过程需要DNA展现出不同程度的柔性来缠绕蛋白质,其中起关键作用的是100-bp以下的DNA片段的柔性 (1)。实验上,可以通过loop-seq等方法获取DNA片段的柔性。但是,使用这些方法在全基因组尺度上低成本地获取DNA序列的柔性仍然具有一定的困难 (2,3)

近日,北京大学医学部精准医疗多组学研究中心/北京大学肿瘤医院吴华君课题组,上海交通大学公共卫生学院单细胞组学与疾病研究中心郑小琪课题组以及北京协和医院疑难、重症与罕见病全国重点实验室黄超兰课题组合作在Nucleic Acids Research上发表了题为Assessing base-resolution DNA mechanics on the genome scale的研究论文,利用AI技术实现对任意DNA序列柔性的快速低成本预测,为研究DNA力学性质参与转录调控的机制提供了有力工具。

19186a29646a7759a49e2878daecb61f.png

c54a9fb17e4adcc9cf835ec2aa61dbe6.png

文中提出了一种基于深度学习的方法——BendNet,通过使用无路由的多胶囊网络(4) 提取编码DNA柔性的序列特征,每条50-bpDNA序列经过独热编码,通过三种不同深度的卷积层提取序列的不同高维特征,再由三个胶囊全连接网络来预测DNA序列的柔性。

893a3a32e3497167617fb903407845bb.png

作者将BendNet与经典的机器学习和深度学习模型进行了比较,包括Random ForestRF), Support Vector RegressionSVR), AlexNet ResNet GoogleNet VGG DNAcycP and DeepBendBendNet不仅在预测准确性方面表现出色,并且,它在训练和预测过程中的速度均领先其他深度学习模型,比第二快的模型节省了38%的训练时间和25%的预测时间。BendNet也表现出了很好的泛化能力,它在不同实验类型、不同物种的数据集上表现优异。这些结果表明BendNet是一个准确、高效且具有广泛适用性的模型,未来随着实验数据的积累可以应用于预测其他DNA性质,例如DNA扭曲、超螺旋和扭转刚度等,对于DNA特性研究具有广泛的应用价值。

随后,作者将BendNet应用于人类基因组,首次获得了全基因组尺度、单碱基分辨率的DNA柔性图谱。研究发现,DNA序列在转录起始/终止位点等区域的柔性较低、在增强子区域附近偏高。在活跃的转录调控区域中GC-ContentDNA柔性均呈正相关。DNA柔性区域还富集疾病相关的风险位点。此外,绝大部分转录因子(TF)结合于刚性(柔性低)的DNA序列上,但某些先锋转录因子和与染色质结构相关的转录因子,如EBF1CTCF,在其结合区间中呈现出异常高的柔性。这些转录因子与核小体共同结合或竞争结合,以发挥其功能。尤其CTCF结合区域的DNA的柔性明显高于其它区域,这可能暗示这些区域在捕获并维持CTCF在特定位置形成DNA拓扑结构域(Topologically associating domain)的作用上具有重要意义。

该研究为大规模DNA序列柔性的计算提供了有力的工具,并且加深了DNA力学性质在染色质调控中作用的理解。为构建一个更为全面的DNA 柔性资源库,作者利用BendNet预测了307个物种的基因组,将其存储于Zenodo服务器上,并为科研人员开发了一个用户友好的BendNet使用网站(http://www.dnabendnet.com/)。

4ed6215e16259933da08103dfb137a4a.png

北京大学肿瘤医院蒋文杰为论文的第一作者。北京协和医院疑难、重症与罕见病全国重点实验室黄超兰教授,上海交通大学公共卫生学院单细胞组学与疾病研究中心郑小琪教授,和北京大学医学部精准医疗多组学研究中心/北京大学肿瘤医院吴华君研究员为该论文的共同通讯作者。该研究得到了国家自然科学基金、上海市自然科学基金和国家重点研发计划项目的资助。

Reference

1. Vafabakhsh, R. and Ha, T. (2012) Extreme bendability of DNA less than 100 base pairs long revealed by single-molecule cyclization. Science,337, 1097-1101.

2. Basu, A., Bobrovnikov, D.G., Qureshi, Z., Kayikcioglu, T., Ngo, T., Ranjan, A., Eustermann, S., Cieza, B., Morgan, M.T. and Hejna, M. (2021) Measuring DNA mechanics on the genome scale. Nature,589, 462-467.

3. Tang, L. (2021) Sequencing DNA bendability. Nature Methods, 18, 121-121.

4. Sabour, S., Frosst, N. and Hinton, G.E. (2017), Proceedings of the 31st International Conference on Neural Information Processing Systems. Curran Associates Inc., Long Beach, California, USA, pp. 3859–3869.

Cell Genomics封面|北大吴华君课题组利用空间多组学技术解析肿瘤内空间异质性

北京大学吴华君课题组高新诚聘 医学生信 助理研究员和博士后

猜你喜欢

iMeta简介 高引文章 高颜值绘图imageGP 网络分析iNAP
iMeta网页工具 代谢组MetOrigin 美吉云乳酸化预测DeepKla
iMeta综述 肠菌菌群 植物菌群 口腔菌群 蛋白质结构预测

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树 必备技能:提问 搜索  Endnote

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘  

写在后面

为鼓励读者交流快速解决科研困难,我们建立了“宏基因组”讨论群,己有国内外6000+ 科研人员加入。请添加主编微信meta-genomics带你入群,务必备注“姓名-单位-研究方向-职称/年级”。高级职称请注明身份,另有海内外微生物PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

点击阅读原文,跳转最新文章目录阅读

本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/131687
推荐阅读
相关标签
  

闽ICP备14008679号