单细胞Hi-C可以识别3D染色质组织的细胞间变异——有关细胞中基因组折叠和基因表达作用的关键信息。但是,鉴于测量到的相互作用的稀疏性,Hi-C数据的分析一直具有挑战性。现在,卡内基梅隆大学计算生物学系的一个团队开发了一种新算法,提供了一个强大的工具,可以以前所未有的分辨率说明该过程。
这项工作发表在《自然生物技术》杂志上,论文为“MultiscaleandintegrativesinglecellHi-CanalysiswithHigashi”。”
(资料图片)
该算法名为Higashi,基于超图表示学习,这是一种机器学习形式,可以在应用程序中推荐音乐并执行3D对象识别。它可以“结合单个细胞之间的潜在相关性,以增强接触图的整体估算。”
该算法是第一个在超图上使用复杂神经网络来提供单细胞基因组组织高清分析的工具。普通图将两个顶点连接到单个交点(称为边),而超图将多个顶点连接到边。
Higashi算法与单细胞Hi-C配合使用,它可以创建单个细胞中同时发生的染色质相互作用的快照。Higashi对复杂组织和生物过程的单细胞中染色质的组织以及其相互作用如何因细胞而异进行了更详细的分析。这项分析使科学家能够看到细胞之间染色质折叠和组织的详细变化,包括那些在确定健康影响方面可能微妙但很重要的变化。
卡内基梅隆大学计算机科学学院计算生物学教授马健博士说:“基因组组织的变异性对基因表达和细胞状态具有重要影响。”
计算机科学学院的博士生张若池与研究生周天明和马云一起,以一种传统的日本甜点命名为“Higashi”,延续了他从他开发的其他算法开始的传统。“他对研究充满热情,但有时也带有幽默感,”马说。
Higashi算法还允许科学家同时分析与单细胞Hi-C联合分析的其他基因组信号。最终,这一功能将能够扩展Higashi的能力,考虑到Ma预计未来几年通过他的中心所属的NIH4D核组计划等项目预计单细胞数据的增长,这一功能是及时的。这种数据流将为设计更多算法创造更多机会,从而促进对人类基因组在细胞内如何组织及其在健康和疾病中的功能的科学理解。
“这是一个快速发展的领域,”马云说。“实验技术正在迅速发展,计算的发展也是如此。”
作者写道,Higashi“优于单细胞Hi-C数据嵌入和插补的现有方法,并且能够识别单细胞中的多尺度3D基因组特征,例如区室化和类似TAD的域边界,从而可以精细地描绘它们的结构。”细胞间的变异性。”此外,与两种模式的单独分析相比,Higashi可以将同一细胞中联合分析的表观基因组信号纳入超图表示学习框架中,从而改善单核甲基3C数据的嵌入。
这项工作是一个多机构研究中心的一部分,旨在更好地了解细胞核的3D结构以及该结构的变化如何影响健康和疾病中的细胞功能。该中心耗资1000万美元,由美国国立卫生研究院资助,由卡内基梅隆大学领导,马云担任首席研究员。