耶鲁的一支研究团队开发了一种新的成像技术,可以呈现人体细胞中老化、疾病与基因活动之间的隐藏联系。
研究人员使用一种新的机器学习方法发现,在显微镜下观察的组织样本中,可以呈现基因变异、基因活动情况,甚至可以估算个体的年龄。
论文作者孟冉(耶鲁大学分子生物物理与生物化学系及计算生物学与生物医学信息学项目的博士后研究员)表示,他们的研究说明普通的组织图像中包含一些模式,可以较为稳定地预测基因表达并推断个体年龄,而这些信息以往是肉眼无法直接识别的。
他补充说,更清晰的图像质量让他们能够将图像与基因特征联系起来。模型可以处理大量数据,并在图像中标出影响年龄预测的区域,显示哪些区域使预测偏向“更年长”或“更年轻”。
这项新技术可能为改进基于常规病理切片的诊断方式提供帮助,也可能通过及早发现组织中的异常模式协助评估疾病风险。相关研究发表在《美国国家科学院院刊》。
参与研究的合著者 Gerstein 教授指出,遗传学中的一个重要部分是基因型与表型之间的联系。基因型指生物体的基因组成,而表型指可观察到的特征,这些特征由基因型与外部环境共同影响,例如身高、眼睛颜色、营养状况、生活用水质量,以及更复杂的行为特征或疾病表现。
Gerstein 介绍,当前研究的一条前沿方向是“多模态数据”,即将基因型与各种描述表型的数据联系起来。本研究则推进了基因型与图像特征之间的关联。
研究人员利用来自 838 名健康捐赠者的组织图像、基因信息与 RNA 数据,这些数据涵盖 12 种不同的组织类型,总计超过 1 万张图像。基于这些数据,他们构建了计算机模型,可以识别与组织外观相关的基因变异。模型还能预测基因表达状态(基因处于“开启”或“关闭”)以及个体年龄。
团队表示,其中一个机器学习模型能够根据组织图像预测基因表达,部分组织样本(如肺、心脏与睾丸组织)预测效果较为理想。
另一种模型可以通过组织样本估算个体年龄,其中皮肤、胫神经、胫动脉及睾丸组织预测效果较好,因为这些组织在老化过程中呈现较明显变化。
总体来看,研究人员发现细胞核的形状、大小与结构中包含丰富的生物学信息。他们在人体基因组中识别出 906 个与不同组织中细胞核外观紧密相关的区域,同时也观察到细胞核形态与基因活动之间存在显著联系。
参与研究的其他耶鲁研究人员包括:计算机科学系的 William Zhu 与 Tselmeg Ulammandakh;分子生物物理与生物化学系的倪鹏宇与周潇;以及同时隶属于分子生物物理与生物化学系、放射与生物医学影像系的 Christopher JF Cameron。









