机器学习用于将哺乳动物的增强子遗传变异与复杂的表型联系起来
哺乳动物表型的进化不能用蛋白质编码序列的差异来解释。 这些表型的进化可能受到基因转录变化的影响。 参与表型发育的增强子仍然很大程度上未知。 用于鉴定这些增强子的基于序列保守性的方法具有局限性,因为即使序列中的核苷酸保守性不佳,增强子活性也是保守的。 这是因为核苷酸正在以令人难以置信的高速度发生变化。 然而,转录因子结合位点和序列特征的相同组合可以持续数百万年,这使得增强子的功能能够在特定的细胞类型或组织中得以保留。 不可能测量数十种物种中直系同源启动子的功能。 然而,新的机器学习方法使我们能够预测跨物种特定组织或细胞类型的增强子功能。
来源和详细信息:
https://www.science.org/doi/10.1126/science.abm7993

