查看: 69|回复: 0
打印 上一主题 下一主题

[数据分析基础] PNAS:机器学习揭示早产儿脑结构连接与基因变异的关系 [复制链接]

Rank: 5Rank: 5

水晶
2285
心级
1915
精华
0
主题
178
帖子
184
跳转到指定楼层
楼主
发表于 昨天?10:52 |只看该作者 |倒序浏览

PPARG基因与白质发育密切相关,可能调控早产儿的大脑发育。使用sRRR(基于稀疏降秩)回归模型,研究人员可以识别与PPARG基因联系较强的脑白质结构连接,从而证实以上假说。该成果由伦敦大学国王学院MichelleL. Krishnan等人发表在最近的PNAS期刊上。

关键词:早产儿 纤维追踪 脑网络 基因 sRRR回归

1 引言

早产儿占新生儿出生总数的11%,是全球5岁以下儿童死亡和残疾的主要原因。超过30%的幸存者经历了从早期生活到成年的神经认知问题,包括焦虑、注意力不集中、社交和沟通问题,以及社会情感问题。影像学研究表明,不良的认知表现与大脑结构、连接性和功能的改变有关。机器学习和影像基因组学的最新进展使得通过探究与大脑内表型相关的遗传变异来研究早产影响的潜在机制成为可能。

之前的研究表明,白质发育和许多代谢途径之间存在联系,其中与过氧化物酶体增殖激活受体(Peroxisome ProliferatorActivated Receptor,PPAR)途径的联系最为紧密,从而提出了PPAR途径调节早产儿大脑发育的假说。本文收集大量的弥散MRI (d-MRI)和基因组数据,对全脑弥散影像进行了无监督、无偏见的机器学习分析,并结合全基因组、单核苷酸多态性(SNP)基因型进行了分析,以进一步探究基因对早产儿大脑发育的影响。

本文影像遗传学研究发现了PPARG基因与脑结构连接之间的强大联系,暗示了PPAR信号在早产儿异常白质发育中的作用,并为治疗研究提供了一个容易处理的新靶点。

2 方法

样本选择和排除标准

(1)出生小于33周胎龄(平均29周+4天)的272名婴儿。

(2)在同等年龄有合适的影像数据,并有相关的基因组DNA。

影像数据获取

使用8通道头线圈在Philips3T设备上进行MRI扫描。在扩散张量成像之前获得了3D-MPRAGE和高分辨率的T2加权快速自旋回波图像。使用以下参数在32个方向上获取单次DTI:重复时间(TR):8000毫秒;回波时间(TE):49毫秒;层厚:2毫米;视野:224毫米;矩阵:128×128(体素大小:1.75×1.75×2 mm3);b值:750 s / mm2。还使用TR =8,670 ms,TE = 160 ms,翻转角= 90°,层厚= 2 mm,视野= 220 mm;矩阵=256×256(体素大小= 0.86×0.86×1 mm3)等参数来采集T2加权快速自旋回波MRI图像。

影像数据选择和质量控制

回顾了T2加权MRI结构扫描,以排除具有广泛脑异常、严重局灶性破坏性实质病变、多点状白质病变或白质囊肿的受试者。评估所有MRI图像是否存在图像伪影(也包括信号缺失、混叠、场不均匀等)和剧烈运动。设计所有排除标准的目的是为了保证不偏倚的研究,同时保留早产儿典型的临床异质性。

sRRR参数

基于稀疏降秩回归模型(sRRR),对q个图像变量和p个SNP集进行建模:

Y = XBA+ E

其中B是p个SNP(单核苷酸多态性)回归系数的p×r矩阵,A是q个图像变量回归系数的r×q矩阵,E是n×q误差矩阵。

sRRR是特别设计用来处理样本数量小于特征数量的情况,该方法使用所有snp(单核苷酸多态性)来拟合表型的预测模型,同时根据预测价值对所有snp进行排序。

纤维追踪

使用改进的概率追踪算法对弥散MR数据进行纤维追踪。纤维追踪的ROI由90个节点的婴儿脑图谱确定,最终得到90个皮层区域之间的脑连接。

全基因组基因分型

使用OrageneDNA OG-250试剂盒(DNA Genotek Inc.)收集唾液样品,并在IlluminaHumanOmniExpress-24 v1.1芯片(Illumina)上进行基因分型。使用PLINK进行过滤。保留了MAF≥5%,基因分型率100%和Hardy-Weinberg平衡精确检验P≥1×10-6的SNP,得到556,227个SNP供进一步分析。

人口分层评估

基于PLINK 1.9中实现的成对欧几里德距离,将全基因组SNP(单核苷酸多态性)数据用于IBS(identityby state),以评估个体之间的相关性。通过主成分分析对IBS距离矩阵进行降维,并且在下游分析中将第一个主成分用作协变量以调整总体分层。汇总的种族类别用于标记前两个主要组合的PCA图的数据点IBS方差标准化关系矩阵(补充材料图S1)的内容。这说明了遗传血统和种族的前两个组成部分之间的对应关系,并提供了同类人群混合物的概述以及表型调节的手段。通过计算成对IBS值,并利用该距离矩阵进行主成分分析,来评估个体之间的相关性。


软件应用

为了进一步了解大脑内表型,文中使用BrainNet Viewer软件根据北卡罗莱纳大学AAL图谱坐标显示了sRRR模型中最常选择的10条纤维束。

3 结果

sRRR(基于稀疏降秩)选择一致的脑内表型

根据sRRR模型中的选择频率,对白质纤维束进行排序,并展示了10条最重要的纤维束。选择频率范围从0.817到0。


Fig 1. 使用sRRR模型得到的选择频率。图中,绿色实线:基于真实数据得到的选择频率;空心灰色圆圈:在相同的参数下,基于置换数据得到的选择频率;实心灰色圆圈:基于随机生成数据得到的选择频率。

图1显示:基于随机生成数据得到了较低的选择频率,表明重要的纤维束在个体间是比较一致的。

一致选择的白质纤维束在信息流中有重要作用

为了进一步了解大脑内表型,sRRR模型中最常选择的10条纤维束相关脑连接示例图是使用BrainNet Viewer软件根据AAL图谱坐标可视化的,并采用图论方法计算脑网络效率。这些纤维束分布在额中、颞中、海马旁/内环带内的各个环节,FA值范围为0.06 ~ 0.2(补充材料Fig S3和S4)。


篇幅限制,阅读全文请点击链接 https://mp.weixin.qq.com/s/DLGwwG8z09x1QXNZWju5qw

原文:

Machine learning shows association betweengenetic variability in PPARG and cerebral connectivity in preterm infants

ML Krishnan, Z Wang, P Aljabar… -Proceedings of the …, 2017 - National AcadSciences

如需原文及补充材料请加微信:siyingyxf 获取,如对思影课程感兴趣也可加此微信号咨询。


转发到微博
您需要登录后才可以回帖 登录 | 注册

bottom

Powered by Discuz! X2

? 2001-2011 Template By Yeei. Comsenz Inc.

回顶部