绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
万方知识发现服务平台
获取范围
  • 1 / 44
  (已选择0条) 清除 结果分析
找到 877 条结果
[硕士论文] 张娟
生物化学与分子生物学 福建医科大学 2018(学位年度)
摘要:在某一特定类型的人类正常组织样本内,基因表达水平的相对高低秩序(relative expression orderings,REOs)关系,即转录组定性特征,存在广泛的稳定性,而在其相应的癌症组织样本中却发生了广泛的扰动。基于这一生物学现象,实验室已经开发几个基于REOs的分析算法,如用于识别个体化水平的差异表达基因的RankComp算法,利用单边数据识别疾病相关通路的DRFunc算法等。在这类方法中,通常都是筛选出基因表达的秩序关系在正常组织样本中显著稳定的基因对,利用其作为正常背景,然后通过癌症组织样本中的基因对与这个正常背景比较,进行相关分析。REOs具有对实验批次效应不敏感、可以整合不同来源的数据,因此可以重复利用以往研究累积的样本等优点。然而,目前尚没有研究分析如年龄、性别、种族以及吸烟等混杂因素对正常组织样本中REOs的影响。
  在本研究中,搜集来自三个独立数据集的173例肺正常组织样本,用于评价混杂因素对REOs的影响。对于年龄因素,采用秩和检验筛选与年龄相关的基因对。其他三个因素,首先,利用二项累积分布分别在两类样本中筛选显著稳定的基因对,然后比较这两类样本中基因对的秩序模式。最后,基于两类样本中具有相反秩序模式的基因对,利用RankCompV2算法识别哪些基因的差异表达导致了这些基因对秩序模式的逆转,并进行通路富集分析。
  对于年龄因素,没有筛选到相关的显著稳定基因对。
  对于性别因素,在女性肺正常组织样本中显著稳定的基因对中,约有0.074%的基因对在男性肺正常组织样本中的秩序关系相反。同时,识别了24个导致这些基因对的秩序关系逆转的差异表达基因,其中有19个位于性染色体上:7个在男性肺正常组织中相对于女性样本高表达的基因有6个基因位于Y染色体上,一个基因位于X染色体;而12个在女性样本中高表达的基因都位于X染色体上的基因。另外,还有5个基因位于常染色体上,其中3个在男性样本中高表达的基因为PRDM7、DDX43和CRISP2,并且DDX43和CRISP2与精子生成过程相关。另2个相对于男性肺正常组织,在女性肺正常组织中高表达的基因为NLRP2和C3orf79。其中,NLRP2位于19号染色体长臂1区3带,是卵子质量的重要调控者。此外,还发现在胃正常组织和食管正常组织中,性别因素对其样本内的REOs同样具有一定的影响。
  对于种族因素,在白种人的肺正常组织中显著稳定的基因对中,有0.027%的基因对在黑种人的肺正常组织样本中秩序关系相反。同样,识别了22个引起这些秩序关系逆转的差异表达基因,并发现这些基因显著富集于戊糖和葡萄糖醛酸转换(Pentose and glucuronate interconversions)、果糖和甘露糖代谢(Fructose and mannose metabolism)、甘氨酸、丝氨酸和苏氨酸代谢(Glycine,serine and threonine metabolism)、氨基酸的生物合成(Biosynthesis of amino acids)以及碳代谢(Carbon metabolism)等代谢相关通路,还有与免疫相关的抗原加工提呈(Antigen processing and presentation),补体途径(Complement and coagulation cascades)和IgA产生的肠道免疫网络(Intestinal immune network for IgA production)通路。
  在非吸烟者肺正常组织中显著稳定的基因对中,约有0.23%在吸烟者的肺正常组织中的秩序关系出现逆转。然后,识别出344个引起这些秩序关系逆转的差异表达基因,并发现其中在吸烟者肺组织中上调的基因显著富集于细胞色素P450异物代谢(Metabolism of xenobiotics by cytochrome P450)、谷胱甘肽代谢(Glutathione metabolism)、甾类激素生物合成(Steroid hormone biosynthesis)、甲状腺激素的合成(Thyroid hormone synthesis)、铁死亡(Ferroptosis)、碳代谢(Carbon metabolism)以及ABC转运子(ABC transporters)等生物学通路;在吸烟者肺组织中下调的基因显著富集于矿质元素吸收(Mineral absorption)和烟酸和烟酰胺代谢(Nicotinateand nicotinamide metabolism)等生物学通路(超几何检验,p<0.05),提示吸烟因素可能影响了这些重要的生物学通路功能。
  综上所述,吸烟因素对肺正常组织样本内REOs的影响最大,性别因素次之,种族因素影响较小,没有发现年龄因素对基因表达的秩序关系有影响。此外,性别因素对胃正常组织和食管正常组织样本内的REOs同样具有一定的影响。总之,基于REOs的研究应该考虑吸烟,性别以及种族这些混杂因素的影响。
[硕士论文] 池美容
生物化学与分子生物学 福建医科大学 2018(学位年度)
摘要:利用基因表达谱数据,最基础的分析是识别在两类样本间(如疾病与正常)差异表达的基因(Differentially expressed genes,DEGs)。然而,在心脏、肺动脉、脑等重要脏器的相关疾病的研究中,经常难以获取足够的正常对照样本,从而导致在缺乏正常对照样本的情况下无法识别疾病与正常对照之间的差异表达的基因;为了解决缺乏正常样本的问题,有研究提出了数据标化、去批次效应等算法尝试将不同实验室检测的数据整合到一起进行分析,然而由于批次效应的影响这些算法通常扭曲了真实的生物学信号。
  在本实验室前期工作中,已经提出了基于基因表达水平的相对高低秩序关系(relativegene expressionorderings,REOs)的RankComp算法,识别在单个疾病样本中的差异表达基因。该算法具有对批次效应不敏感、不需要进行数据标准化等优点,可以整合在过去研究中累积的正常组织样本的数据,从而解决了重要脏器相关研究难以获得足够数量的正常样本的问题。但是,当累积的正常样本的数量不足量时,RankComp在识别群体水平的差异表达基因时存在检测敏感性偏低的问题。因此,本课题改进了RankComp算法在小样本量数据集中识别群体水平的差异基因的检测效能,并将此改进的算法简称为RankPop算法。为评价此方法,利用数据库中累积的共160个来自不同实验室检测的正常左心室(Left ventricular,LV)组织样本,从中随机抽取20个正常样本进行仿真,最后得到20个疾病样本的表达谱数据。在此仿真数据集中,RankComp识别群体水平差异表达基因的敏感性仅为75.33%,而RankPop的敏感性提高至了88.60%。
  结果说明,当样本量较少时,RankPop相对于RankComp算法能更准确地识别群体水平的差异表达基因。
  对137例扩张型心肌病(Dilated cardiomyopathy,DCM)和119例缺血型心肌病(Ischemic cardiomyopathy,ICM)患者,基于跨平台的在正常组织中显著稳定的基因表达的秩序关系,首先分别识别了DCM和ICM的个体化水平的差异表达基因。在此基础上,采用RankPop分别识别了DCM和ICM的群体水平的差异表达基因。利用传统方法(T-test)所识别的DCM和ICM的群体水平的差异表达基因评价由RankPop识别的差异表达基因,发现RankPop方法可以准确地识别DCM和ICM的群体水平的DEGs(一致性分别达到了99.30%和99.38%)。在RankPop识别的心肌病的群体水平的差异表达基因中,发现有3个基因(MNS1,SFRP4和CCL2)在85%以上的DCM患者中发生失调,有25个基因(MNS1,SFRP4,FCN3等)在85%以上的ICM中发生了失调,其中,SFRP4、FURIN等是心脏疾病的药物作用靶点。将这些基因定义为DCM或ICM高相关基因。通过蛋白质互作(Protein and Protein Interaction,PPI)网络分析,与DCM/ICM高相关基因存在蛋白质互相作用关系的差异表达基因显著富集于与心脏异常相关的通路,包括Wnt信号通路、Hippo信号通路和mTOR信号通路等。
  本文的分析结果显示,基于基因表达秩序关系的分析方法,可整合不同来源的正常样本,为缺乏正常样本的研究提供对照,据此可以识别个体水平的差异表达基因和群体水平的差异表达基因,为有关敏感脏器等缺乏正常对照的研究提供了有效的分析策略。
[硕士论文] 宋瑞雅
临床检验诊断学 福建医科大学 2018(学位年度)
摘要:目的:研究GlobalFiler复合扩增系统21个常染色体短串联重复序列基因座在闽南地区汉族群体中的遗传多态性,评价该系统在个体识别、亲权鉴定等法医学上的应用价值.通过ITO法、Fisher判别函数和状态一致性评分(IBS)这三种方法评价GlobalFiler系统在全同胞关系鉴定这一难点问题的应用价值,为开展全同胞关系鉴定提供参考.
  方法:(1)收集1000名闽南地区汉族人群无关个体(根据身份证)血样,Chelex-100法提取DNA.(2)运用GlobalFiler PCR复合扩增体系扩增已提取的DNA.(3)基因分析仪对扩增产物进行毛细管电泳及测序,确定各基因座的基因型.(4)运用数据分析软件分析这1000名无关个体的基因型,获得各基因座的基因频率法医学参数,将获得的基因座的基因频率与近年报道的中国多个群体进行比较.(5)收集50对闽南地区全同胞关系DNA样本构成全同胞关系组和150对闽南地区无关个体组成无关个体组,按(1)-(3)步骤获得各个体的21个基因座的基因型.(6)用ITO法计算全同胞组和无关个体组每对个体间的累积全同胞指数.(7)统计全同胞组与无关个体组每对个体间等位基因全部相同、等位基因半相同、等位基因全不相同的基因座个数,根据所得结果建立全同胞-无关个体判别函数.(8)分别计算全同胞组与无关个体组间的累积状态一致性评分.
  结果:(1)获得1000名闽南地区汉族无关个体GlobalFiler检测系统中21个常染色体基因座的基因型,未见等位基因丢失及三等位基因的现象,共获得274种等位基因.(2)21个常染色体STR基因座通过x2检验进行Hardy-Weinberg平衡检验,p值均大于0.05;位于同一染色体上不同的STR基因座两两间的连锁不平衡检验,p值均大于0.05.(3)GlobalFiler系统中21个常染色体STR基因座在闽南地区汉族人群中的法医学遗传参数分布为:个体识别能力(DP)为0.7804~0.9925;多态信息含量(PIC)为0.5410~0.9391;非父排除概率(PE)为0.2909~0.8878;观测杂合度(HO)为0.600~0.9449;预期杂合度为(HE)为0.5982~0.9427;匹配概率(MP)为0.007~0.220.(4)在共有的17个STR基因座中,闽南地区汉族群体与广东汉族和天津汉族均有3个STR基因座基因频率分布存在差异,与河南汉族7个基因座存在差异,与云南苗族17个基因座均有差异,与新疆哈萨克族在13个基因座上有差异,与新疆维吾尔族16个基因座存在差异.(5)累积全同胞指数(CFSI)在全同胞组为1.38~2.14x1019;无关个体组为4.19x10-9~2.60.以CFSI>3和CFSI<1分别作为全同胞关系和无关个体判定标准,该标准的检测效能为99%.(6)采用Fisher判别分析方法建立了全同胞-无关个体判别函数,该判别函数准确率为98.5%.(7)IBS在全同胞组为20~42,在无关个体组为8~21,推荐以IBS≥23和IBS≤16分别作为全同胞关系和无关个体的判定标准,检测效能约为0.900.
  结论:(1)闽南汉族群体中,GlobalFiler系统21个常染色体STR基因座均符合Hardy-Weinberg平衡,无连锁不平衡情况.除TH01多态性较差、TPOX鉴别能力与多态性较差外,余下的19个基因座均属于高鉴别能力、高多态性基因座.GlobalFiler系统21个基因座累积非父排除率为0.999999999,累积匹配概率为7.72×10-26,有高的法医学应用价值.(2)闽南地区汉族群体多个STR基因座基因频率分布与中国其他群体存在着差异,证实STR的遗传差异性,得到闽南地区汉族群体21个STR基因座的基因频率丰富中国DNA数据库.(3)通过ITO法、判别函数法和IBS法探究Globalfiler系统在全同胞关系鉴定的应用,三种判定标准为日常开展全同胞关系鉴定提供参考.
[硕士论文] 丁亮
生物医学工程 中国科学技术大学 2018(学位年度)
摘要:近十几年来,非编码RNA(non-coding RNA,ncRNA)的研究在生命科学领域中占据了非常重要的地位。其中,ncRNA-疾病的相关性研究直接关乎人类健康,深入研究ncRNA-疾病的相关性有助于帮助人们在分子水平上理解疾病的发病机制,对疾病的预防、治疗、预后都具有十分重要的意义。
  随着高通量实验技术的快速发展,ncRNA-疾病相关性数据得到快速积累,并建立了一些可靠性高的公开数据库。这些数据库不仅提供了实验支持的ncRNA-疾病关系的系统概述,还涉及相关的生物学信息,极大地推动了ncRNA-疾病相关性研究的进展。研究者充分利用现有实验数据,设计高效而精确的计算方法预测出潜在的ncRNA-疾病相关性,用于指导后续实验,可以显著降低生物实验所需成本。然而,现有的大部分计算方法仅基于已有数据库中ncRNA-疾病相互作用信息构建ncRNA-疾病关联网络,并没有考虑到生物网络本身的异质性特征,忽视了ncRNA-疾病关联网络中相关的生物信息。本文针对ncRNA-疾病相关性研究中的2个重要方向——小分子RNA(microRNA,miRNA)-疾病的相关性和长非编码RNA(long non-coding RNA, lncRNA)-疾病相关性进行研究,具体内容如下:
  1、在已知miRNA-疾病相互作用数据基础上,通过引入大量miRNA-靶基因(target)相关性数据,构建出“disease-miRNA-target”异质性网络,并在此网络上提出miRNA-疾病相关性预测算法DMTHNDM(disease-miRNA-targetheterogeneous network for disease-related miRNA)用于潜在的miRNA-疾病相关性预测。该网络中,靶基因作为miRNA-疾病相关性的协同预测标签,极大地丰富了网络拓扑结构。通过将DMTHNDM与现有miRNA-疾病相关性预测工作进行性能对比,结果显示本文方法不仅更好地描述了miRNA-疾病关联网络的异质性,同时有效地提高了潜在miRNA-疾病相关性的预测性能。
  2、结合lncRNA-疾病相互作用信息以及基因(gene)-疾病相互作用信息,构建了“lncRNA-disease-gene”异质性网络。然而,现有实验验证的lncRNA-疾病相互作用数据较少,以致网络稀疏,孤立节点较多。为解决该问题,本文进一步收集了lncRNA表达谱信息与疾病的表型信息,由此计算出lncRNA表达谱相似性及疾病语义相似性。通过整合以上四类信息,构建lncRNA-疾病相关性的异质性网络,并在此基础上提出一种改进的资源传播算法TPGLDA(TripartiteGraph for LncRNA-Disease Association)用于预测潜在的lncRNA-疾病相关性。通过与现有方法的对比,TPGLDA不仅解决了孤立节点问题,同时显著提升了性能。
[硕士论文] 王丽梅
免疫学 福建医科大学 2017(学位年度)
摘要:目的:建立福建汉族群体PowerPlex21荧光复合扩增体系20个常染色体STR基因座DNA数据库,了解两个无关个体之间20个常染色体STR基因座基因型比中的概率,探讨适合建立福建汉族群体DNA数据库的核心STR基因座。
  方法:(1)来本实验室要求DNA亲子鉴定且籍贯为福建的汉族无关个体共5650例,采集末梢血3uL提取DNA备用。
  (2)采用PP21检测系统,以PCR复合扩增、毛细管电泳技术和荧光检测技术对上述5650例的D16S539等20个常染色体STR基因座和1个性别染色体基因座进行基因分型。
  (3)应用“基于DNA盲比技术的亲权鉴定家系检索比对软件”,录入上述5650例基因座分型结果和检材信息,建立福建汉族群体20个常染色体STR基因座的DNA数据库。
  (4)应用上述比对软件将该DNA数据库中5650例无关个体基因型进行一一比对,统计其20个常染色体STR基因座完全比中的概率,并计算假定二联体(被检测男子或女子与孩子的亲子鉴定)的累计亲权指数(CPI),分别以假定二联体CPI>10000、0.0001<CPI<10000、CPI<0.0001为支持、不能排除、排除亲缘关系。
  (5)对CPI>0.0001的假定二联体,进一步增加Investigator HD plex荧光复合扩增体系常染色体STR基因座位点检测,统计其30个常染色体STR基因座完全比中的概率,结果判定标准同上。
  (6)对30个常染色体STR基因座基因型比对不能排除亲缘关系的假定二联体,再增加Investigator Arugs X-12复合扩增体系性染色体STR基因座检测,并结合年龄因素进行统计分析,进一步明确无关个体之间的比中概率。
  结果:(1)建立福建汉族群体5650例无关个体20个常染色体STR基因座DNA数据库。
  (2)5650例无关个体STR基因座分型比对结果:20个常染色体STR基因座完全比中为23例,比中概率为0.41%(23/5650)。计算23例假定二联体20个STR基因座的CPI,其中15例假定二联体支持存在亲缘关系;8例假定二联体不能排除存在亲缘关系。
  (3)进一步以HD检测系统对上述23例假定二联体增加10个常染色体STR基因座(共30个常染色体STR基因座)进行分型比对,23例中有2例支持存在亲缘关系,其中1例30个STR基因座完全比中,比中概率为0.02%(1/5650),另1例仅1个基因座不匹配;其余21例均排除存在亲缘关系。
  (4)对30个STR基因座不能排除存在亲缘关系的2例假定二联体,结合X-12检测系统分型比对及年龄因素,2例全部排除存在亲缘关系,比中概率为零。
  结论:(1)PP21检测系统所包含的D16S539等20个常染色体STR基因座,是适合建立福建汉族群体DNA数据库的核心STR基因座。
  (2)福建汉族群体DNA数据库中,两个无关个体之间20个常染色体STR基因座完全比中概率为0.41%,增加至30个常染色体STR基因座后比中概率降至0.02%,增加12个X-STR基因座后比中概率为零。
  (3)对二联体案例尤其寻亲人员,最好进行30个常染色体STR基因座检测,对于仍不能排除的案例,应再增加性染色体STR基因座检测,以辅助结果判断。
[硕士论文] 李剑龙
流行病与卫生统计学 南方医科大学 2017(学位年度)
摘要:背景:
  关联分析是一种通过标记位点来定位疾病位点的方法,被广泛应用于病例对照数据和家系数据。如果标记位点距离疾病位点很近,这样就会导致连锁不平衡,关联分析就是以位点间连锁不平衡为基础,在获得群体表型数据与基因型数据后,采用统计分析方法检测遗传多态性与性状可遗传变异之间的关联,目的是利用标记位点与疾病位点之间位置的关系来定位变异基因。在诸多针对双等位基因位点的关联分析方法中,基于家系数据的广义不平衡检验(GDT)是一种稳健有效的方法。因为使用了家系内所有亲属对基因型差异的信息,所以GDT方法比其他现有的关联分析方法检验效能更高,但是GDT不能直接被用于存在基因型缺失的家系数据。遗传印记效应(genomic imprinting effects)是一种重要的表观遗传学现象,对研究基因对表型的影响有着非常重要的作用。该效应表现在后代基因的表达程度取决于此基因所在染色体来自父亲还是母亲。如果来自父亲染色体上的基因表达,而来自母亲的基因没有表达,则称为母源印记;相反,来自母亲染色体上的基因表达了,而来自父亲的没有表达,则称为父源印记。存在遗传印记效应时,两种有序杂合子基因型的外显率是不同的。常染色体上常见的与印记基因有关的疾病有:Beckwith-Wiedemann综合征、Silver-Russell综合征、假性甲状旁腺功能减退症和暂时性新生儿糖尿病。因此,将印记效应合并到关联分析中就变得越来越重要。另外,合并印记效应的家系传递不平衡检验(PDTI)及适用于不完整家系数据基于Monte Carlo(MC)重抽样方法的MCPDTI方法明显比没有合并以及效应信息的家系传递不平衡检验(PDT)的检验效能高。这也说明在关联分析过程中有必要合并印记效应的信息。但是与GDT相比,PDTI和MCPDTI都仅仅运用了家系内一级亲属对基因型差异的信息,这可能会降低两种方法的检验效能。
  另外一种常见的表观遗传学现象为母体效应(maternal effect),此效应是指生物的表现型不仅由其本身的基因和环境决定,而且还会受到其母亲基因型和表型的影响。在遗传学中,母体效应之所以关注的是个体的表现型预期受到母亲基因型的影响,而无论个体本身的基因型是什么,通常是因为母亲将mRNA或者蛋白质传递给了胚胎。基于母体效应的作用机制,许多疾病,特别是那些与妊娠结局有关的疾病,已经发现会受到母体效应的影响,比如儿童癌症的脊柱部、精神分裂症和高血压。虽然遗传印记效应和母体效应有不同的生理过程,但是它们可能会产生相同的表型变异。因此,将遗传印记效应和母体效应同时合并到现有的关联分析的方法中是十分有价值的。然而,现有的GDT方法没有合并遗传印记效应与母体效应。
  目的:
  本文的研究目的主要有以下三点:(1)基于Monte Carlo重抽样方法对GDT方法进行推广,提出适用于某些个体基因型缺失的不完整家系数据的MCGDT方法;(2)在完整家系数据的情况下,提出合并印记效应的广义不平衡检验(GDTI),在不完整家系数据的情况下,使用Monte Carlo重抽样方法对GDTI方法进行推广并提出MCGDTI方法;(3)提出完整家系数据下同时合并印记效应和母体效应的广义不平衡检验(GDTIM)及适用于不完整家系数据基于MonteCarlo重抽样方法的MCGDTIM方法。
  方法:
  (1)对于存在基因型缺失的家系数据,通过使用MC重抽样方法根据给定的或者观测到的固个体基因型对缺失基因型进行反推,并提出MCGDT方法。进一步使用模拟出的第一类错误率来评价MCGDT的有效性,并通过检验效能的比较来说明其能够准确地反推出缺失基因型。
  (2)对于完整的家系数据,为了将遗传印记效应合并到关联分析中,根据等位基因来自父亲还是母亲,将等位基因得分分解为两个等位基因得分之和,即XiJ=X(p)ij+X(m)lj,其中X(p)ij∈(0,0.5,1)为来自父亲等位基因得分;x(m)ij∈(0,0.5,1)为来自母亲等位基因得分。基于分解后的等位基因得分,提出合并遗传印记效应的广义不平衡检验(GDTI)。当家系中某些个体基因型缺失的时候,根据每个家系中观测到的基因型,运用MC重抽样方法来对缺失的基因型进行反推,并在此基础上提出MCGDTI方法。使用模拟出的第一类错误率来评价GDTI和MCGDTI的有效性,并通过比较新提出方法与现有的考虑所有亲属对基因型差异信息但并未合并印记效应的GDT方法以及合并了印记效应但仅利用了家系内一级亲属对基因型差异信息的MCPDTI方法的检验效能来说明两种方法的优势。真实数据运用方面,将新提出的方法运用于来自北美的类风湿关节炎的基因数据。
  (3)对于完整的家系数据,将母亲的基因型得分纳入回归模型中,并提出同时合并印记效应和母体效应的广义不平衡检验(GDTIM)。对于存在基因型缺失的家系数据,提出MCGDTIM方法。此方法基于给定的或者根据观测到的奠基者的基因型信息来估计人群中等位基因频率,并使用MC重抽样方法反推家系中缺失的基因型。通过模拟出的第一类错误率来评价GDTIM和MCGDTIM方法的有效性,并基于检验效能的差异来说明GDTIM和MCGDTIM方法的优势。
  结果:
  (1)在不同的样本量、基因型缺失和多种家系结构等情况下,对所提出的MCGDT方法进行模拟研究。模拟结果显示,在没有关联的原假设情况下,MCGDT方法能够很好地控制第一类错误率。同时,MCGDT方法能够捕获大部分缺失基因型信息。
  (2)在不同的样本量、基因型缺失、家系结构和遗传印记效应模型等情况下,对所提出的方法进行模拟研究。模拟结果显示,在没有关联和没有遗传印记效应的原假设情况下,GDTI、MCGDTI和MCGDT都能够很好地控制第一类错误率。检验效能的模拟结果表明,在遗传印记效应存在的情况下(完全遗传印记效应模型和不完全遗传印记效应模型),GDTI和MCGDTI方法的检验效能明显比现有方法高。当遗传印记效应不存在时,GDTI和MCGDTI方法的检验效能与GDT方法的检验效能很接近但仍比MCPDTI方法检验效能高。真实数据分析结果表明,与现有方法相比,MCGDTI方法能够识别出更多与类风湿关节炎存在统计学意义上关联的位点。
  (3)基于遗传印记效应与母体效应(存在和不存在)的不同组合、不同的样本量、多种家系结构及疾病类型(常见疾病和罕见疾病),对所提出的方法进行模拟研究。研究结果显示,当没有关联、没有遗传印记效应和没有母体效应时,新提出的GDTIM和MCGDTIM方法能够很好地控制第一类错误率。检验效能的模拟结果表明,在两种表观遗传学现象都存在或者仅有母体效应存在情况下,本研究提出的GDTIM和MCGDTIM方法在检验效能上有较明显的优势。当遗传印记效应存在而母体效应不存在时,虽然MCGDTIM方法的检验效能与MCGDTI方法的检验效能很接近,但是与MCGDT方法的检验效能相比,MCGDTIM方法的检验效能高很多。在两种表观遗传学现象均不存在时,MCGDTIM和MCGDTI方法均有与GDT很接近的检验效能。
  结论:
  (1)为了能够将GDT应用于某些个体基因型缺失的不完整家系数据,使用MC重抽样方法对GDT进行推广,并提出了MCGDT方法。模拟结果说明,MCGDT能够反推出大部分的缺失信息。因此,在实际应用中推荐使用MCGDT。
  (2)本研究通过将个体的基因型得分分解为来自父亲等位基因得分与来自母亲等位基因得分之和的形式,将遗传印记效应信息合并到关联分析中。与仅使用家系内一级亲属对基因型差异信息的MCPDTI方法相比,GDTI方法充分使用了家系中所有亲属对基因型差异的信息,因而有更高的检验效能。针对不完整家系数据,通过使用MC重抽样方法对GDTI进行了推广,并提出MCGDTI方法。模拟结果说明,由于合并了遗传印记效应的信息,GDTI和MCGDTI比现有方法拥有更高的检验效能。类风湿关节炎数据的分析进一步说明MCGDTI比其他方法更有优势。因此,GDTI和MCGDTI有更强的实用性。
  (3)在本研究中,将遗传印记效应和母体效应同时合并到GDT过程中,并提出GDTIM方法。在合并遗传印记效应信息时,采取与GDTI相同的处理方式,根据等位基因来自父亲还是来自母亲对个体基因型得分进行分解,并定义了新的等位基因得分。在合并母体效应信息时,选择将个体母亲基因型得分纳入模型中。针对家系中出现某些个体基因型缺失的情况,根据MC过程对GDTIM方法进一步推广,并提出了MCGDTIM方法。模拟结果显示,在没有关联、没有遗传印记效应和没有母体效应的原假设下,GDTIM方法和MCGDTIM方法能够很好地控制第一类错误率。在遗传印记效应和母体效应均存在的情况下或者仅有母体效应存在的情况下,由于合并了遗传印记效应和母体效应并使用所有亲属对基因型差异信息,所以在所有检验的关联分析方法中MCGDTIM方法有最高的检验效能。同时,模拟研究也说明,MCGDTIM方法更适用于不完整家系数据。在遗传印记效应存在而母体效应不存在时,相对仅合并了印记效应的MCGDTI方法,MCGTIM方法合并了并不存在的母体效应信息,所以MCGDTIM方法的检验效能较低。但是,与MCGDT方法相比,MCGDTIM方法合并了正确的遗传印记效应信息,因此其检验效能比较高。当两种表观遗传学现象均不存在时,MCGDT方法有更高的检验效能。
[博士论文] 李波漩
遗传学 山东大学 2017(学位年度)
摘要:白藜芦醇主要存在于葡萄和红葡萄酒中,也存在于其他植物及果实中,例如花生,蔓越橘,开心果,蓝莓和越桔。现在已经有这种化合物的纯化制剂和膳食补充剂。白藜芦醇具有广泛的益处,包括抗衰老,抗血小板聚集,抗氧化,抗炎,降血糖和抗癌。
  白藜芦醇抗衰老的作用引起广泛的关注。已有研究表明白藜芦醇的抗氧化性和激活SIRT1的功能可能介导了其抗衰老的作用。从线虫到哺乳动物,都有关于白藜芦醇抗衰老作用的报道。但是近年来也有研究证明白藜芦醇可以通过升高活性氧(ROS)和诱导DNA损伤导致肿瘤细胞衰老,所以白藜芦醇在细胞水平上的促衰老或抗衰老的作用及其机制还不完全明确。
  关于白藜芦醇抗氧化和促氧化的作用存在争议。经典的观点认为白藜芦醇是一个强大的抗氧化剂,由于其能减少ROS的产生和上调抗氧化系统的功能,包括还原型谷胱甘肽和超氧化物歧化酶。然而,对癌细胞的研究发现,白藜芦醇还能破坏细胞抗氧化系统,导致氧化压力增加,进而抑制细胞增殖或引起细胞凋亡。另外,有研究显示白藜芦醇通过诱导ROS的产生导致内皮细胞的早衰。我们对白藜芦醇如何导致这种“氧化二元性”的机制知之甚少。
  另外有很多研究表明白藜芦醇通过抑制NF-κB和NLRP3发挥抗炎的作用,预防很多疾病的发生。但是也有研究表明白藜芦醇通过ERK,p38和Akt信号通路上调Ⅱ型胶原和COX-2表达,具有促炎的作用。白藜芦醇是如何发挥促炎作用的及抗炎和促炎之间的决定因素还不清楚。炎症和氧化应激是密切相关的病理生理过程,都参与许多慢性疾病的发生。白藜芦醇的促氧化和促炎效应之间如何关联也不明确。
  以上研究表明白藜芦醇具有抗衰老和促衰老、抗氧化和促氧化及抗炎和促炎的作用。我们以U2OS成骨肉瘤细胞为主要模型,研究了白藜芦醇诱导细胞衰老的作用及机制,得到以下五部分结果:
  第一部分白藜芦醇诱导细胞S期停滞、DNA损伤应答及细胞的衰老
  许多研究表明白藜芦醇具有抗肿瘤的作用。在本部分结果中我们检测了白藜芦醇对U2OS细胞的毒性效应。MTT实验结果显示白藜芦能抑制U2OS细胞的增殖,并具有浓度依赖性。流式细胞术检测表明经白藜芦醇处理的U2OS细胞,S期比例数明显升高(S期停滞),说明存在复制压力。我们检测了双链断裂的标志物γ-H2AX,结果发现白藜芦醇导致了DNA损伤,呈剂量依赖性。同时白藜芦醇激活了DNA损伤应答的主要调控蛋白ATM,此外复制压力的标志Chk1磷酸化也升高了。白藜芦醇长时间处理U2OS细胞能导致U2OS细胞衰老,而且衰老的细胞依然是S期比例数较高。但是只有高浓度白藜芦醇(≥10μM)能诱导U2OS细胞S期停滞和细胞衰老,低浓度的白藜芦醇没有这种作用。为了证明白藜芦醇诱导肿瘤细胞衰老这一现象的普遍性,我们用不同浓度的白藜芦醇处理人正常的成纤维细胞(NHF)和人的肺癌细胞(A549),结果和U2OS细胞中的结果一致,表明白藜芦诱导肿瘤细胞衰老的现象是普遍的。此外白藜芦醇还能部分缓解H2O2诱导的U2OS和NHF的衰老,说明在不同的实验条件下白藜芦醇诱导衰老或抑制衰老的作用是不同的。
  第二部分复制压力和氧化压力在白藜芦醇诱导细胞衰老中的作用及相互关系
  白藜芦醇被报道作为核糖核苷酸还原酶的抑制剂起作用,其比羟基脲(一种常用的复制压力诱导剂)更有效地抑制小鼠核糖核苷酸还原酶的活性。第一部分的实验结果显示白藜芦醇确实引起了较明显的复制压力。已经有研究证明原癌基因诱导的细胞衰老是由复制压力介导并被外源性的核苷拯救。为检验白藜芦醇诱导的细胞衰老是否由复制压力介导,我们检测了外源核苷对细胞衰老的拯救效应。我们用核苷和白藜芦醇共同处理U2OS细胞,结果表明核苷能减少白藜芦醇导致的DNA损伤,并且5-乙炔基-2’-脱氧尿嘧啶核苷EdU(5-Ethynyl-2’-deoxyuridine)掺入实验表明核苷能缓解白藜芦醇导致的复制压力。同时,核苷降低了p-p53的蛋白水平。更重要的是核苷缓解了白藜芦醇导致的U2OS细胞的衰老,而且在A549和HT1080另外两种细胞中得到一致的结果。以上结果表明复制压力部分介导了白藜芦醇诱导的肿瘤细胞衰老。
  有研究表明氧化压力在白藜芦醇诱导的结肠癌和内皮细胞衰老中起很重要的作用。为了验证氧化压力在白藜芦醇诱导的U2OS细胞衰老中的作用,用白藜芦醇处理U2OS细胞,流式检测ROS水平,结果白藜芦醇明显升高了ROS水平。更重要的是活性氧清除剂N-乙酰半胱氨酸(N-acetylcysteine,NAC)能缓解白藜芦醇诱导的细胞衰老。因此,氧化压力也介导了白藜芦醇诱导的U2OS细胞的衰老。既然氧化压力和复制压力都能介导白藜芦醇诱导的细胞的衰老,我们下一步研究了这两种压力之间的相互关系及它们介导细胞衰老的相对贡献。从时间上来看,白藜芦醇处理U2OS细胞12小时已经出现了S期停滞,而ROS水平在白藜芦醇处理36小时才检测到明显的升高。此外,NAC和白藜芦醇共处理U2OS细胞24小时并不能缓解其诱导的S期停滞,只有在共处理72小时的时候S期停滞才有明显的缓解。我们在HT1080细胞中得到了类似的结果。以上实验表明S期停滞的发生先于ROS水平的升高。
  之前有研究表明白藜芦醇通过上调NADPH氧化酶NOX1/4来诱导人内皮细胞的衰老。我们用NOX1/4的特异性抑制剂GKT137831(GKT)与白藜芦醇共处理,结果GKT部分缓解了白藜芦醇诱导的U2OS细胞的ROS水平的升高。RT-PCR检测白藜芦醇处理不同时间的NADPH氧化酶的表达水平,NOX1的mRNA水平在处理48小时明显的升高,NOX4水平没有升高,NOX2、NOX3、NOX5的水平在处理48小时有一定的升高。为了明确白藜芦醇诱导的氧化压力是否依赖于复制压力,我们用血清饥饿法处理NHF细胞48小时(此时大部分细胞都处于G0/G1期),然后再用白藜芦醇处理48小时ROS水平依然升高,表明ROS水平的升高并不依赖S期停滞或复制压力。然而NAC能部分缓解S期停滞,表明虽然ROS的升高晚于S期停滞,但是ROS的升高加强并维持了白藜芦醇导致的S期的停滞。我们也检测了存在其他氧化压力条件下白藜芦醇对ROS水平的影响,发现经H2O2处理的U2OS细胞中,白藜芦醇能部分降低H2O2导致的ROS水平的升高。在NHF细胞中的到了类似的结果,表明白藜芦醇发挥促氧化或抗氧化作用取决于实验条件。
  第三部分 P53依赖的CXCR2上调介导细胞衰老并且具有抗凋亡的作用
  我们之前的研究证明p53-CXCR2通路在压力诱导的NHF细胞和U2OS细胞衰老中起重要作用。因此我们猜想CXCR2上调也可能介导了白藜芦醇诱导U2OS细胞的衰老。经白藜芦醇处理的U2OS细胞, CXCR2表达明显升高,并具有浓度依赖性和时间依赖性。但是CXCR2水平的升高在第五天达到高峰随后又下降,p21和CXCR2有类似的趋势,说明衰老一旦形成只需要少量的效应蛋白维持即可。另外白藜芦醇能缓解H2O2导致的CXCR2水平的升高。CXCR2的表达上调依赖p53;敲除CXCR2后白藜芦醇诱导的U2OS细胞的衰老明显得到了缓解。以上结果表明p53-CXCR2通路在白藜芦醇诱导的细胞衰老中起到重要作用。
  我们发现敲低CXCR2后白藜芦醇处理组与对照相比凋亡比例明显增加,抗凋亡蛋白BCL-2水平也部分下调。当CXCR2被敲低以后,H2O2诱导的U2OS细胞和NHF细胞的凋亡比例也明显增加。以上结果表明CXCR2具有促衰老抗凋亡的作用。
  第四部分 NF-kB激活发挥抗凋亡促衰老作用
  之前有很多研究表明白藜芦醇通过抑制NF-κB和NLRP3的活性发挥抗炎作用减少体内炎症反应。但是也有研究显示白藜芦醇可通过ERK,p38和Akt信号通路上调Ⅱ型胶原和COX-2表达,发挥促炎的作用。我们发现50μM白藜芦醇可以升高U2OS细胞内IL-6、IL-8、IL-1β和COX-2 mRNA水平,说明白藜芦醇可以导致U2OS细胞内炎症水平升高。我们还发现NAC可以缓解白藜芦醇导致的U2OS细胞内IL-8和IL-1β mRNA水平升高,说明氧化压力介导了白藜芦醇诱导炎症的产生。另外白藜芦醇可以诱导p-p65蛋白水平升高,NF-κB抑制剂可以部分缓解白藜芦醇导致的炎症因子水平的升高,说明白藜芦醇诱导炎症产生部分是通过NF-κB通路介导的。更重要的是NF-κB被抑制后凋亡比例数明显的增加,说明NF-κB在白藜芦醇诱导的细胞衰老过程中发挥抗凋亡的作用。另外白藜芦醇可以激活NF-κB,NF-κB抑制剂可以部分缓解白藜芦醇导致的炎症因子水平的升高。我们还研究了NF-κB的抗凋亡作用,发现白藜芦醇处理后BCL2等抗凋亡因子的表达上调被NF-κB抑制剂抑制,说明白藜芦醇通可能过激活NF-κB发挥抗凋亡和促衰老作用。
[硕士论文] 邹绮蕾
公共卫生(生物统计) 南方医科大学 2017(学位年度)
摘要:背景:
  关联分析(association analysis)是用来检验等位基因频率或基因型频率在两组个体(患病人群和正常人群)之间是否存在差异的方法。其主要目的是为了定位疾病位点,利用疾病位点和标记位点的关系来找到遗传变异。如果标记位点和疾病位点之间的距离很接近,它们可能存在连锁不平衡(linkage disequilibrium),那么这两个位点很有可能是共同遗传给后代的。如果在患病的人群中这个标记位点的频率比正常人群的高,利用关联分析方法就可能将该疾病位点进行定位。
  遗传印记效应(genomic imprinting)是熟知的一种病因学因素。遗传印记基因的表达取决于等位基因是来自父亲还是来自母亲,而这种现象可能会导致疾病和基因之间的关联。遗传印记现象会影响后代在子宫内的发育以及出生后个体的成长发育。与常染色体上变异的遗传印记作用有关的疾病有:Beckwith-Wiedemann综合征、Prader-Will综合征、Angelman综合征、糖尿病和精神分裂症等。另外,X染色体上的印记基因在复杂疾病和性状的形成上也许起到了关键的作用,如Turner综合征和孤独症等。目前已经有很多方法可以用来检验基于核心家庭和一般家系常染色体上的遗传印记效应。有关X染色体上印记效应的检验,仅仅有最近新提出的基于核心家庭数据的X染色体质量性状位点上的亲代不对称检验方法(parental-asymmetry test on X chromosome,XPAT)。然而该方法并不适用于一般的家系数据。
  X染色体失活(X chromosome inactivation,XCI)是一种剂量补偿(dose compensation)的机制,通常发生在胚胎发育早期,女性的两条X染色体中的一条发生了失活现象,从而导致女性个体的每一个细胞中,只有一条来自父亲或者母亲的染色体表达。通常,这种X染色体失活的现象是随机的,即女性的两条X染色体失活的比例是50%∶50%。但是,如果失活现象不是随机的,那就称之为偏倚失活(skewed X chromosome inactivation)。偏倚失活通常意味着有75%或以上的细胞失活同一条X染色体,而另外25%的细胞失活另一条X染色体。另外,跟常染色体一样,X染色体还存在着一种特殊现象就是逃逸失活(escape from X chromosome inactivation)的情况,即两条X染色体均表达,没有失活。在一些女性个体中的某一条X染色体上,大概有四分之三的基因是沉默了的,其余四分之一的基因属于逃逸失活区域。然而,现有的X染色体上的关联分析方法中,仅考虑了X染色体失活,并没有合并遗传印记的效应。
  目的:
  本文的研究目的主要有以下两点:(1)基于家系数据,提出X染色体质量性状位点上遗传印记效应检验方法;(2)基于两代人的病例对照数据,提出同时合并X染色体失活和印记效应的关联分析方法。
  方法:
  (1)考虑X染色体上的位点,参考常染色体上的PPAT方法,利用家系中所有有信息的核心家庭,当感兴趣的SNP位点与疾病之间存在关联的情况下,提出基于家系数据的X染色体亲代不对称检验方法(pedigree parental-asymmetry test on X chromosome,XPPAT)。当某些家系中存在缺失基因型个体时,根据观察到的个体基因型,采用Monte Carlo重抽样方法对缺失个体的基因型进行反推,进一步提出基于家系数据的X染色体Monte Carlo亲代不对称检验方法(Monte Carlo pedigree parental-asymmetry test on X chromosome,XMCPPAT)。通过模拟得到所提出方法的第一类错误率和检验效能。最后,通过一个来自北美的类风湿关节炎基因数据对新提出方法进行实例验证。
  (2)参考Wang等人提出的最大化似然比的检验方法,针对不同的X染色体失活模式(随机失活、偏倚失活和逃逸失活),将一个个体来自父亲和母亲的等位基因分别进行赋值。对女性的等位基因进行赋值时,用r∈[0,2]来衡量X染色体失活的偏倚程度,然后通过男性的等位基因赋值来体现X染色体是否失活。而这种赋值方式的效应量可以体现印记效应是否存在。这样可以将X染色体失活和遗传印记效应的信息同时合并到Logistic回归模型中。对不同的r值,得到不同的LR值,记为LRr。取LRr的最大值作为检验统计量,注意到其在无关联的原假设下的分布未知。所以,还采用了一种permutation的方法得到新提出方法的经验P值进行统计推断。相应的方法记为XCII方法(association test incorporating X chromosome inactivation and imprinting effects)。通过模拟得到所提出方法的第一类错误率和检验效能。
  结果:
  (1)在不同的模拟背景下,包括两种不同的样本量、两组不同的等位基因频率、三种不同的近交系数和五种不同的遗传印记效应模型,模拟结果表明所提出的方法可以很好地控制第一类错误率。并且,新方法的检验效能比现有的XPAT方法要高出很多。通过Monte Carlo重抽样方法对缺失基因型进行反推,XMCPPAT方法在存在缺失基因型个体时能控制第一类错误率。再者,由于女性中近交系数的改变对XPPAT和XMCPPAT方法的结果几乎不产生影响,因而新提出的XPPAT和XMCPPAT方法不受女性中Hardy-Weinberg平衡律(Hardy-Weinberg equilibrium,HWE)是否成立的影响。值得注意的是,对适用于缺失数据的XMCPPAT方法,采用了三种方式对等位基因频率进行处理,包括:真实的等位基因频率、由女性奠基者估算出的等位基因频率和由男性奠基者估算出的等位基因频率,将统计量分别记为XMCPPATt、XMCPPATf和XMCPPATm。另外,基于完整数据,用XPPATfull进行检验,作为所有方法的金标准。从结果上看,应用女性奠基者估算出的等位基因频率的XMCPPATf方法与基于完整数据的XPPATfull方法以及基于真实的等位基因频率的XMCPPATt方法检验效能很接近。这意味着,XMCPPATt和XMCPPATf方法可以捕获大部分缺失基因型个体的信息。然而,XMCPPATm不能很好地控制第一类错误率。
  (2)模拟结果表明,XCII方法可以将第一类错误率稳定在设定的显著性水平附近,说明了XCII方法用以检验合并X染色体失活与印记效应信息的位点与疾病之间关联的有效性。在检验效能方面,当X染色体失活和遗传印记效应同时存在时,XCII方法的检验效能整体上比Wang的方法高。当仅有X染色体失活而印记效应不存在时,XCII方法的检验效能仍比Wang的方法高。因此,考虑X染色体上的关联分析研究时,更推荐使用第三章新提出的XCII方法。
  结论:
  (1)新提出的XPPAT和XMCPPAT检验统计量可以有效地检验基于家系数据的X染色体质量性状位点上的印记效应,XMCPPAT方法比现有的方法检验效能更高,更适用于对包含缺失基因型个体的数据进行印记效应的检验。
  (2)考虑X染色体上的关联分析研究时,很多疾病同时跟X染色体失活和遗传印记效应相关联,相比只考虑X染色体失活的Wang的方法,XCII方法的表现更好。因此,推荐使用同时考虑X染色体失活和印记效应的XCII方法。
[硕士论文] 陈凤
免疫学 内蒙古医科大学 2017(学位年度)
摘要:目的:研究内蒙古地区蒙古族人群人类血小板特异性抗原1~17多态性分布情况,预测本地区血小板特异性抗原同种免疫发生的可能性,为临床进行人类血小板特异性抗原相容性输注提供实验依据并初步建立本地区蒙古族献血者血小板特异性抗原基因型别数据库。
  方法:随机选取278名健康的内蒙古蒙古族献血者,分别釆集献血者2ml全血后提取DNA,采用序列特异性引物聚合酶链式反应(SSP-PCR)方法进行人类血小板特异性抗原1~17基因分型,计算人类血小板特异性抗原基因型频率、基因频率和血小板随机输注错配概率。
  结果:本次研究中,内蒙古地区蒙古族无偿献血人群HPA-1a,2a,3a,5a,6a,15a基因频率分别为0.9442,0.9640,0.5629,0.9802,0.9532,0.5971;HPA-1b,2b,3b,5b,6b,15b基因频率分别为0.0558,0.0360,0.4371,0.0198,0.0468,0.4029;HPA-4a,7a,8a,9a,10a,11a,12a,13a,14a,16a,17a基因频率为1.0000,HPA-4b,7b,8b,9b,10b,l1b,12b,13b,14b,16b,17b未检出。由HPA-1,HPA-2,HPA-3,HPA-5,HPA-6,HPA-15引起血小板随机输注错配概率依次为0.0998,0.0670,0.3710,0.0381,0.0852,0.3654。
  结论:内蒙古地区蒙古族人群人类血小板特异性抗原1~17多态性分布显示出自身特点,HPA-3、HPA-15具有较高的遗传多态性;内蒙古地区蒙古族人群由人类血小板特异性抗原引起血小板随机输注错配概率最高的人类血小板特异性抗原为HPA-3、HPA-15。
[硕士论文] 鞠明艳
基础医学 天津医科大学 2017(学位年度)
摘要:目的:
  建立并探讨聚合酶链式反应-高分辨率熔解曲线(polymerase chain reaction and high resolution melting,PCR-HRM)分析技术筛查中国汉族人群成骨不全(osteogenesis imperfecta,OI)患者 COL1A1/COL1A2基因突变的方法。应用PCR-HRM技术筛查OI患者COL1A1/COL1A2基因突变位点,利用Sanger测序验证,并分析临床表现型与基因型的关联。
  方法:
  1.研究PCR-HRM技术的最佳反应条件,模板(DNA)浓度、PCR-HRM引物设计及引物浓度、退火温度(annealing temperature,AT)、循环数等。
  2.应用 PCR-HRM技术结合 Sanger测序对87例患者及对照者进行COL1A1/COL1A2基因筛查,有家族史的患者,也要同时进行家属的基因测序验证。对筛查结果阳性的患者进一步分析其临床表型及基因型的联系。
  3.在未用PCR-HRM技术筛查出异常的患者中,随机选取其中3例进行全基因组测序(whole-genome sequencing,WGS)分析,以确定未检测出异常的原因。
  结果:
  1.成功建立了利用PCR-HRM技术筛查COL1A1/COL1A2基因突变的方法,采用该方法筛查87例OI患者,检测出COL1A1/COL1A2基因突变44个,其中有22个新突变。COL1A1/COL1A2基因突变总检出率52.87%,COL1A1基因突变24例,COL1A2基因突变22例,两个基因突变率无显著性差异(P>0.05)。有家族史患者突变检出率高于散发病例(P<0.01)。
  2.COL1A1及COL1A2两基因突变方式以单碱基替换为主,以错义突变率最高(65.22%)。有30例患者由于COL1A1或COL1A2基因突变导致氨基酸替换,其中28例为Gly被替换(93.33%),以Gly被Ser替换为最多(46.43%)。COL1A2基因突变导致螺旋结构域中的甘氨酸被替换发生率高于COL1A1基因(P<0.01)。
  3.46例OI患者临床表型除骨折外前3位为:蓝巩膜(95.7%),四肢畸形(91.3%)及牙质形成不全(71.7%)。46例患者均无听力损伤。COL1A2基因突变患者牙质形成不全的人数、1岁之前发生骨折次数、总骨折次数高于COL1A1基因突变的患者(P<0.05)。COL1A1及COL1A2基因错义突变的患者的身高水平以中偏下为主,随着氨基酸位置的改变,这些患者的身高并未呈现特定的变化规律。
  4.经检测存在异常的患者中出现一例特殊病例,其同一外显子上显示有两处不同的突变,通过3种软件(PolyPhen,SIFT和Align GVGD)预测后显示两处突变均致病的可能性较大。
  5.在对3例患者DNA进行全基因组范围的突变扫描及相应的功能预测后,发现了两处发生在 COL1A2基因上的突变,以及一处发生在候选致病基因PAPSS2上的突变,这三处突变PCR-HRM未能筛出。
  结论:
  1.首次用优化了的 PCR-HRM技术筛查了汉族人群成骨不全患者COL1A1/COL1A2基因的突变,并证实PCR-HRM技术可实现COL1A1/COL1A2基因突变高效率、低成本的筛查。
  2.本研究筛查出22例新突变,丰富了人类胶原突变数据库。
  3.研究证实,PCR-HRM可以用于基因检测工作量大、外显子多、无突变热点的基因筛查。
  4.应用 PCR-HRM技术、Sanger测序技术证实一例成骨不全双位点突变个体,经突变功能预测,突变位点分别来自其父母,两处突变的“叠加效应”导致严重表现型。
  5.全基因组测序是防止PCR-HRM漏检的有效方法。
[硕士论文] 海溧
妇产科学 中国人民解放军空军军医大学;第四军医大学 2017(学位年度)
摘要:目的:
  比较运用NGS技术和aCGH技术进行胚胎植入前遗传学筛查的临床结局
  材料和方法:
  回顾性分析2011年12月至2016年12月在我院生殖医学中心行胚胎植入前遗传学筛查的患者的病历资料。其中,胚胎植入前遗传学筛查的临床指征为:女方高龄(年龄≥35岁);反复自然流产(≥3次);反复种植失败(≥3次)。纳入标准:(1)患者同意并接受PGS治疗;(2)患者有可用的D3卵裂期胚胎或者D5/D6囊胚期胚胎进行活检;(3)女方有双侧卵巢和正常的子宫内膜。排除标准:(1)女方生殖器官发育畸形;(2)严重子宫内膜异位症或与不孕相关的子宫内膜病变;(3)女方患有内分泌疾病,例如甲状腺功能亢进、低下等;(4)女方患有自身免疫性疾病,如系统性红斑狼疮等。根据所使用的遗传学检测分析方法的不同,将研究对象分为两组:试验组(NGS组),运用NGS技术进行胚胎植入前遗传学筛查,共41例;对照组(aCGH组),运用aCGH技术进行胚胎植入前遗传学筛查,共60例。两组患者均采用 D3卵裂球细胞或 D5/D6囊胚期滋养外胚层细胞进行活检,之后选取整倍体胚胎进行移植。比较两组患者的胚胎的非整倍体率、胚胎种植率、临床妊娠率。
  结果:
  胚胎非整倍体筛查结果:D3卵裂期胚胎的非整倍体率:NGS组与aCGH组相比,无显著性差异(66.67% vs.73.50%,p=0.495);D5/D6囊胚期胚胎的非整倍体率:NGS组与aCGH组相比,也无显著性差异(47.20%vs.42.30%,p=0.496)。临床结局: NGS组与aCGH组相比,胚胎种植率(61.50%vs.64.80%,p=0.763)、临床妊娠率(63.60%vs.71.90%,p=0.472)、多胎率(21.40%vs.46.20%,p=0.105)、异位妊娠率(0.00%vs.4.90%,p=0.400)、自然流产率(14.30%vs.22.00%,p=0.536)、活产率(54.50%vs.52.60%,p=0.897)均无显著性差异。
  结论:
  1.运用NGS技术进行胚胎植入前遗传学筛查,与传统公认有效的aCGH技术相比,可获得相同水平的临床结局。
  2.与aCGH技术相比,NGS技术对小片段染色体异常的诊断能力更强,且可检测出嵌合体胚胎。
  3.运用NGS技术进行PGS,与aCGH技术相比,还具有分辨率高、覆盖度高、动态范围广、高度自动化、检测成本低的优势。
[硕士论文] 付黎影
皮肤病与性病学 安徽医科大学 2017(学位年度)
摘要:研究背景:
  玫瑰糠疹是一种急性炎症性皮肤病,1860年由 Gilbert首次报道,全世界各地均有发病。皮损表现为躯干部及四肢近端泛发椭圆形红色斑丘疹、斑疹及斑片,呈圣诞树样分布,好发于10-35岁的青少年及青壮年,病程通常持续2-3个月。关于玫瑰糠疹的病因及发病机制,目前尚未阐明。病毒感染学说以及细胞介导的免疫学说受到十分关注。病毒感染学说认为,人类疱疹病毒6型和7型(HHV-6、HHV-7)与玫瑰糠疹的发病密切相关。而免疫学说提出,玫瑰糠疹是一种细胞介导的免疫性疾病。
  1985年,Aiba和 Tagami进行玫瑰糠疹的组织病理学检查,结果显示,表皮内单一核细胞浸润,真皮浅层血管周大量辅助性 T淋巴细胞浸润,朗格汉斯细胞增多。此外,这些细胞及角质形成细胞表面有HLA-DR抗原的表达。Yoshiike等研究发现,在玫瑰糠疹患者外周血中T淋巴细胞表面HLA-DR抗原的表达增多,但随着疾病的恢复,其表达逐渐下降直至恢复正常。Sugiura等研究显示,玫瑰糠疹患者皮损中CD1a+细胞、浸润淋巴细胞的数目以及CD4+/CD8+浸润细胞比例的变化都与疾病的阶段及皮损的严重程度呈正相关。Neoh等研究显示,玫瑰糠疹患者皮损中朗格汉斯细胞、CD4+/CD8+浸润细胞比例增加,没有检测到活性 B细胞和 NK细胞。Gangemi等和Drago等分别对玫瑰糠疹患者进行血清细胞因子检测研究,结果发现患者血清中趋化因子、IL-22、 IL-17、IFN-γ、VEGF及IP-10水平升高。然而我们既往研究发现玫瑰糠患者血清中IFN-γ水平降低。
  关于玫瑰糠疹与HLA等位基因及单倍型之间相关性研究甚少。2006年Miranda等对30例非裔巴西玫瑰糠疹患者和45例正常对照进行HLA等位基因检测,结果发现HLA-DQB1*04(RR=4.00,95% CI=1.20–13.28,P=0.018)在病例组的阳性率(33.3%)明显高于正常对照(11.1%),表明HLA-DQB1*04与巴西玫瑰糠疹的发病相关。目前尚未有关于中国人玫瑰糠疹与 HLA等位基因及单倍型之间的相关性研究。
  研究目的:
  该课题旨在探讨 HLA-Ⅱ类基因与玫瑰糠疹之间的相关性,证实玫瑰糠疹的免疫学发病机制。
  实验材料与方法:
  采用病例-对照研究,收集55例玫瑰糠疹患者和90例正常对照血样,提取DNA,应用直接测序法(PCR-SBT)进行HLA-DRB1基因分型,应用序列特异性引物-多聚酶链反应法(PCR-SSP)进行 HLA-DQA1及 HLA-DQB1基因分型,采用卡方检验分析这些等位基因频率在玫瑰糠疹和正常对照之间有无差异。
  结果:
  结果发现,HLA-DQB1*03:03在玫瑰糠疹患者中的频率明显高于正常对照组(47.27% vs21.11%, P=0.001; RR=2.239;95%CI:1.376-3.645)。
  结论:
  研究表明,免疫系统参与玫瑰糠疹的发病过程。HLA-DQB1*03:03可能是玫瑰糠疹发病的危险因素。
[博士论文] 周丹
病理学与病理生理学 浙江大学 2017(学位年度)
摘要:代谢综合征是一组代谢指标异常症侯群,主要表现为中心性肥胖、高血压和糖脂代谢紊乱。研究表明,代谢综合征会增加心脑血管疾病、糖尿病的发病风险。按中国糖尿病协会定义,2010年我国居民代谢综合征患病率达17.6%。双生子研究表明,遗传因素在代谢异常的发生中起了重要的作用。
  经典的全基因组关联研究(genome-wide association study, GWAS)已发现了一些与代谢异常相关的遗传变异,但仍存在以下两大问题:(1)已发现的位点仅能解释少量的遗传度,即存在大量丢失的遗传度(missing heritability)有待进一步探究;(2)以往研究主要关注表型相关的标签SNP(tag SNP)及与之距离最近的基因,但后续研究发现,大部分的定位信号并不通过与之距离最近的基因起作用,如现已证明,定位在FTO上的肥胖相关位点主要通过远程调控IRX3基因表达影响表型。总之,以往对GWAS定位信号的解析非常有限,多数关键基因和效应位点(causalvariant)未被找到,不利于后续功能研究。
  近些年研究发现,大部分表型相关遗传变异通过调控基因表达水平进而影响表型。若以基因表达调控作为注释,可以将全基因组的筛选范围缩小到基因表达数量性状基因座(expression Quantitative Trait Loci,eQTLs)上,提高发现表型相关位点的效率。ENCODE、GTEx、Roadmap等研究项目陆续公布了大量可用于注释遗传变异对表型调控路径中多个组学的信息,包括具有组织特异性的基因表达、DNA甲基化、组蛋白修饰、转录因子结合等。这些信息可用于进一步精确筛选表型相关遗传变异,也可用于对已知信号的重新解析。
  以往的研究主要以欧裔人群为主,在我国汉族人群中的研究还很有限,由于不同人种间存在遗传背景的差异,欧裔人群的研究结果不能直接外推至中国汉族人群。为了系统地探索代谢综合征及代谢组分相关的遗传易感位点,本研究以我国汉族人群为主要研究对象,通过基于多组学注释的全基因组关联分析,发现并解析代谢异常相关的遗传变异。研究内容分为三个部分(图1):
  第一部分采用经典的全基因组关联分析策略,筛选与代谢综合征及代谢组分关联信号最强的遗传变异位点并进行多阶段验证、功能分析和基因环境交互效应分析。
  第二部分在第一部分研究的基础上,通过对转录调控的注释,进一步筛选与糖脂代谢相关的遗传变异,通过精细定位和功能实验,解析基本调控路径。
  第三部分针对已知的糖脂代谢关联信号,利用最新的多组学注释信息对信号区域进行系统化的重解析,探究关键的调控基因,为关联分析的成果转化提供支持。
  图1研究内容示意图左上侧图为课题组开展的代谢综合征GWAS关联信号(P值)的曼哈顿图,图下左侧为第一部分技术路线,右侧为第二部分技术路线。右侧图为NHGRI-EBI GWAS catalog记录的表型相关的位点,为研究的第三部分,采用多组学注释,对与代谢异常相关的位点进行系统化重解析。
  第一部分代谢综合征的遗传易感性研究
  一、研究目的:
  在中国汉族人群中筛选并验证代谢综合征相关的遗传易感性位点。
  二、材料和方法:
  以单核苷酸多态性位点为遗传变异标记,首先在杭州萧山地区1742例样本中采用全基因组关联分析的方法,筛选出与代谢综合征及代谢组分关联信号最强的位点,然后对这些位点进行多阶段独立样本验证,验证样本来自我国东部、北部、东北部等多个地区,共计10978例。合并多阶段验证结果后,对达到全基因组阳性水平的位点进行功能预测、基因环境交互效应分析。
  三、研究结果:
  通过代谢综合征的全基因组关联分析及多阶段独立样本的验证,研究发现位于APOA5上的rs651821位点和位于ALDH2上亚洲人特有的高频错义突变位点rs671的基因型与代谢综合征的遗传易感性相关。在控制了APOA基因簇区域内最强信号rs651821后,位于BUD13上的rs180326位点仍然与血清甘油三酯(triglyceride,TG)水平相关(Pcombined=2.4E-08),是APOA基因簇内一个新的第二信号(secondary signal)。在整合了遗传变异位点rs651821、rs180326、血清APOA5、BUD13的蛋白水平、TG水平后分析发现,除了APOA5外,BUD13也参与了血清TG水平的调控。此外,研究发现rs671位点的多态性不仅会通过影响乙醛代谢影响人们的饮酒行为,该位点还与饮酒行为之间存在对代谢综合征及相关代谢表型的交互效应,其效应主要存在于饮酒人群中。
  四、小结:
  (1)在中国汉族人群中,rs651821(APOA5)和rs671(ALDH2)位点的基因型与代谢综合征的遗传易感性相关;
  (2) rs180326(BUD13)基因型与血清TG水平相关,其效应独立于已知位点rs651821(APOA5);
  (3) rs671(ALDH2)的基因型与饮酒行为存在交互效应。
  第二部分基于注释信息的糖脂代谢相关遗传变异筛选及精细定位
  一、研究目的:
  在第一部分研究的基础上,结合多组学注释信息,进一步筛选和验证糖脂代谢指标相关的遗传变异位点;对新发现的糖脂代谢相关遗传变异位点进行精细定位,并通过功能实验确认效应位点。
  二、材料和方法:
  首先,通过对1742例样本(同第一部分)的糖脂代谢的全基因组关联分析,得到与表型相关的但又未被第一部分验证过的遗传变异位点;然后分析这些位点与脂肪、肝脏、胰岛和骨骼肌中基因表达水平的关联,并将这些位点的信号与表型关联信号共定位,找出与糖脂代谢表型相关的eQTLs;进一步通过多阶段独立样本验证基因型与表型的关联;对验证达到全基因组阳性水平的位点,通过以基因为单位的分析策略(gene-based analyses)推测其可能的调控基因;并通过ENCODE和Roadmap计划提供的相关组织细胞中染色质状态、组蛋白修饰、转录因子结合信号推测调控活性区域及其对应的效应位点;最后构建包含不同等位基因的载体,通过荧光素酶报告基因实验确认其表达调控作用。
  三、研究结果:
  通过全基因组关联分析及eQTL的注释,发现了22个与糖脂代谢相关的遗传变异位点在特定的组织中影响基因表达,多阶段独立样本验证确认了rs1880118位点与血清HDL-C水平的关联(Pcombined=1.4E-10)。该位点可以tag的区域主要包括DAGLB和RAC1两个基因,在加性模型下,rs1880118的基因型可以解释DAGLB(diacylglycerol lipase,beta)基因在皮下脂肪组织中表达水平变异的47.7%(P=5.9E-42)。同时,通过TWAS、SMR、Sherlock等以基因为单位的研究方法,我们发现DAGLB基因与血清HDL-C水平之间存在关联,关联的P值分别为3.0E-08、1.1E-04和1.6E-06。进一步通过组蛋白信号H3K27ac、H3K4me3,H3K9ac及转录因子结合区域、DNA酶Ⅰ超敏位点的定位,找到了位于DAGLB基因5'区域的调控活性片段,荧光素酶报告基因的结果显示,该活性片段中rs4724806位点(与rs1880118位点LD r2=0.77)可能是真正的效应位点,其最小等位基因会增加转录活性,与eQTL分析的结果一致。
  四、小结:
  rs1880118是一个在中国汉族人群中新发现的与血清HDL-C水平相关的遗传变异位点,其效应位点rs4724806通过调控转录活性影响DAGLB基因表达,该部分研究提示了DAGLB基因在脂代谢中的作用。
  第三部分利用多组学注释系统解析糖脂代谢相关的遗传变异
  一、研究目的:
  结合多组学注释信息,对已知的糖脂代谢相关遗传变异信号区域进行系统的解析,探究基因型到表型的调控路径,为后续功能研究提供支持。
  二、研究方法:
  首先,整理已报道的与糖脂代谢相关的遗传变异位点;然后,利用千人基因组计划提供的位点间连锁不平衡信息,填补出所有与lead SNP高度连锁不平衡的位点用于后续的精细定位和功能预测;接着,对这些位点进行系统的多组学注释,包括基因表达、染色质状态、DNA甲基化、组蛋白修饰、转录因子结合等。对位于编码区域的遗传变异位点,再进行物种间保守性估计、翻译后修饰等翻译水平的注释;最后,整理推测出可能的基因型到表型调控路径。
  三、研究结果:
  对经筛选过滤后得到的592个糖脂代谢相关遗传变异位点进行填补后,共计17646个位点纳入后续精细定位分析(LD r2>0.5)。在转录水平,通过遗传变异与基因表达相关的注释,发现了104个在内脏脂肪、肝脏、骨骼肌或胰岛细胞中与基因表达水平相关的位点。同时,发现了一些与特定环境刺激相关的eQTLs,如rs702485位点与DAGLB基因表达的关联仅出现在LPS刺激后(Pbefore>0.05,Pafter=2.52E-16)。133个糖脂代谢相关位点与脂肪组织或胰岛细胞中的DNA甲基化相关,其中许多位点与多个CpG位点的甲基化水平相关。经过对遗传变异位点的精细定位,我们发现有49个位点可以关联(tag)到一个或以上的位于组蛋白修饰信号峰区域内的位点,且具有组织特异性。在翻译水平,有122个(r2>0.5)或43个(r2>0.8)位点可以关联到一个或以上的非同义突变位点,其中有16个位点经SIFT和Polyphen注释均提示存在影响蛋白功能的可能。对糖代谢相关位点rs1535500精细定位和功能预测后发现,该位点G到T的变异与附近7个CpG位点的存在相关联,这些位点靠近KCNK17基因5'端的CpG岛,存在影响DNA甲基化的可能。通过对胰岛细胞中多个组学的信息整合,发现该位点确实可以通过影响附近位点甲基化水平进而影响KCNK17的表达,这不同于以往报道认为该信号主要通过KCNK16起作用。
  四、小结:
  (1)通过整合多个组学信息,对糖脂代谢GWAS信号进行重新解析后发现了许多可能参与到遗传变异影响表型调控路径中的基因及调控元件。与其他复杂表型类似,经过注释后,三分之一的基因与以往对该位点报道一致。
  (2)仅有7%-20%的糖脂代谢表型相关遗传变异位点可以关联到一个或以上的非同义或无义突变,其余可能通过转录水平影响表型。
  (3)通过对糖代谢相关的位点rs1535500的精细定位,发现该位点G到T的变异与附近位点CpG位点的存在相关联,进而影响甲基化水平调控KCNK17的表达。
  结论:
  基于以上三部分内容,得出以下结论:
  (1)在中国汉族人群中,rs651821(APOA5)和rs671(ALDH2)位点的基因型与代谢综合征的遗传易感性相关;新发现的rs180326(BUD13)位点与血清TG水平的关联独立于区域内已知位点rs651821;rs671与饮酒行为存在交互效应。
  (2)结合转录调控注释信息可优化GWAS的筛选策略;rs1880118是一个在中国汉族人群中新发现的与血清HDL-C水平相关的遗传变异位点,与该位点高度连锁不平衡的rs4724806位点多态性会通过调控DAGLB基因表达影响表型。
  (3)80%以上的糖脂代谢相关位点主要通过调控转录水平影响表型;经多组学注释推测的调控基因中有三分之一与原GWAS报道的基因一致,如文献报道糖代谢相关位点rs1535500可能的调控基因为KCNK16,但注释信息提示该位点可能通过影响甲基化水平调控KCNK17的表达进而影响表型。
[博士论文] 龚红建
生物学 浙江大学 2016(学位年度)
摘要:p53家族在个体发育、肿瘤抑制与发生、细胞周期调控、细胞凋亡等方面有非常重要的作用。p53家族成员(p53、p63和p73蛋白)之间有较高的序列相似性,在DNA结合域上p73与p53蛋白有63%的相似度,p63与p53蛋白有60%的相似度,这也暗示着这三种蛋白能够结合至相同的DNA序列来转录激活同一靶基因,已有研究证明p53家族蛋白都能参与调控某些基因。著名抑癌因子p53蛋白在DNA损伤下被激活且聚集在核内转录调控相关基因,抑制细胞周期或促进细胞凋亡等从而维持基因组的稳定性。但现有研究已经证明p53却抑制DNA双链断裂修复(DSB),似乎与其抑癌功能相悖。近年来已证明p53基因可编码多种异构体,它们可以协同或拮抗p53调节下游信号通路,但对其功能和生物学意义的研究才刚刚开始。p53异构体斑马鱼Δ113p53以及其在人细胞中的同源蛋白Δ133p53缺失全部的转录激活域和部分的DNA结合结构域,保留全部的多聚体结构域,它是p53的靶基因,能特异地拮抗p53介导的细胞凋亡。有意思的是它仅被γ-射线照射激活,不被UV和热激激活,那么Δ113p53/Δ133p53是否在DNA双链断裂中起着重要的作用呢?
  本论文第一部分工作从以下两个方面探讨了这个科学问题,具体结果如下:
  1)发现Δ113p53/Δ133p53促进NHEJ、HR和SSA三种DNA DSB修复途径。首先我们观察到Δ113p53/Δ133p53只能被DNA双链断裂损伤胁迫诱导表达,然后在斑马鱼和人类细胞系中,采用NHEJ、HR和SSA三种修复分析系统,发现Δ113p53/Δ133p53对此三种修复方式都起着促进作用,并不依赖于全长p53。此种促进作用是通过提高DSB修复关键基因Lig4、Rad51以及Rad52的表达来进行的。
  2)p73协同Δ133p53促进DNA DSB修复。Δ133p53蛋白缺失转录激活结构域,却能转录激活Lig4、Rad51和Rad52的表达而不依赖于p53,那么这又是怎样发生的呢?已知p53家族之间都具有类似的寡聚化结构域,不同的异构体可能形成异源多聚体。所以我们检测在DNA DSB下p53其它家族成员的激活表达,发现p73蛋白也可以被DNA双链断裂胁迫激活,且与Δ133p53表达时期一致。进一步研究发现Δ133p53促进DNADSB修复是依赖于p73,在DNA DSB胁迫下,敲低p73会增加DNA损伤积累以及加速细胞衰老。免疫共沉淀显示它们在体内可以形成蛋白复合物。染色质免疫共沉淀揭示Δ133p53促进p73结合到修复相关基因Lig4、Rad51、Rad52基因启动子处,进而激活它们的表达,促进DNA双链断裂修复。我们首次发现了Δ133p53和p73基因在DNA双链断裂修复的作用,同时也解开了全长p53抑制DNA DSB修复的困惑。
  本论文第二部分工作是斑马鱼1号染色体22种基因敲除。CRISPR-Cas9技术的发展极大降低了大规模开展斑马鱼基因敲除的成本。为创建中国自己的斑马鱼突变体库,使国内斑马鱼同行广泛受益,同时提升中国斑马鱼领域科学家的国际影响力和话语权,中国科学家组成了大规模敲除斑马鱼1号染色体基因的联盟。在斑马鱼一号染色体整基因敲除计划中,利用CRISPR-Cas9技术,成功构建了22个基因敲除突变体。这些材料最终都会免费通过国家斑马鱼资源中心向国内外学术界公开。通过对于这些基因的逐个敲除,我们可以进一步破解这些基因的功能,从而建立各种发育与疾病模型,最终希望通过这些模型研究与人类相关的发育和疾病研究等。
[硕士论文] 梁栋
生物学(遗传学) 内蒙古科技大学 2016(学位年度)
摘要:癌症是导致人类死亡的重大疾病之一。由于环境条件和人口老龄化等因素,我国的癌症发病率逐年增加。因此,如何运用科学手段探索和防止癌症已成为生物和医学领域内的重大课题。癌症属于多基因和多通路互作导致的复杂疾病。随着基因芯片、RNA-Seq等测序技术的出现,人们可以测定多个基因的表达水平变化,从而为构建大规模生物网络提供了数据基础。通过分析基于癌症样本数据构建的生物网络,可深化认识已知的癌症致病原因;也可预测癌症发生的分子标记,从而为癌症防治措施的制定提供依据。因此,通过将基因表达谱与生物网络相结合的研究方法,探索癌症及其它复杂疾病的发生机制具有重要的生物学意义。本文基于基因芯片数据开展了人类肺癌和肾肿瘤两方面的研究工作:
  肺癌方面:首先,应用 PAM分类器筛选肺癌发生的差异表达基因,再通过 DAVID在线分析工具和 R语言的 SubpathwayMiner扩展包对差异表达基因进行 GO富集分析和亚通路富集分析,选取两种富集分析结果的共有基因作为调控肺癌发生的关键基因,最后根据正常和癌症组的差异表达基因表达数据,分别构建差异表达基因调控网络。通过分析关键基因在正常/肺癌调控网络中的调控关系变化,发现 AGTR1、CD36、CDH5和 PECAM1基因可能通过与上下游基因脱离调控关系影响细胞跨膜区域的特性,从而促进肺癌发生。
  肾肿瘤方面:应用 limma算法筛选正常组和肾肿瘤组样本的差异表达基因,再基于差异表达基因在各样本中的表达值,利用加权共表达网络分析算法构建了肾肿瘤差异表达基因的共表达网络。通过分析差异表达基因间的关联模式,选取与肾肿瘤发生关联程度最高的模块,筛选枢纽基因并对其进行 GO富集分析。综合文献调研证实PLA2R1基因通过促进细胞衰老抑制肾肿瘤的发生。
[硕士论文] 游晓平
流行病与卫生统计学 南方医科大学 2016(学位年度)
摘要:关联分析是一种通过标记位点来定位疾病位点的有用工具,在病例对照数据与家系数据中都有广泛的应用。它利用标记位点与疾病位点间的关系来定位变异基因。如果标记位点离疾病位点很近,这样会导致连锁不平衡,那么两位点同时被传递的可能性很大。于是,患病人群中该标记等位基因频率要高于或低于正常人群。所以,关联分析通过标记位点定位了疾病位点。常染色体上基于病例对照研究的关联分析通常需要Hardy-Weinberg平衡律(Hardy-Weinbergequilibrium)的假设。如果Hardy-Weinberg平衡律不成立时,基于病例对照数据的关联分析方法的第一类错误率可能会偏大。而今,X染色体上标记位点与疾病位点间关联性的检验方法研究以及Hardy-Weinberg平衡律对关联分析的影响研究越来越受到重视。然而,在X染色体上,有两个问题需要被关注:(1)对于同一个位点上的同一等位基因,男性与女性的等位基因频率是否相等;(2)女性群体中的近交系数是否为0。因此,男、女性间的等位基因频率是否有显著差异和女性中的Hardy-Weinberg平衡律是否成立经常用来筛选X染色体上连锁的变异基因。对于(1)和(2),已经有学者提出了相应的方法分别对其进行检验。然而,这些方法的第一类错误率和检验效能还没有被探讨与研究。另外,目前尚未见文献报导同时检验(1)与(2)的方法。
  印记效应(imprinting effects),也称亲源效应(parent-of-origin effects),是一种有关亲代基因的表达与否的后生现象,对研究基因对表型的影响有着非常重要作用。基因印记是一种非孟德尔遗传现象。如果后代来自父亲的等位基因没有被表达,而来自母亲的等位基因被表达,此现象称为父系印记;反过来,如果只有来自父亲的基因被表达而来自母亲的基因没有被表达,即为母系印记。存在印记效应时,两种有序杂合子基因型的外显率可能是不同的。常染色体上常见的与印记相关的疾病有:Angelman综合征、Beckwith-Wiedemann综合征、Prader-Willi综合征、肥胖症、糖尿病等。而X染色体上与印记效应相关的疾病有Turner综合征。Turner综合征只在女性个体中存在,可能是由其中一整条X染色体的缺失或者部分缺失引起。所以,印记效应的检验在研究遗传疾病方面有重要意义。常染色体上已经有很多检验印记效应的方法,但这些方法都不适用于X染色体。到目前为止,我们尚未发现X染色体上印记效应的检验方法。需要注意的是,X染色体在男、女性间的遗传是不对称的。女性有两条X染色体,一条是父系的,一条是母系的;而男性只有一条母系的X染色体。这种不对称性使得研究X染色体上印记效应检验的方法更加困难。另一方面,目前已经有很多基于家系或病例对照数据的X染色体上关联分析方法。但是,在关联存在的情况下,尚未有方法用于检验X染色体上的印记效应。
  目的:
  (1)基于X染色体上的标记位点,提出检验Hardy-Weinberg平衡律的似然比方法;(2)针对不同的核心家庭结构,提出检验印记效应的非参数方法。
  方法:
  (1)首先,基于X染色体上收集的样本,通过合并Zheng等人提出的两个检验统计量(检验男、女性间的等位基因频率是否相等(Z1)以及女性群体中的近交系数是否为0(Z2)),提出Z0统计量来同时检验(1)男性等位基因频率等于女性等位基因频率和(2)女性群体中的近交系数为0。为了提高此方法的检验效能,我们进一步提出一种新的似然比检验方法。对于X染色体上的某一个位点,首先分别写出原假设和备择假设下的似然函数。然后,用EM算法得到未知参数的最大似然估计值并且构建LRT0统计量来同时检验(1)和(2)。如果原假设被拒绝,则进一步构造两个假设检验来找到原假设被拒绝的原因。于是,提出另外两个似然比检验统计量,LRT1(检验男女性的等位基因频率是否相等)和LRT2(检验女性中近交系数是否为0)。值得注意的是,从模拟结果可以看出,LRT0和LRT2的第一类错误率偏保守。因此,我们用参数的bootstrap方法来评价LRT0和LRT2的有效性及其表现,分别记为LRT0b和LRT2b。而且,我们还探讨了群体分层对新提出方法的影响。另外,我们用均方根误和偏差来评估未知参数的最大似然估计值的估计准确性。最后,我们使用了来自北美的类风湿关节炎基因数据对新提出方法加以实例验证。
  (2)考虑在关联存在的前提下,提出X染色体上质量性状的印记效应检验方法。首先,针对父母和患病女儿组成的三联体家庭,用统计量XPAT(parental-asymmetry test on X chromosome)来检验X染色体上的印记效应。然后,基于两人家庭(父亲-女儿对或母亲-女儿对),提出检验统计量1-XPAT。通过同时考虑三联体和两人家庭,构造统计量C-XPAT来检验印记效应。更进一步地,我们把这三种方法拓展到可以纳入多个小孩且其中至少有一个患病女儿的完整家庭(家庭成员的基因信息是完整的)和不完整核心家庭(父代中父亲或母亲的基因信息缺失)。值得注意的是,因为1-XPAT统计量中需要用到等位基因频率,我们用三种方式加以处理:用真实的等位基因频率,相应的统计量记为1-XPATt;用母亲等位基因频率的估计值,相应的统计量记为1-XPATm;用父亲等位基因频率的估计值,相应的统计量记为1-XPATf。最后,我们使用了来自北美的类风湿关节炎基因数据对新提出方法加以实例验证。
  结果:
  (1)模拟结果表明,LRT0和LRT2的第一类错误率均偏保守,LRT1的第一类错误率接近显著性水平。而LRT0和LRT2经过参数的bootstrap方法校正后(LRT0b和LRT2b)能很好地控制犯第一类错误的概率。Z0,Z1和Z2也能很好地控制第一类错误率。通过不同的参数设置来比较这几个统计量的检验效能,LRT0b的检验效能比LRT0与Z0的都要高,而LRT0和Z0的检验效能很接近;LRT1和Z1的检验效能也很接近;当近交系数大于0时,LRT2b的检验效能比LRT2与Z2的都要高,且LRT2比Z2的检验效能稍微小一点。对于男性等位基因频率的估计值,不管用EM算法估计或Zheng等人的方法估计,值是一样的;对于女性等位基因频率和合并等位基因频率的估计值,不管是用EM算法估计或Zheng等人的方法估计,其均方根误和偏差都很接近。而对于近交系数的估计值,在某些情况下,虽然基于EM算法的偏差比Zheng等人的稍大,但是在所有情况下,基于EM算法的均方根误都比Zheng等人的要小。另外,群体分层模型确实会导致近交系数不为0,这跟Overall和Nichols的结论是一致的。此时基于EM算法的近交系数估计值的均数比Zheng等人的估计值稍大,但相应的标准差要小。另外,类风湿关节炎数据的分析结果表明,虽然没有找到有统计学意义的位点,但证实了新提出方法的实用性。
  (2)在不同的参数设置情况下,对新提出方法的第一类错误率和检验效能进行了模拟。模拟结果表明,XPAT在各种参数设置下的第一类错误率都在显著性水平附近;1-XPATt和1-XPATm的第一类错误率保持在显著性水平附近,但1-XPATf严重偏大。因此,在后续的模拟研究中,我们仅用母亲等位基因频率的估计值计算1-XPAT的值。通过纳入不完整核心家庭,C-XPAT的检验效能比只纳入完整核心家庭的XPAT明显要高很多。另外,不管女性群体中的近交系数是否为0,新提出方法的第一类错误率一直保持在显著性水平附近。类风湿关节炎数据的分析结果表明,虽然没有找到与印记相关的有统计学意义的位点,但证实了新提出方法的实用性。
  结论:
  (1)为了提高检验X染色体上Hardy-Weinberg平衡律的检验效能,提出了三种似然比检验方法。但由于其中有两个统计量的第一类错误率偏保守,所以我们采用参数的bootstrap方法寻找其分布的临界值。模拟结果表明,基于bootstrap方法的LRT0b和LRT2b,LRT1,Z0和之前的Z1和Z2的第一类错误率在各自的原假设下都能控制在显著性水平的附近。通过检验效能的比较,LRT0b的检验效能比LRT0和Z0都高。在近交系数大于0的情况下,LRT2b的检验效能比LRT2和Z2高很多,然而LRT2比Z2的检验效能稍微小一点。另外,在男性等位基因频率不等于女性等位基因频率的情况下,LRT1和Z1的检验效能很接近。
  (2)在X染色体上的标记位点与疾病位点存在关联的情况下,针对质量性状,提出检验印记效应的方法。首先,基于由父母和他们患病的女儿组成的三联体家庭,构建X染色体上的亲代不对称检验XPAT。然后,我们用1-XPAT来处理两人家庭(父女对或母女对)。通过同时考虑三联体家庭和两人家庭,我们用C-XPAT来检验印记效应。更进一步地,我们把这三种方法拓展到可以处理完整和不完整核心家庭,这两种核心家庭中可以包含多个女儿,但至少有一个女儿是患病的。在不同的参数设置下,我们通过模拟研究来评估新提出方法的第一类错误率和检验效能。模拟中的样本主要考虑三种不同家庭结构,这样比只考虑一种结构更加合理。模拟结果表明,在不同的参数设置下,新提出方法的第一类错误率被控制得很好。通过检验效能的比较,不论用真实等位基因频率或母亲的基因型估计的等位基因频率,C-XPAT的检验效能都比XPAT高。在此研究中,不需要女性群体中Hardy-Weinberg平衡律成立的假设,这一点已经在理论推断和模拟研究中被证实。
[硕士论文] 张俊威
计算机技术 哈尔滨工业大学 2016(学位年度)
摘要:过去十年中,全基因组关联分析(GWAS)研究提高人们对疾病遗传学的认知和理解,对于发现基因型-表型关系起到关键作用。在GWAS分析中,遗传学家依靠DNA多态性标记来检测这些关联关系。单核苷酸多态性是其中最流行的一类遗传标记,可以用来挖掘疾病的致病原因和潜在的生物机理。迄今为止,大多数遗传关联研究使用单基因位点分析策略,其中每个基因变体单独和特定的表型关联测试。但是这种策略在复杂疾病中则表现不成功,例如高血压、糖尿病和哮喘等,这是由于单位点分析忽略上位效应,有些位点仅能够通过与其他基因的相互作用而影响疾病,而该基因位点的主效应的影响非常小或者不存在,这一现象也被称为“丢失的遗传性”。研究表明,上位性是复杂的人类疾病病因中普遍存在的成分,在许多性状的遗传控制起到至关重要的作用。
  随着高通量测序技术的出现,使得研究人员能够在全基因组范围内检测上位效应,能够更好的揭露出复杂疾病潜在的遗传机理。而在全基因组范围检测上位效应所遭遇到的第一个困难和挑战是计算负担。在本文研究中,提出一种基于混合随机森林框架的预筛选模型,来选择最佳候选集合,然后在候选集合中使用MDR算法来检测上位效应。混合随机森林模型能够筛选出主效应显著的上位效应模型和主效应微弱而组合效应显著的纯上位效应。在相加模型、相乘模型、阈值模型和纯上位模型四种类型的实验中验证了我们的算法,实验结果表明该算法具有一定的实际意义。
  另外我们提出一种基于梯度提升模型的置换方法,用来检测主效应微弱的纯上位效应。所提出的置换梯度提升模型pGBM,通过移除SNP相互作用对GBM模型分类器的影响,来检测最有可能发生相互作用的SNP组合对。我们采用平均AUC差值来定义相互作用,进而将模型应用到非平衡数据集上。在实验验证中当遗传互质性大于0.01的时候,该算法的检测能力能够达到百分之百,遗传互质性取值小于0.01的时候,其检测能力也远高于pRF算法。同时采用CPU并行计算的思想,提升模型的运算速度,进而缩短计算时间。pGBM算法采用6个CPU并行计算时,要比pRF算法快4.78倍。这种方法表现出很大的潜力,通过检测基因-基因相互作用来研究潜在的遗传结构,有利于揭示复杂的疾病机制。
[硕士论文] 徐欢腾
化学生物学 厦门大学 2016(学位年度)
摘要:目前随着生活品质的改善和人类寿命的延长,许多老年疾病例如癌症成为人类常见的疾病,目前治疗癌症除了常规手段之外,一种伤害比较小的即表观遗传治疗手段逐渐被提上研究日程。
  蛋白甲基化修饰系统对于基因组精密转录至关重要。蛋白甲基化酶和去甲基化酶通过对组蛋白动态修饰调控基因转录是表观遗传学“组蛋白密码子学说”的核心内容之一,其失调会导致包括癌症在内的多种疾病的发生。众所周知基因转录也受到转录因子的精密调控,然而甲基化修饰系统如何通过以转录因子为代表的非组蛋白底物调控基因转录的模式还不完全清楚。
  YY1是一种具有多功能的转录因子。YY1在中文中俗称阴阳一号基因,是因为它既可以正向调控靶基因的表达,也可以抑制靶基因的表达。YY1作为表观遗传学上的一个重要的调控因子,其本身表达也受多种表观遗传修饰。在本文中,我们找到了一种可以甲基化YY1蛋白的酶SET7/9(蛋白赖氨酸甲基化转移酶家族成员)。在体外甲基化实验和细胞体内的实验中,我们发现SET7/9能甲基化YY1蛋白173和411位点的赖氨酸。我们的实验表明,SET7/9甲基化YY1蛋白,能影响YY1蛋白结合靶基因。YY1调控的基因(包括细胞调控因子)的表达量会发生变化,进一步影响细胞的增殖。所以我们在这一系列实验中发现了一种甲基化转移酶甲基化转录因子的模式,最终影响细胞生理活动。
[硕士论文] 陈兰芳
针灸推拿学 福建中医药大学 2016(学位年度)
摘要:目的:观察电针“长强”穴对FMR1基因敲除小鼠海马区PSD-95蛋白表达的影响。
  方法:(1)采用2对性成熟FMR1基因敲除纯合子小鼠,一雌一雄合笼繁殖。每胎幼鼠于19日龄进行分笼、采血,经PCR法基因鉴定属FMR1基因敲除小鼠后,随机分为长强组、非穴组、模型组,每组10只,共30只。长强组取长强穴,于28日龄开始干预治疗,治疗采用30号0.5寸毫针,进针0.3寸,连接电针仪,连续波,2Hz,2mA,20min,连续治疗6d为1个疗程,共2个疗程,疗程间间隔1 d;非穴组取小鼠右胁肋下缘一横指处,余操作同长强组;模型组在相同环境下饲养,不予干预。(2)所有分组于23日龄及41日龄开始行Morris水迷宫测试,46日龄取脑组织,采用免疫组化法及免疫印迹法检验PSD-95蛋白在海马区的表达;(3)实验数据采用单因素方差分析。
  结果:(1)水迷宫实验结果:①干预前逃避潜伏期分别为:长强组(59.61±7.46)s、非穴组(56.76±8.96)s、模型组(58.85±5.15)s,三组比较,无显著性差异(P>0.05);②干预后逃避潜伏期分别为:长强组(32.11±4.15)s、非穴组(47.14±6.21)s、模型组(49.50±6.87)s,长强组与非穴组、模型组比较,差异具有显著性(P<0.05);③干预前原平台象限时间/总时间分别为:长强组(0.16±0.03)、非穴组(0.18±0.04)、模型组(0.18±0.06),三组比较,无显著性差异(P>0.05);④干预后原平台象限时间/总时间分别为:长强组(0.40±0.11)、非穴组(0.32±0.08)、模型组(0.30±0.08),长强组与非穴组、模型组比较,差异具有显著性(P<0.05);(2)免疫组化法结果:干预后海马区PSD-95蛋白阳性目标平均光密度:长强组(0.21±0.02)、非穴组(0.18±0.03)、模型组(0.17±0.03),长强组与非穴组、模型组比较,差异具有显著性(P<0.05);(3)免疫印迹法结果:干预后海马区PSD-95蛋白相对体积:长强组(1.48±0.14)、非穴组(1.03±0.16)、模型组(0.96±0.11),长强组与非穴组、模型组比较,差异具有显著性(P<0.05)。
  结论:电针“长强”穴提高FMR1基因敲除小鼠学习记忆能力可能与促进海马区PSD-95蛋白表达相关。
[硕士论文] 高旭辉
眼科学 解放军总医院;军医进修学院;中国人民解放军总医院;解放军医学院 2016(学位年度)
摘要:目的:
  1.对一个X染色体连锁隐性遗传中国人先天性眼球震颤(CN)家系的临床表型以及遗传特性进行研究,提取被研究家系成员的基因组DNA,建立临床资料与血标本库。
  2.筛查本研究家系的致病基因,将参与研究的CN-HN001家系成员的基因组DNA行测序分析,定位致病突变。
  3.分析本研究CN-HN001家系的致病突变位点所引起的编码蛋白的改变。
  方法:
  1.CN-HN001家系的资料采集:采集受试者的基本信息、临床表型、遗传特征、签署知情同意书,进行详细的眼科检查,确定家系遗传方式并绘制遗传系谱图,分析整理临床资料并建档。受试成员抽取外周静脉血并进行基因组DNA提取,经纯度鉴定符合标准后再置入-80℃冰箱留存备用。
  2.采用芯片捕获高通量测序技术对CN-HN001家系先证者的DNA进行检测并比对基因组数据库中的DNA序列,从候选基因中筛查出本家系的致病基因,并对致病突变位点进行筛查。
  3.采用Sanger测序技术对先证者疑似基因的突变位点进行验证,并在家系内成员以及家系外成员中均采用Sanger测序验证。
  4.初步分析致病基因上的新突变对编码蛋白的影响。
  结果:
  1.根据遗传特征明确该研究CN-HN001家系为一个X染色体连锁隐性遗传CN家系;提取了所有受试者的基因组DNA并鉴定其纯度均达标;规范建立了家系的临床资料库及血标本库。
  2.先证者的DNA样本检测显示其在GPR143基因上第4号外显子之后的剪切区存在一个可疑致病突变,为半合子剪接突变c.360+5G>T。
  3.先证者发现的疑似致病突变行Sanger测序后证实存在。经家系内验证该突变呈现表型与基因型共分离,明确此突变为该研究CN-HN001家系的致病突变。经100个家系外正常健康人群验证均没有发现此突变位点。
  4.GPR143基因上的突变最终造成了其编码蛋白氨基酸种类发生改变,从而导致致病性。
  结论:
  1.本研究家系为一个X染色体连锁隐性遗传CN家系;家系临床资料库及血库的建立为后续研究提供了保障。
  2.本研究发现了GPR143基因在中国人CN家系中的新的突变位点剪接突变c.360+5G>T,并对此位点进行成功的定位,各基因组数据库及国内外文献均未见报道。丰富了GPR143基因的突变谱。
  (已选择0条) 清除
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

万方选题

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部