绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
万方知识发现服务平台
获取范围
  • 1 / 100
  (已选择0条) 清除 结果分析
找到 2751 条结果
[硕士论文] 李婷
教育学;教育技术学 天津师范大学 2018(学位年度)
摘要:由于生物信息学中对基因进行测序的成本大幅下降,尤其是ChIP-chip和ChIP-seq这两种测序技术的广泛使用,使得能够在很短地时间内识别出大量的转录因子的DNA序列,产生了庞大的ChIP基因数据集,这既为研究的进一步发展提供了实验依据同时也带来了很大的挑战。虽然在近几年,第三代测序技术的出现实现了每秒检测出10个碱基,读长可以达到10Kb-15Kb,但是其发展不够成熟,目前已有的数据库中的数据还是少量的,因此,本论文采用的是ChIP数据集作为研究内容。模式生物果蝇在2003年就已经完成基因组的测序,并且随着研究的进行,目前对果蝇基因的认识越来越深入,其具有繁殖速度快、基因易产生变异,产生变异的表征比较明显等特点。所以本论文使用果蝇的数据作为研究对象。
  基因的异常表达可能导致很多疾病的产生,而顺式调控模块产生异常是导致基因异常表达的主要原因,通过整合很多ChIP数据集来识别出基因组中的顺式调控模块,对于构建基因的调控网络、理解基因转录调控的分子机制、乃至理解疾病机理都有重要的意义,但是到目前为止,我们对真核生物的顺式调控模块知之甚少,那么在生物信息学学科领域中在全基因组范围内,利用从头预测的方式对真核生物预测顺式调控模块就更是少之又少。现在,生物信息学者和专家已经设计出了很多种识别顺式调控模块的工具,最常用的方法就是计算机统计的方式,目前最新的从头预测顺式调控模块的方式是DePCRM,但是该算法过于复杂,而且所预测出的顺式调控模块有很多都是假定的,不具有准确性,因此,本论文提出了一种新的研究思路,通过整合来自不同组织、细胞类型和生理阶段以及不同实验条件下的果蝇模式生物ChIP数据集研究其模体共生模式,可以实现生物物种在全基因组范围内对顺式调控模块的从头预测,运用模体发现算法FisherMP、模体相似度量法SPIC以及模体聚类算法CLIMP,通过整合顺式调控模块的各种特定信息,从头预测出果蝇的顺式调控模块。本算法在从头预测果蝇顺式调控模块上与现有的DePCRM算法进行比较,本算法在速度上和准确度上都要优于DePCRM。
[硕士论文] 田然
生物化学与分子生物学 大连医科大学 2018(学位年度)
摘要:在生物体内,维持基因组的稳定性是细胞正常生存的必要条件。然而,有许多外源因素和内源因素会造成DNA的断裂,如细胞代谢产物、UV和电离辐射等。为维持基因组的稳定性,机体进化出了高度保守的应答体系,称之为DNA损伤应答(DNA damage response,DDR)。DNA损伤应答过程包括DNA损伤位点的识别、招募DNA修复复合物到DNA损伤位点、修复受损的DNA、激活细胞周期检验点以及诱发凋亡[1],DNA损伤应答对多个细胞进程都有广泛的影响。为确保足够的时间完成精确有效的DNA损伤修复,细胞周期检验点激活并使细胞周期阻滞。同时,细胞也将激活一些基因的转录,这些基因包括DNA损伤修复和调控细胞周期相关基因。最近研究表明,不仅蛋白编码基因,非编码的基因也在维护基因组稳定性过程中起到重要作用[1-3]。其中长链非编码RNA(long non coding RNA,lncRNA)是一类由RNA聚合酶Ⅱ产生,长度大于200bp的RNA,它们的表达量低,保守性低,且具有组织特异性。当DNA损伤后,DDR相关lncRNA会在转录水平、转录后水平以及RNA降解水平被调控。同样的,lncRNA也可以靶向DDR相关的基因调控其表达。lncRNA可以作为信号、诱饵、导引、支架调控基因表达。近几年来,虽然已经在lncRNA维护基因组稳定性方面做过很多研究,识别了许多参与DNA损伤应答的lncRNA,但lncRNA如何参与DNA损伤应答以及它们的应答机制仍然是未知的。
  在来自清华大学高冠军教授实验室的大力支持下,获得了43株lncRNA敲除的果蝇株。为研究参与DNA损伤应答的lncRNA,采用在辐照后统计生存率和染色体断裂数目的方法,对43株lncRNA敲除果蝇株进行了DNA损伤敏感性的检测,获得了12株具有DNA损伤敏感性的IncRNA敲除果蝇株,初步认为这12个lncRNA可能参与DNA损伤应答。为系统性的筛选出更多参与DNA损伤应答的lncRNA,采用了高通量测序技术,使用野生型w1118果蝇、p53突变果蝇、e2f1突变果蝇的三期幼虫,在生理条件和辐照条件下,获得了242个差异表达的lncRNA。此外,在43株IncRNA敲除果蝇株里面,CR43356在RNA测序结果中出现了差异表达。DNA损伤敏感性检测实验表明,CR43356敲除果蝇株对DNA损伤高度敏感。通过查找FlyBase网站信息,发现CR43356主要在果蝇三期幼虫的翅膀胚芽组织中表达。为进一步探究CR43356参与DNA损伤应答的机制,对CR43356果蝇进行了G2/M检验点检测和凋亡检测,结果发现CR43356参与DNA损伤应答通路中凋亡调控过程。
[硕士论文] 汤玲
生物化学与分子生物学 安徽大学 2018(学位年度)
摘要:胚胎干细胞(Embryonic stem cell,ESC)是一种从囊胚时期内细胞团(Inner cell mass,ICM)中经分离培养的具有多潜能性的细胞。自我更新(Self-renewal)和多向分化(Differentiation)是其重要的两大生物学性质。因此,它已成为筛选药物和制造疾病动物模型的有力工具之一。小鼠胚胎干细胞(Mouse embryonic stem cells,mESCs)自1981年成功建系以来,就已经成为研究者应用最多的理想实验模型之一,近些年的不断探索发现,胚胎干细胞的广泛应用为我们研究哺乳动物胚胎发育机制、细胞组织的定向分化提供了广泛的思路,也为医学和生物学的研究发展做出了巨大贡献。
  目前,mESCs自我更新性质的维持可通过两种方法培养,其中比较经典的是LIF/Serum的培养条件。我们将LIF(Leukemia inhibitor factor)这种白血病抑制因子添加到培养液中后,会激活LIF介导的信号通路,从而活化这条信号转导系统中的一系列基因,它们共同发挥作用将mESCs维持在自我更新的状态,并具有保持其多向分化的能力。有文献报道,Sp5是LW/STAT3信号通路中STAT3下游的直接靶基因,在无LIF的培养条件下,上调Sp5的表达可以将mESCs维持在不分化的状态,但Sp5是怎样发挥这项功能的,到目前为止,还不清楚。所以,为了进一步探究Sp5维持mESCs未分化的具体分子机制,完善这条信号转导通路,使人们更好的理解mESCs自我更新与分化的关系,我们研究方向就明确了。本实验主要分两大部分进行:其一,筛选Sp5下游的直接靶基因;其二,对筛选的靶基因和Sp5自身的结构展开一系列的功能性验证实验。
  首先,为了筛选出这些基因,我们利用PiggyBac(PB)载体成功构建了带有HA标签的过表达Sp5(PB-Sp5)的46C细胞系。因为之前有文献报道,过表达Klf2/4/5,Nanog,Gbx2,c-Myc,Tfcp2l1,Tbx3基因[9-20],可以在无LIF的培养条件下维持mESCs自我更新,为了探究Sp5是否通过这些基因将mESCs维持在不分化的状态,在过表达Sp5的实验组及其对照组的mESCs中,我们用qRT-PCR在转录水平上分别检测以上基因的相对表达量,结果显示Nanog和Klf2的表达量明显升高。为了进一步确定Sp5的候选基因,我们又构建了Sp5敲低和敲除细胞系,同样用qRT-PCR在转录水平上检测Nanog和Klf2的表达量,最终确定Nanog是Sp5的靶基因。除此之外,结合染色质免疫共沉淀和双荧光素酶报告系统实验显示,Sp5直接调控Nanog的启动子。
  紧接着我们做了一系列的功能性验证实验。看看Sp5到底是不是通过Nanog发挥其维持mESCs自我更新作用的。首先,我们检测Nanog的下调是否对Sp5维持mESCs自我更新的能力产生影响。我们在上调Sp5的细胞系中下调Nanog,将其置于没有LIF的培养基下培养8天,结果发现:(1)没有下调Nanog的对照组细胞能维持较好的干细胞形态,有较高的碱性磷酸酶活性,且高表达胚胎干细胞标志性因子OCT4和SSEA1,而下调Nanog的实验组细胞则分化了。(2)实验组相比较对照组,高表达和分化相关基因,低表达和自我更新相关基因。这些结果都表明:Sp5是通过调控Nanog的表达来维持mESCs不分化形态,换句话说,下调Nanog会损害Sp5维持mESCs自我更新的能力。
  Sp5除了通过调控Nanog的表达发挥功能外,其自身的Zn指结构可能对其发挥作用也产生影响。因为Sp5C端含有3个保守的类似于KLF家族的Zn指结构[21,22]。研究表明,KLF家族(Klf2/4/5)的3个Zn指结构对其维持mESCs自我更新的功能至关重要[23,24],缺失其中任何一个Zn指结构都会影响其发挥功能。于是我们就猜想Sp5的3个Zn指结构是否也具有和KLF家族中(Klf2/4/5)相类似的功能呢?为了验证这个猜想,我们用Over-lap PCR分别构建了缺失不同Zn指结构过表达Sp5的缺失突变体细胞系,在无LIF的培养条件下培养时显示:和过表达野生型的Sp5的细胞比较,(1)缺失突变组产生较少的典型胚胎干细胞及AP阳性克隆数。(2)Nanog表达量相对减少。这些结果均说明:3个Zn指结构对于维持完整的Sp5活性至关重要,缺失其中任何一个Zn指结构都会削弱Sp5发挥其维持mESCs自我更新的能力。
  我们的研究结果表明,Nanog是Sp5下游的直接靶基因,Sp5通过Nanog和自身的Zn指结构发挥其维持mESCs自我更新的功能。实验结果扩大了人们对维持mESCs多能性调控网络的认识,有利于后面的科研工作者对其进一步展开研究。
[硕士论文] 周文
概率论与数理统计 华中师范大学 2018(学位年度)
摘要:在基因与疾病的关联分析中,一个较普遍的做法是讨论单个疾病与基因的关系,实际上由于代表疾病的各种性状之间具有一些相关性以及基因本身的基因多效性,使得同时检验一些性状的基因关联性变得有意义,并且与考察单个性状相比具有更好的检验功效.在这个领域的研究中,不少学者研究的都是具有相关关系的定量性状或者定量性状与定性性状与基因的同时关联分析.本文单单讨论二元的二分表现型的基因关联分析,在三种模型下研究多个疾病与基因的关系.第一种模型是传统的logistic回归模型,在考虑单个定性性状和基因的关系基础上,通过联立得分函数构造检验统计量完成多个性状与单个基因的关联检测;第二种模型假定存在与定性性状相关的潜在的连续型变量,使得定性变量的取值由连续型变量决定,通过讨论该连续型变量与基因的关系来研究定性变量与基因的关系,由于这些连续型变量的相关性使得同时关联检测比单个关联检测有意义的多.第三种模型基于条件分布的概念,假设多个定性性状的某一个性状与其余性状和基因一起具有logistic线性关系,这样多个性状的概率分布可以方便给出,从而大大简化模型,提高检验功效.
  文章的第一部分介绍基因关联检测的研究背景和研究意义,并给出已有的参考文献中关于基因关联检测的检验方法,分别从基因位点和性状两个方面出发介绍;文章的第二部分考察两个二分变量和单个基因的同时关联分析,提出了三种模型,并在每种模型下都给出检验方法,理论上证明了这些方法的合理性并给出检验统计量;文章的第三部分通过计算机模拟分别验证三种检验方法是否能控制第一类错误,并比较在不同的数值模拟参数下三种检验方法的检验功效,给出三种检验方法的优劣;文章的第四部分对模拟结果进行分析,给出结论:三种检验模型中潜在正态模型的检验功效最高但可操作性不大,条件线性模型功效次之,但当人群中只患某种疾病的概率远小于同时患两种疾病的概率时条件线性模型是最佳的选择.在解决一般的二维二分表现型变量是否与特定基因相关时我们可以用logistic回归模型,当两种疾病有较明显的相关性时可以用条件logistic回归模型进行假设检验.
[硕士论文] 何鹏
凝聚态物理 华中师范大学 2018(学位年度)
摘要:生物分子间的相互作用及其规律的研究是现代分子生物学研究的一个重要领域。从分子生物实验出发,研究分子间相互作用机理的系统生物学,有助于人们认识许多复杂疾病、动植物的寿命、生命周期节律等重要生命现象的本质。系统生物学中关于基因调控网络重构和功能预测是具有挑战性的课题之一。
  MicroRNA(miRNA)作为真核生物中普遍存在的一类重要的非编码RNA,大量的生物学实验研究表明:miRNA转录后抑制靶基因表达功能,在生物发育、细胞衰老与凋亡、癌症发生及转移等方面都起到了重要的作用。因此,对具有miRNA调控的基因网络动力学进行研究,在实验和理论上都有重要意义。
  基于已有的关于细胞周期、肿瘤细胞EMT/MET过程中基因调控网络的研究,本文主要考虑miRNA的作用、生化噪声、相互作用时间延迟分别对这两个生物过程的影响,建立起了相应的非线性动力学。本文的主要研究结果如下:
  (1)考虑MiR-17-92对细胞周期中Rb-E2F基因调控网络的作用,改进了此网络构建起了由Rb-E2F-CycE基因回路、E2F基因自激活回路两个正反馈环、E2F-miR-17-92负反馈环、转录因子Myc直接上调miR-17-92的非一致前馈环,这四个功能环组成的Rb-E2F-miRNA调控网络,并建立起该网络基因相互作用非线性动力学。研究表明:miR-17-92的调控会很大程度的延缓细胞G1至S期进程,使得细胞处于静止期的时间更长。而且调节miR-17-92对E2F的抑制率导致的延时效果比调节Myc对miR-17-92的产生率更加明显。噪声情况下,发现miR-17-92的加入可以使细胞有更大的概率处在静止期,从而维持网络的鲁棒性。通过对不同调控途径的动力学分析,发现miRNA的加入不会改变系统的双稳性质。但调节miR-17-92对E2F的抑制率、Myc对miR-17-92的产生率会出现实验中的miRNA“靶标回避”现象,此现象与miRNA和E2F表达的关联性有关,这可能为miR-17-92抑癌和致癌的双重角色提供了新的理论解释。
  (2)针对细胞EMT过程的[miR-34/SNAIL]:[miR-200/ZEB]调控网络,提出了一个简化模型。研究表明:该简化模型可以很好地重现实验中发现的肿瘤细胞EMT和MET过程,并从动力学机制上解释了肿瘤细胞的E/M混合表型在转换中的不对称性,即E/M混合态只出现于EMT过程。噪声存在时的数值模拟结果表明:在三稳表型态下,噪声会导致肿瘤细胞从E表型转换到M表型,从而增加了肿瘤细胞的转移性和侵袭性,并且发现混合表型有一定的噪声抵抗能力。此外,通过噪声和时滞同时存在时的研究发现,噪声会导致ZEB的高表达,而时滞则会削弱这种影响,将ZEB维持在低表达水平,表明二者之间存在一种竞争效应。这些结论可能为肿瘤的临床治疗提供新的思路。
[博士论文] 许杨
可再生洁净能源 中国科学技术大学 2018(学位年度)
摘要:人工赋予新功能的蛋白质在诸多前沿领域的研究中均具有重要用途。如携带有同位素或者成像标签的蛋白质在生物医药领域的研究中被广泛使用;另外在生物质能源领域的研究与应用中,酶的固定化以及高聚物化同样具有重大意义。因此,发展简单高效的修饰反应以得到更多具有新型实用功能的蛋白质成为了一个多领域交叉的重大的研究方向。最近基于亚胺键形成的腙连接修饰策略以及二氨基二酸修饰策略在赋予蛋白质新功能上均取得了重大进展。对于腙连接策略而言,其在生理条件下较低的反应效率以及催化剂毒性等问题一直困扰着研究者。虽然发展出的许多种快速反应试剂可以用来实现无催化剂的腙连接反应,但是这些对于快速反应试剂的研究探索均停留在模型反应层面,并没有实现对于真实蛋白质底物的修饰。另外对于二氨基二酸策略来说,其关键是设计与合成胱氨酸的衍生物二氨基二酸。然而目前该类衍生物的种类少,使用条件苛刻,且易引入毒性重金属物质,这些缺点均不利于其在蛋白质修饰中的进一步应用。为了解决这些困难,提高这两种策略在蛋白质修饰中的易用性与实用性,本文开展了两个大方面的课题工作。
  在第一部分工作中,作者探索了无催化剂的亚胺键形成反应,发展了基于卤素苯甲醛的无催化剂腙连接生物正交反应。首次实现了对蛋白质底物的无催化剂腙连接修饰,对泛素蛋白以及自噬相关蛋白LC3进行了成像标签的标记。但在这个最初版本的无催化剂腙连接反应中,作者仅实现了荧光标签的引入,没有实现蛋白质与更复杂的修饰物之间的反应,因此存在着修饰物拓展性不佳的问题。显然,复杂修饰物(如高分子聚合物、药物)与蛋白质的连接更具实用性。因此作者针对修饰物拓展性差的问题设计了一种通用的邻卤素苯甲醛试剂。这种试剂能够在反应活性保持的前提下进行复杂的修饰物拓展。作者借助这种试剂完成了对蛋白质底物的多种复杂分子引入(如成像标签、药物分子及高分子聚合物)。这一研究可为将来的纤维素酶的高分子聚合物修饰提供基础。
  在第二部分工作中,作者对二氨基二酸策略中存在的胱氨酸衍生物种类少、反应条件苛刻问题进行了探索。作者设计了不同链结构以及带有新型保护基的胱氨基酸衍生二氨基二酸。与此前报道的二氨基二酸相比,这些新化合物的链结构丰富,使用时的脱保护条件温和并且与固相多肽合成条件相互兼容。此外作者还使用新二氨基二酸成功合成了催产素衍生物,表明其适用于多肽/蛋白质修饰,拓展了二氨基二酸策略的应用范围。
[硕士论文] 赵荣娟
生物学;微生物学 安徽大学 2018(学位年度)
摘要:毒素-抗毒素(Toxin-Antitoxin,TA)系统丰富存在于大部分的细菌和古菌的染色体以及噬菌体的基因组中。TA系统具有很多的作用,例如为适应各种胁迫反应而诱导细胞休眠、抑制噬菌体、调节基因表达和耐受抗生素等。Ⅱ型毒素-抗毒素系统由于其在细菌基因组中的丰度而在五种类型中被研究得最为充分和深入。Ⅱ型TA系统作用方式为两个基因都被翻译成蛋白质,抗毒素通过蛋白质-蛋白质相互作用抑制毒素的毒性。抗毒素蛋白分成C端和N端这两个结构域。抗毒素的C端是与毒素结合结构域,中和毒素的毒性;N端为与启动子DNA结合的结构域,参与负反馈调节抑制TA系统的基因转录。目前对于抗毒素参与负反馈调节细节的研究还很少,需要进一步对其结构基础进行研究,揭示其结构功能关系,从而阐明其作用机制。
  本课题的研究对象为SO_1444/SO_1445毒素-抗毒素系统是南海所王晓雪课题组发现的一对Ⅱ型毒素-抗毒素系统。他们的研究结果表明抗毒素SO_1445可以与自身启动子上特定的回文序列结合,且在有些菌株中只有SO_1445单独存在。本课题试图通过对SO_1444/SO_1445系统中抗毒素SO_1445与启动子DNA的相互作用及其复合物结构的研究揭示其功能机制。
  通过序列比对和二级结构预测确定了SO_1445上与启动子DNA结合的N端结构域区段(由58个残基组成,命名为SO_1445-N-58),把它与全长SO_1445分别进行基因重组克隆、异源表达和蛋白纯化。利用ITC检测全长SO_1445以及其N端结构域(SO_1445-N-58)与启动子DNA特定的回文序列(19bpdsDNA)之间的相互作用,尝试用NMR和X-射线晶体学方法解析SO_1445和SO_1445-N-58的结构及其分别与启动子DNA形成的复合物的结构。ITC结果显示SO_1445与19bp dsDNA有相互作用且结合比例为4∶1,但SO_1445-N-58与19bp dsDNA的相互作用不显著。而NMR、DLS、CD和SEC检测的结果表明全长蛋白和N端区段与核酸均有相互作用。NMR数据显示SO_1445和SO_1445-N-58的结构及其分别与19bp dsDNA结合的复合物结构不适于用NMR解析。SO_1445-N-58可在特定条件下生成晶体,晶体结构与其他抗毒素的结构很相似。SO_1445-N-58和SO_1445与19bp dsDNA的复合物的结晶条件仍在进行中。我们的结果表明SO_1445的C端区段的结构相对无序,它对N端区段与DNA的结合有促进作用,且在N端区段与DNA结合之后从无序转变成螺旋结构。这些结果有助于我们更好地理解抗毒素的N端和C端区段在其功能中的协同作用。
[硕士论文] 胡长林
计算机应用技术 安徽大学 2018(学位年度)
摘要:基因选择性剪接是一个复杂多变的过程,它将移除内含子序列并重组外显子序列以产生成熟的mRNA(Messenger Ribonucleic Acid)。基因选择性剪接使得一个基因可以编译多个RNA(Ribonucleic Acid),而每个RNA又可以控制多个对应蛋白质的合成和功能的表达,因此出现了有限基因和近乎无限蛋白质的现象,基因的这种特性造就了地球上生物的多样性。然而基因选择性剪接的一些非正常的组合排列很可能诱发各种用常规手段难以治愈的致命遗传疾病,为人类生存带来巨大的灾难。因此对它的继续深入分析研究是必要的。
  基因选择性剪接通常可划分为5种不同类型,其中外显子跳跃(exon skipping,ES)事件是最大的一类选择性剪接事件,约占所有类型的40%以上,这使得它的分析预测和研究成为选择性剪接的重点。经过多年的分析研究,至今为止已经提出了数量众多的分析预测外显子跳跃事件方法,通常可以将它们划分为传统生物实验方法和生物计算方法两大类,然而传统生物实验方法通常有耗时、耗力、昂贵且有限覆盖等局限,不太适合用于大规模分析,所以使用生物计算方法分析预测外显子跳跃事件越来越受到欢迎,并且其取得成绩也越来越受人信赖。
  通过对以往预测外显子跳跃事件方法的研究学习,发现了它们中存在的一些局限,即RNA-Seq(RNA Sequencing)数据和基因序列信息的不完整性,这可能会给外显子跳跃事件预测带来不可预期的风险。为了克服这些局限,本文则基于RNA-Seq数据、基因序列信息以及旋转森林提出一种预测外显子跳跃事件的新颖生物计算方法。在该方法中,本文重在发挥两种数据各自优势,抽取能够描述外显子跳跃事件的特征,进而对外显子跳跃事件进行分析预测。首先,构造一个新的名为RS(the RNA-Seq features and sequence features)的特征集,它是由从RNA-Seq数据中抽取的RNA-Seq特征和由基因序列信息里抽取的序列特征组成。然后基于RS特征集,结合旋转森林算法(Rotation Forests,RotaF),提出一个新的名为RotaF-RSES(a Rotation Forests classifier predicts ES event with RS features)的外显子跳跃事件预测方法。为了验证RotaF-RSES方法的有效性,实验中采用两种人类组织RNA-Seq数据(人脑和人类肌肉)和对应的基因序列信息,结果表明RotaF-RSES方法能在一定程度上克服两种数据的局限性,并提升最终的预测准确度,能够为预测外显子跳跃事件的研究提供有益的帮助。
[硕士论文] 刘萌
微生物学 南昌大学 2017(学位年度)
摘要:长链非编码RNA(Long noncoding RNA,lncRNA)是一类不具有功能性开放阅读框(open reading frame,ORF)且转录本长度超过了200个核苷酸的RNA分子。近年来多项研究表明,LncRNA可以在表观遗传学水平、转录水平以及转录后水平通过多种机制对基因表达进行调控,并发现其在骨骼肌发育调控中起到了重要作用。本实验室通过RNA测序技术发现了新的长链非编码RNA Lnc247-Foxk1基因的天然反义LncRNA。Foxk1是骨骼肌发育过程中重要的调控因子,调节着成肌细胞的增殖与分化。因此,研究Lnc247对C2C12成肌细胞分化的调控作用具有重要的意义。
  为了探明Lnc247在C2C12成肌细胞分化中的调控作用,采用实时定量PCR检测了Lnc247和Foxk1在小鼠各组织及C2C12成肌细胞分化过程中的表达。结果表明,Lnc247和Foxk1在小鼠各组织中均有表达,两者在脾脏和脂肪中表达量最高,心脏和肌肉中表达量最低,Lnc247和Foxk1随着细胞分化过程表达量逐渐降低。在C2C12成肌细胞中上调或下调Lnc247的表达后,采用实时定量PCR和western blot分别检测成肌标志基因MHC与成肌因子MyoG mRNA和蛋白水平的变化,用细胞免疫染色观察肌管的形成。结果显示,上调Lnc247的表达后,细胞分化作用显著增强。以上结果说明,Lnc247能够促进C2C12成肌细胞的分化。本文研究结果对初步阐明LncRNA调控骨骼肌分化作用提供了理论基础。
[硕士论文] 袁亚洲
生物医学工程 电子科技大学 2017(学位年度)
摘要:基因识别是对DNA序列进行分析,获取其中重要信息的第一步。目前测序技术的发展使得测序数据呈爆发式增涨,然而实验方法无法快速有效的从海量信息中获取知识,基于此运用计算机技术来识别基因的方法应运而生。在2015年,我们课题组研发了原核生物基因识别程序ZCURVE3.0,该算法是基于Z曲线理论,采用新的机器学习算法SVM,增加新的特征变量,并且对内部参数进行进一步的优化,使得该识别算法更加快速准确高效。在预测出基因后,还需要知道其相应编码的蛋白质,于是我们基于ZCURVE3.0算法,对其进行进一步的升级,添加相关的功能,使得其成为完善的可视化集成系统。
  在本基因识别可视化系统中,第一部分是对ZCUREV3.0的功能进行可视化(BAGA)实现,其保留了相应识别算法的所有功能。在通过对50个原核生物的全基因组进行测试,选取比对阈值,排除伪基因,同时使得删除的正确基因数尽可能少,那样基本保持正确的基因数不变。在与GenBank提供的总的基因数相比,BAGA的预测基因识别率为97.60%,预测结果的特异度为96.74%,与ZCURVE3.0的特异度94.21%相比有2%的提升。BAGA附加预测率为3.34%,比ZCURVE3.0(6.08%)下降接近3%。附加预测率的降低,表明其预测错误的基因数目相比ZCURVE3.0有更进一步的减少。第二部分是对于ZCURVE3.0和Prodigal两个基因预测软件联合方法(BAGA2.0)的实现,通过保留两者预测相同的基因,对不同的基因进行序列比对,调节合适的参数,保留比对得分较高的基因,将这两部分的基因作为最终联合预测的基因。BAGA2.0对应的识别率为98.73%,特异度为96.09%。这两者性能,都比ZCURVE3.0效果要好。另一方面,BAGA2.0的附加预测率为4.08%比ZCURVE3.0(6.08%)要低。综合来看,联合两者来识别细菌的基因性能要更优。此外,虽然BAGA2.0的特异度比BAGA要低,其附加预测率要大,但是其识别率和准确度却更佳。
  在本文中采用BLAST序列比对实现了对于预测的基因进行功能注释,对于系统中实现的两部分的预测结果都能够实现注释,而且能够选择快速注释和完全注释两者不同方式。同时,集成基因组岛预测程序。我们将此完善的集成软件编译成各种不同系统的版本,使用者能够访问http://cefg.cn/zcurve-visualization/下载,并免费使用。
[硕士论文] 喻小鲁
生物化学与分子生物学 华南农业大学 2017(学位年度)
摘要:水稻的株型是一个重要的农艺性状,主要包括叶夹角、植株高度、分蘖数目/角度等。已有报道表明水稻体内内源生长素的平衡对于水稻株型的调控具有重要作用。前期我们得到了一个OsOxO2的T-DNA插入突变体(oxo2),T-DNA插入导致OsIAAGLU、OsOxO1、OsOxO2和OsOxO3表达明显提高,使植株呈现出矮化、分蘖数增加、旗叶叶夹角增大等表型,而且过表达OsIAAGLU水稻转基因植株中的一些个体也呈现出与突变体相似的表型。本论文对OsIAAGLU调控水稻株型的机理进行了分析,所得结果主要如下:
  (1)过量表达OsIAAGLU使水稻植株矮化、叶夹角增大
  过表达OsIAAGLU的3号株系IAAGLUOE3的表型共分离实验显示:7株过表达OsIAAGLU阳性植株的表型与oxo2突变体的表型相同,均呈现出株高变矮,旗叶叶夹角增大等表型;而4株分离野生型的表型与野生型的无明显差异。将过量表达OsIAAGLU的3号和5号株系种植多代后,得到了纯合子。在五叶期,IAAGLUOE3和IAAGLUOE5叶片中OsIAAGLU的表达明显提高,表型与oxo2突变体的相似。
  (2)oxo2突变体中OsIAAGLU的突变使其株型得到恢复
  成功筛选到在野生型和突变体oxo2中不含外源基因但OsIAAGLU已突变的转基因纯合株系,利用western blotting在上述OsIAAGLU突变株系的叶片中未杂到靶蛋白。野生型中OsIAAGLU定点打靶转基因植株iaaglu的株高略高于野生型,而叶夹角则略小于野生型。与突变体oxo2相比,突变体中OsIAAGLU定点打靶转基因植株iaaglu/oxo2的表型得到了恢复,与野生型的表型基本一致。
  (3)oxo2突变体中OxO表达下调未改变突变体株型
  以oxo2突变体作为母本,OsOxOs的干涉植株(OsOxOsRi6)作为父本进行杂交,获得在突变体oxo2中OsOxOs表达下调的水稻植株。与母本oxo2相比,8棵杂交植株叶片中的OxO酶活性均明显降低,OsOxO2的含量也明显降低,但oxo2×OsOxOsRi6的杂交植株叶片中OsIAAGLU的表达与突变体相比无明显变化,但在抽穗期时,杂交植株的表型与突变体oxo2的几乎一样,表现为矮化、旗叶叶夹角增大等生长素缺乏的表型。因此,oxo2突变体株型的改变是由OsIAAGLU表达上调引起的。
  (4)水稻OsIAAGLU通过调控植株内源生长素稳态调控株型
  水稻原生质体OsIAAGLU融合GFP蛋白瞬时表达实验结果表明OsIAAGLU定位在细胞质中。外施生长素IAA(吲哚-3-乙酸)和NAA(α-萘乙酸)短时处理野生型DJ幼苗后,OsIAAGLU的表达明显提高。与野生型相比,OsIAAGLU过表达植株根的向地性明显减弱,对NAA极其不敏感,oxo2突变体对NAA相对不敏感,而OsIAAGLU功能缺失突变体对NAA更敏感,但上述株系对2,4-D(2,4-二氯苯氧乙酸)的敏感度与野生型无明显差异。HPLC法测量游离生长素含量结果表明,OsIAAGLU过表达植株旗叶叶片中的生长素含量低于野生型的,pDR5:GUS法分析表明过表达OsIAAGLU株系IAAGLUOE3叶枕中的生长素含量也明显低于野生型。生长素响应基因OsIAA14和OsGH3-2在OsIAAGLU过表达株系中的表达均下调,而在iaaglu突变体中,两者的表达均上调。上述结果说明,OsIAAGLU通过干扰生长素稳态来调控水稻株型。
[硕士论文] 金连丰
生物学;生物化学与分子生物学 东北农业大学 2017(学位年度)
摘要:每个miRNA都具有多个靶基因,因此对miRNA下游作用的靶基因进行寻找及功能研究仍是临床及科研的重要方向。而哺乳动物乳腺组织是动物体中少数的随着年龄、发情周期和繁殖状态而发生相应周期性变化器官之一。因此对人乳腺中miR-139-5p靶基因的鉴定及验证至关重要。
  研究发现miR-139与其靶基因共同作用可影响众多生物学功能,如蛋白定位、细胞周期调控以及抑制肿瘤侵袭等。众所周知,细胞周期的有序进行是生物体生长、发育及繁殖的基础,而细胞周期加快或阻滞会影响细胞增殖及迁移能力,进而至使肿瘤、癌症以及基因突变的发生。为充分研究miR-139-5p的作用和功能,其靶基因的挖掘和鉴定及初步的功能验证成为急需解决的问题。
  本研究将RNA结合蛋白免疫沉淀(RNA Binding Protein Immunoprecipitation,RIP)与新一代测序技术相结合,以MCF-10A细胞系为研究对象,鉴定与验证miR-139-5p在乳腺上皮细胞中的靶基因。先运用针对目标蛋白Ago2的抗体把相应的RNA-蛋白复合物沉淀下来,然后经过分离纯化,对结合在复合物上的RNA进行测序分析,找出成对样品中的差异峰,进而确认miR-139-5p在MCF-10A中的靶基因,并对靶基因进行KEGG和GO分析;最后运用qPCR等技术对miR-139-5p的靶基因及miR-139-5p部分功能进行验证。这些结果将为miR-139-5p在人乳腺中的功能研究提供新的参考。
  研究结果如下:
  (1) RIP-seq测序数据处理及生物信息学分析:
  RIP-seq测序后我们将由Negative Control组与miR-139-5p mimic组获得的peak进行比较,得到差异基因484个,这些差异基因就是miR-139-5p在MCF-10A细胞中的靶基因,这些靶基因可能是乳腺发育或乳腺进化过程中重要的基因。利用KEGG对靶基因进行通路分析,我们得到204种Pathway,其中显著性通路有21条(P<0.05),涉及到120个靶基因;在GO分析中发现,显著性GO条目448个(P<0.05),主要涉及蛋白定位(proteinlocalization)、细胞周期调控(regulation of cell cycle)、细胞器组成(organdle part)、结合RNA(RNA binding)和结合核酸(nucleic acid binding)等;
  (2) miR-139-5p靶基因的验证
  选取的18个靶基因在mRNA水平被miR-139-5p显著下调,表明其表达受miR-139-5p调节。选择细胞周期信号通路对miR-139-5p的靶基因进行功能验证,表明miR-139-5p能显著抑制G1/S细胞周期转变,进而抑制细胞增殖,这种调节是信号通路中多个靶基因共同作用的结果。
[硕士论文] 乔菊霞
生物化学与分子生物学 山西大学 2017(学位年度)
摘要:在真核细胞中,染色质是由DNA,组蛋白,非组蛋白以及少量的RNA组成的。染色质的基本单位是核小体。核小体是由146 bp的左手超螺旋DNA缠绕着组蛋白八聚体组成的。组蛋白八聚体是由进化上比较保守的核心组蛋白H2A,H2B,H3, H4各两个单体构成。连接组蛋白则可以将DNA锁定在核小体上。在不同生物中,连接组蛋白在进化上不保守,在维持基因组的稳定性,特定基因的转录调控,染色质重塑,以及DNA损伤修复等方面发挥着重要的作用。
  嗜热四膜虫(Tetrahymean thermophila)具有传统纤毛虫特异的大核和小核的细胞双核体系。大核和小核中具有结构不同的组蛋白H1。小核特异组蛋白MLH1(micronuclear linker histone)在生长期表达量低,而在有性生殖时期表达水平显著提高,然而其具体的生物学功能并不清楚。本研究对Mlh1在四膜虫中的功能进行了系统分析研究,获得主要结果如下:
  1. MLH1基因的生物信息学分析 MLH1(TTHERM_00471820)在四膜虫大核基因组中无内含子序列,开放阅读框1902 bp,编码633个氨基酸。含有21.5%的赖氨酸和23.1%的丝氨酸。序列中含有一个较为保守的HMG-box结构域(93-158aa),该结构域属于 II/III类的 HMG-box超家族。与四膜虫高迁移率族蛋白 HmgB3(TTHERM_00155590)的HMG-box有35%的一致性。MLH1在营养生长期和饥饿前期有较低的表达,饥饿后期几乎不表达,而在有性生殖时期表达水平显著提高,有性生殖时期6h达到最高。
  2. Mlh1在不同发育阶段的定位 Mlh1在生长发育的不同时期会水解成不同的片段α,β,γ,δ。分别构建了含HA-tag和Flag-tag的pXS75-MLH1、pXS75-MLH1-α、pXS75-MLH1-β、pXS75-MLH1-γ、 pXS75-MLH1-δ载体,转化嗜热四膜虫细胞中,利用巴龙霉素抗性筛选出突变株。免疫荧光定位分析表明,在营养生长期 HA-Mlh1定位在小核上,而HA-α,HA-β,HA-γ,HA-δ定位在胞质中,表明全长Mlh1对于小核连接组蛋白的入核是必须的。营养生长期HA-Mlh1定位在小核上,而Mlh1-Flag没有定位在小核上,表明全长 Mlh1入核后很快发生了水解。在有性生殖早期, HA-Mlh1定位在小核上,且定位信号不断扩大,定位模式类似于纺锤体结构。在Crescent时期,HA-Mlh1可以与α-tubulin共定位于小核上。在小核完成第二次减数分裂后,HA-Mlh1定位信号消失。结果表明,Mlh1参与减数分裂小核的拉伸。
  3. MLH1的过表达导致四膜虫异常的有性生殖0.15μg/ml的Cd2+诱导生长期突变株2 h,通过DAPI染细胞核DNA,显微镜下进行突变株有性生殖时期核发育观察,发现突变株在有性生殖期间出现无规则的小核和松散的染色质,突变株不能完成有性生殖。核发育概率统计显示,MLH1的过表达抑制了合子核的形成和发育,减数分裂后形成的配子大部分凋亡,少部分能发育到anlagen时期,之后配对细胞分开。
  4. MLH1的敲除影响四膜虫的有性生殖构建敲除载体pBsr-MLH1后,基因枪转化入四膜虫细胞内,通过杀稻温菌素梯度浓度筛选得到稳定突变株ΔMLH1。缺对PCR检测结果表明突变株存在小核染色体的丢失。核发育概率统计和γ-H2A.X定位信号结果显示,突变株在第二次减数分裂后,选择核不能完成DNA断裂修复,之后配子凋亡。结果暗示,MLH1的缺失会影响选择核的DNA断裂修复,进而影响合子核的发育及后期的有性生殖进程。Mlh1可能和DNA损伤修复相关。
  5. MLH1和HMGB3可能存在功能上的补偿通过四膜虫功能基因组数据库分析,发现MLH1和高迁移率蛋白HMGB3有着相似的表达图谱。此外,Mlh1和HmgB3有着相似的一级氨基酸序列结构特性。RT-qPCR分析,发现在ΔMLH1细胞中,HMGB3的表达水平较野生型细胞有了明显的提高;在ΔHMGB3细胞中,MLH1的表达量也较野生型细胞有了明显的提升。 MLH1和HMGB3的双敲除突变株对MMS较为敏感,且有性生殖缺陷比 MLH1的单敲除细胞株表型严重。以上结果表明 MLH1和HMGB3可能存在功能上的补偿作用。
  本研究首次对MLH1在四膜虫有性生殖时期的定位和功能进行了系统分析;有性生殖早期,HA-Mlh1定位在小核上,且定位信号不断扩大,定位模式类似于纺锤体结构。在Crescent时期,HA-Mlh1可以与α-tubulin共定位于小核上。MLH1的过表达不仅抑制了合子核的形成和发育,还形成了无规则的小核以及松散的染色质。MLH1的敲除会影响选择核的DNA断裂修复,进而影响合子核的发育及后期的有性生殖进程。此外,组蛋白MLH1和高迁移率蛋白HMGB3可能存在功能冗余性。连接组蛋白Mlh1的正常表达对四膜虫细胞核的稳定性和有性生殖进程是必需的。
[硕士论文] 唐亚
核技术及应用 新疆大学 2017(学位年度)
摘要:目前,随着全球土壤侵蚀、土地荒漠化状况日趋加剧,对于研究出高效、方便、快捷的防沙固沙方法则变得至关重要。在我国古尔班通古特沙漠中发现了寡营养细菌,该寡营养细菌可以制成生物菌剂喷洒在流沙表面,形成生物结皮,从而起到固沙的作用。但这种结皮很容易遭到破坏且短时间内难以修复,为了获得更加高效的寡营养固氮菌,本论文对低能 N+注入介导的沙漠寡营养细菌的固氮基因的突变进行了全面研究。
  基于细菌基因组De novo测序的研究,本论文应用6种生物信息学方法分别从5个方面研究了3个低能N+注入介导获得的重组DOB菌的7个固氮基因的突变与进化情况,分析和探讨了nif基因的碱基突变、分子进化树、蛋白质一级结构和二级结构及其结构域变化。
  本研究发现:所有发生突变的nif基因均存在“突变热点”,这说明该区域的碱基对低能氮离子的辐射更敏感,碱基的突变是生物进化的主要动力;重组菌株DOB981的nif基因家族不同于重组菌株DOB113、DOB073和对照菌株DOB150,并且其进化速度快于DOB113和DOB073,为人们研究未来几百万年的DOB菌株提供了有益参考。
  nif蛋白结构分析结果表明,只有nifA和nifM基因编码的蛋白质一级结构发生了变化,主要表现在蛋白质的跨膜区和跨膜方向,为蛋白质的折叠、螺旋、卷曲研究提供了结构基础。在蛋白质二级结构方面,重组菌株 DOB981的 nifH、nifA、nifM、nifS(Ⅰ、Ⅱ、Ⅲ)和 fixB的蛋白质二级结构发生了的变化,为其固氮酶蛋白的空间结构与其催化功能的关系研究奠定了基础。蛋白质的结构域在蛋白质分子的进化过程中起着核心作用,影响着蛋白质的功能表达,研究发现重组菌株 DOB981的 nifHⅡ的蛋白质结构域发生了变化,为更深入地研究蛋白质进化机制提供依据。
  本论文通过对低能 N+注入介导获得的重组 DOB细菌的生物固氮基因(nif基因)的研究,从分子水平上探讨了离子注入DOB细菌导致其生物固氮基因突变与进化的分子机制,丰富了低能离子与生物体相关作用的理论,为人们更加深入理解生物固氮基因的突变与进化提供了丰富的材料,对DOB的分子育种和应用具有重要的理论意义和实践价值。
[硕士论文] 马利君
农业推广 华中农业大学 2017(学位年度)
摘要:生物矿化普遍存在于动植物体内,在生物体的生命活动过程中起着重要的作用。草酸钙晶体是普遍存在于植物体中的生物矿化产物,在植物钙营养调控及防御草酸毒害等方面具有重要作用。植物体内草酸钙晶体具有棱晶、柱晶及针晶体等各种形貌,而其独特形貌的形成受生物大分子(蛋白、多糖、糖蛋白等)的精确调控。本研究以模式多糖4-硫酸软骨素(Ch4S)为实验材料,结合凝胶法合成一水合草酸钙(COM)晶体,通过钙离子电极检测和原位原子力显微镜(AFM)、动力学模拟以及X射线衍射(XRD)和傅里叶红外(FTIR)等物理化学表征手段进行检测,研究了Ch4S对草酸钙晶体成核及表面生长的影响,以期揭示植物体内多糖类生物大分子对草酸钙晶体形成过程的调控机理,并为微观理解动植物体内生物矿物界面反应,提供研究手段和理论依据。
  本研究主要结论如下:
  (1)不同本底电解质(KCl或NaC l)条件下,通过钙电极监控的方法来研究Ch4S对COM成核和生长的影响。结果表明,NaCl本底电解质条件下,草酸钙晶体成核的诱导时间大于KCl本底电解质,并且NaCl本底电解质溶液形成的草酸钙晶体呈标准的中心对称六边形,而KCl本底电解质溶液成核形成的草酸钙晶体则呈现不对称的多边形。成核后的晶体通过XRD和FTIR分析,均得到一水合草酸钙(COM)的特征图谱,说明不同本底电解质对成核形成晶体的晶相和结构没有影响。添加Ch4S后,随着添加分子浓度(0.01-5μg/mL)的升高,在不同本底电解质(KCl或NaCl)下均表现为成核诱导时间的增加,成核后形成的草酸钙晶体在扫描电子显微镜(SEM)下观察,发现晶体尺寸逐渐变小,即 Ch4S对草酸钙成核具有显著的抑制效果,且最终在NaCl为本底电解质中,成核后的晶体形貌上都接近于菱形。这表明Ch4S中的官能团(羧基、羰基及硫酸基团)与COM晶面发生相互作用,抑制晶体生长,但是由于Ch4S对COM不同晶面吸附结合能力不同,导致晶体形貌的改变。
  (2)借助原位原子力显微镜,观测在不同草酸钙过饱和溶液中,Ch4S对COM(-101)和(010)晶面螺旋台阶生长速度及形貌的影响,结果表明,随着Ch4S浓度的增加,COM(010)晶面螺旋[100]和[0-2-1]方向台阶生长速度均减慢,并且[100]方向台阶生长速度显著低于[0-2-1]方向,导致螺旋台阶形貌由[100]方向为短边,[0-2-1]方向为长边的平行四边形,逐渐变为两个方向边长相等的正方形,以及逐渐发展为[0-2-1]方向为短边,[100]方向为长边的平行四边形;并在高浓度(Ch4S=5μg/mL)时,台阶形貌变紊乱,生长速度接近于零。这说明在(010)晶面[100]方向结合吸附作用更加显著,从而抑制该方向的生长。对草酸钙不同晶面,(-101)面台阶的移动速度与(010)晶面进行比较,(-101)面[101]方向台阶相对生长速度是(010)晶面[100]和[0-2-1]方向的三倍,说明在溶液条件下,Ch4S对(010)晶面去水化作用及官能团(羧基、羰基和硫酸基团)竞争晶面的结合位点能力大于(-101)晶面,最终表现为对(010)晶面的抑制效果显著大于(-101)晶面。
  
[硕士论文] 张祎焜
生物信息学 华中农业大学 2017(学位年度)
摘要:生命系统存在于复杂的环境背景中。为适应环境的变化,生物需要通过感知和应答对已建立的稳态进行适当调整。温度是环境条件的一个重要方面,生物体对温度变化的适应机制一直是生命科学领域的研究热点之一,相关成果已广泛应用于基因工程、发酵工程、酶工程及新生物材料等众多领域。然而,生物体对热胁迫响应的内在分子机制目前仍不十分清楚。本工作中,利用RNA-Seq技术测定了大肠杆菌最适生长和热胁迫状态下的转录组数据,并通过基因表达谱和相关蛋白互作网络分析,研究了大肠杆菌的热胁迫响应过程。
  首先,基于已有的研究经验和预实验对培养基进行了优化,改进了大肠杆菌热胁迫实验方案,并结合生理实验结果确定了最适生长和热胁迫条件下大肠杆菌单批培养过程中RNA样本的采集时间点。然后,对RNA样本进行了链特异性测序,得到了两种实验条件下不同生长阶段的转录组数据。基于基因表达谱,鉴定和分析了最适生长和热胁迫条件下的差异表达基因;结果显示,与热激时期相比,热胁迫时期上调基因数量明显增加。对差异表达基因进行GO功能富集分析和KEGG通路富集分析的结果显示,热激时期,正常生理活动受到抑制,能量供给不足,热激响应活动活跃,错误折叠的蛋白质大量分解并用于合成热激蛋白,菌体处于典型的应激状态;热胁迫时期,热激响应活动减弱,热激时期受到抑制的部分生理功能得到恢复,一些最适生长温度下沉默的基因被激活,相关代谢通路运转,暗示与最适生长状态相比,热胁迫状态的菌体处于一个新的稳态。随后构建了差异表达基因的蛋白互作网络,并对网络中的枢纽蛋白进行了筛选和分析。基于MCL聚类算法对蛋白互作网络进行了模块划分,结果显示,热适应过程涉及的大部分生理活动都是由蛋白质的功能模块执行的,并且生理功能相似的蛋白质倾向于富集在相同的功能模块中。此外,蛋白互作网络枢纽蛋白功能分析和网络模块功能富集分析的结果支持转录组相关分析得到的结论。最后构建了最适生长和热胁迫状态下的蛋白互作网络,并对其拓扑属性进行了计算和比较。结果显示,两种生理状态下蛋白互作网络的拓扑属性差异很小,表明蛋白互作网络在不同环境条件下具有结构和功能的稳健性。基于此研究结果,借助物理学中的“势垒”概念,我们对热胁迫响应过程中适应策略的选择机制进行了推测。本工作为后续大肠杆菌热胁迫响应的研究提供了实验路线及研究方向,并为进一步揭示生物体适应策略的内在选择机制打下了基础。
[博士论文] 唐友
农业工程;农业电气化与自动化 东北农业大学 2017(学位年度)
摘要:全基因组选择GS(Genomic Selection)也叫基因组预测GP(Genomic Prediction)是一种用于计算基因组育种值GEBV(Genomic Estimated Breeding Value)的方法,估算精准育种值需要检测覆盖所有全基因组水平遗传标记假设,然后对其个体进行评估。当前全基因组选择的方法非常多,如基于贝叶斯模型的方法(BayesianA、B、C、lasso等),还有基于最佳线性无偏预测BLUP(Best Linear Unbiased Prediction)模型的方法(gBLUP,rrBLUP等)。每种预测方法计算原理不同,对于表型性状预测效果有很大差别,所以预测选择适合的方法是提高最大精准值Accuracy最好的途径,其基因组育种值是作为育种家育种的重要参考。
  本文研发了一个新基因组选择方法mMAP(Mining the Maximum Accuracy ofPrediction)是将当前流行的基因组选择方法建立方法库,然后去预测运算大量不同的物种性状,采用交叉验证得到精准值,形成具有参考价值的知识库。新的物种性状根据知识库采用挖掘技术去选择最优GS方法在预测GEBV中指导育种分析。现在知识库里面有三百多种物种性状测得精准值,并不断有GS方法加入到方法库,再将预测新物种性状精准值累积到知识库中。mMAP方法具体研究实现过程及效果:
  (1)对于新物种性状预测,通过引入数据挖掘技术应用到基因组方法的选择上,将聚类分析处理知识库与多种流行的基因组预测方法相结合,目的是应用最少的基因组预测方法算出预测精准值最高。根据提供的三组知识库数据,真实预测累积数据、两组模拟知识库数据之间分别符合正态分布和随机分布,分别在92.27%、93.40%和90.2%以上找到该表型对应GS方法预测精准值的最高。
  (2)预测精准值运算采用统计学中交叉验证(Cross validation)提高验证精准值的效率。验证设计采用随机分5组,以80%已知表型数据作为训练群体,预测20%未知表型数据,然后重复100次以上验证去预测精准值基本上覆盖了所有假设,将其误差降到最低。也将交叉验证分组进行不同设置扩展实验,如3、5、10、20等,再重复100次以上其Accuracy接近稳定。
  (3)确定新表型性状选择GS方法的最佳时机,本研究设计了聚类中心最远、最近收敛方法去检验找到新预测表型最适合的GS方法。通过实验设置初始聚类分组重复100次以上使得初始知识库处理聚类核心比较稳定,然后在收敛时根据距离每组聚类核心最近位置值和最远边缘值查找,使得最新GS方法预测Accuracy将其临时组合到知识库,然后迭代收敛检验直到连续两次内没有新GS方法产生,避免了偶然性。通过真实数据检验对于新性状查找大概迭代3次左右即可找到最佳方法,迭代本身时间仅几秒钟。
  (4)每种GS方法都有独立的实现包,只需要将聚类产生的新GS方法和物种性状传到包里进行预测。而且各个包之间相对独立,通过主线程对聚类结果进行分别调用,其结果不会相互影响,经过比对结果,继续收敛。通过独立包的设计达到方法执行相对独立,保证数据安全和缩短运行时间。
  (5)采用面向对象技术实现mMAP研发,可以通过多线程实现独立包调用。通过引入操作系统底层封装技术Docker,直接调用Linux服务封装简化操作系统内核形成Docker容器,实现多线程应用。将容器封装到WEB环境,通过B/S操作访问模式,提供服务为育种家随时随地进行运算,结果会自动生成分析报告和育种值。该平台已经可以远程应用,并在2017年1月PAG(The Plant and Animal Genome)大会上进行了展示。
  (6)提供给mMAP运算的基因型数据可以是已发表公共的数据,也可以由原始测序数据转换得到。因此高通量测序数据转换基因型数据作为输入接口,整合到mMAP计算平台中构建一个完整体系,目的是可以降低原始数据存储空间、缩短转换时间以及高效服务育种业务。目前高通量测序原始数据(fastq格式)比对参考基因组序列(fasta格式),通过bowtie、samTool、GATK等工具进行数据转换、calling SNPs等操作,然后再变换成可用的基因型文件如Hapmap、Numeric Genotype等格式为后续分析服务。但是高通量测序原始数据太大,转换时间太长,整个处理过程占用大量资源。
  针对运行时间和占据空间问题,本研究设计了一个基因型数据处理管道,目的是提高效率,主要涉及算法技术和效果:HDF5数据格式替代fasta作为参考基因组,占空间小,比对速度较快;由于处理过程中大量的中间数据产生影响其效率,本研究设计一种高效双索引文件格式来存储差异基因位点数据,根据差异数量减少中间文件占用空间;由于生成SNP及基因文件都占据大量空间,引入gZIP压缩方法,能将大型基因数据文件压缩到50倍以上,而且编写方法直接调用压缩数据和还原的SNP数据,其操作与源数据效果相同。为了提高调用及转换基因型数据过程效率,对于变换基因型数据存储形式采用压缩格式,并提供很多灵活的操作接口,方便后续分析统计。整个管道采用面向对象技术研发,实现并行处理,并提供数据接口服务与mMAP整合在一起。
  通过mMAP方法预测很多物种性状,根据设置的条件可以找到最优合适的GS方法,并调用生成育种值,为育种家提供直接帮助。通过管道研究,能够完成大批高通量原始测序数据的转换,引入并行运算和相关技术可以完成基因大数据处理模式,并对遗传领域后期数据分析(如全基因组关联分析GWAS和GS)提供基础服务。
[硕士论文] 周聪聪
草学 华南农业大学 2017(学位年度)
摘要:象草(Pennisetum purpureum)是禾本科狼尾草属的多年生大型草本植物,是优良饲用牧草及新型能源植物。但其体内过高的木质素含量限制了象草的开发与利用。所以,利用基因工程的方法,降低象草木质素含量或改变木质素组成对象草的利用具有重要意义。MYB转录因子及肉桂酰辅酶A还原酶(Cinnamoy-CoA Reductase,CCR)基因启动子都参与了木质素的生物合成调控。本文研究了象草抑制型PpMYB4转录因子(登录号为:KU612217)与PpCCR启动子互作关系,以期为象草的木质化改良工作奠定基础。主要的研究结果如下:
  (1)构建了一个以LUC以及 REN为报告基因的双荧光素酶报告检测PpCCRPro-LUC载体和PpMYB4-SK载体,通过瞬转烟草后测定荧光值发现PpMYB4与PpCCR启动子(PpCCRPro)有明显的互作,且能抑制了PpCCRPro的活性。
  (2)通过构建PpCCRPro启动 GUS报告基因的表达载体PpCCRPro-GUS和pBA-PpMYB4载体,并瞬转烟草,测定GUS酶活发现,PpMYB4与PpCCRPro有明显的互作,且抑制了PpCCRPro的活性。
  (3)通过带有His标签蛋白基因的表达载体pET-PpMYB4和PpCCR基因启动子探针进行凝胶迁移率实验(Electrophoretic mobility shift assay EMSA)发现PpMYB4可以结合到PpCCRPro上的AC-I元件。
  (4)构建了带有HA标签蛋白的表达载体HA-pBA002-PpMYB4进行染色体免疫共沉淀(Chromatin Immunoprecipitation,ChIP)发现PpMYB4转录因子可以与木质素合成相关基因(4CL、CCoAOMT、CCR、CAD)启动子在烟草体内发生相互作用;而且结果表明PpMYB4与CAD基因启动子结合能力是最强的。
  (5)构建了以PpCCRPro启动PpMYB4的表达载体PpCCRPro-PpMYB4,并且通过叶盘法转化烟草,最终得到3个株系转基因烟草。与野生型烟草相比转基因烟草植株出现了明显矮化以及叶片卷曲等不正常生长。同时,转基因烟草茎秆以及叶柄木质素含量均低于野生型,OE3茎秆及叶柄木质素含量比野生型分别降低了35.31%和36.54%。
  (6)通过qPCR对PpCCRPro-PpMYB4转基因植株以及野生型植株木质素合成途径中关键酶基因(4CL、CCoAOMT、CCR、CAD)进行检测,发现这些基因的相对表达量均低于野生型,且CCR的表达量极显著低于野生型。该结果说明PpCCRPro 这一组织特异性启动子促使PpMYB4过量表达,抑制了下游4CL、CCoAOMT、CCR和CAD基因的表达,导致转基因烟草的木质素含量显著下降。此外,用100μmol/L ABA、MeJA、GA处理转基因植株后发现,随着处理时间加长木质素合成相关基因(4CL、CCoAOMT、CCR、CAD)表达量均先增后减。
[硕士论文] 闫静
生物化学与分子生物学 山西大学 2017(学位年度)
摘要:在真核生物蛋白质翻译终止过程中,当三个终止密码子UAA、UAG和UGA中的一个到达核糖体A位点时,被第一类肽链释放因子eRF1识别,翻译过程终止,在第二类肽链释放因子eRF3的协同下完成新生肽链释放。在翻译终止过程中,第一类肽链释放因子eRF1利用其N端结构域识别终止密码子。eRF1的N结构域中的GTS、NIKS和Y×C×××F模体对于终止密码子的识别发挥重要作用。但至目前为止,eRF1识别终止密码子的机制,尤其是对于终止密码子的选择性识别机制仍不清楚。
  在本实验中,首先构建了四膜虫(Tetrahymena thermophilia)eRF1的N结构域与酿酒酵母(Saccharomyces cerevisiae)或裂殖酵母(Schizosaccharomyces pombe) eRF1的M和C结构域组成的杂合eRF1(Tt/Sc eRF1,Tt/Sp eRF1)。利用双荧光素酶报告体系检测结果证实,两种杂合的eRF1在细胞中识别终止密码子的活性具有显著差异。Tt/Sc eRF1识别终止密码子UGA,而不识别UAA和UAG终止密码子,与四膜虫eRF1一致,表现出了密码子识别特异性(对UGA、UAG、UAA的通读效率分别是1.98%、3.83%、11.04%);而Tt/Sp eRF1可以识别三个终止密码子,无密码子识别特异性(对UGA、UAG、UAA的通读效率分别是2.81%、2.01%、1.88%)。由此说明四膜虫eRF1的N结构域不是决定其识别特异性的唯一因子,在eRF1的M和C结构域中可能存在决定eRF1识别性质的元件或细胞中其它因子可能通过M和C结构域参与eRF1识别终止密码子的过程。为解释这一现象,我们将Sp eRF1的C端小结构域中氨基酸进行突变,选择了其中的第357、361、364和367位的氨基酸突变为酿酒酵母eRF1相应的位点,得到一系列的突变体(Tt/Sp eRF1 A364Q、Tt/Sp eRF1 D361A/A364Q、 Tt/Sp eRF1 L357A/D361A/A364Q、 Tt/Sp eRF1 L357A/D361A/A364Q/E367D)。同样也将裂殖酵母eRF1的364、367和371位氨基酸引入酿酒酵母eRF1,得到突变体Tt/Sc eRF1 Q364A、Tt/Sc eRF1 Q364A/D367E、Tt/Sc eRF1 Q364A/D367E/E371S。结果显示,所有的突变体对UGA的识别效率没有明显的变化,但是Tt/Sp eRF1的突变体对UAG和UAA的通读效率显著提高,说明其对这两个密码子的识别效率降低。而Tt/Sc eRF1的突变体,对终止密码子识别活性的影响不显著,其对UAG的识别活性稍有提高,通读效率从5.77%降至2.98%,以上结果表明C端小结构域影响到eRF1对UAG和UAA密码子的识别活性。为了进一步分析小结构域对识别活性的影响,通过对小结构域的蛋白结构分析发现在其结构域中存在关键的、多变的Loop(357~367aa)结构,因此我们将裂殖酵母和四膜虫eRF1小结构域中的Loop结构引入到杂合的Tt/Sc eRF1中。分析结果显示,引入两种不同Loop结构到Tt/Sc eRF1嵌合体中,均可识别三个终止密码子,说明Loop结构显著的影响终止密码子的识别活性。由此表明,四膜虫eRF1的N端结构域识别终止密码子的活性受到C端结构域的影响,也说明eRF1的C端结构域参与了终止密码子的识别过程。
  从以上实验结果推测,是否酿酒酵母第二类肽链释放因子与两种酵母的嵌合体eRF1相互作用的效率不同,导致两个嵌合体识别终止密码子的效率和功能发生了改变。因此,在本实验中,将克隆得到的四膜虫eRF1嵌合体和裂殖酵母Sp eRF1以及酿酒酵母两类肽链释放因子Sc eRF1和Sc eRF3的基因,分别连接到酵母表达载体pGADT7和pGBKT7中,得到的重组质粒共转化到酵母菌株AH109。酵母双杂交结果证实四膜虫eRF1嵌合体(Tt/Sc eRF1/Tt/Sp eRF1)、功能Sp eRF1、Sc eRF1和Sc eRF3均存在相互作用关系,说明无论在何种细胞中,蛋白质翻译终止过程都需要两类肽链释放因子的协同作用来完成。排除了酿酒酵母细胞中嵌合体eRF1识别终止密码子的性质和活性的差异是由于Sc eRF3与嵌合体eRF1相互作用的效率不同而引起的。
  为了进一步验证N端结构域识别终止密码子的活性受到C端结构域的影响,我们通过双荧光分子互补实验(BiFC)证实eRF1功能的主要调控因素是其N端结构域与C端结构域在分子内发生的相互作用引起的。通过克隆得到四膜虫eRF1的N结构域,C结构域、酿酒酵母eRF1的C结构域和裂殖酵母eRF1的C结构域及其突变体(Sp-C A364Q、Sp-C D364A/A364Q、Sp-C L357A/D364A/A364Q)的基因,分别连接到表达载体pQE-30和pET-28a中。结果表明四膜虫eRF1的N结构域与不同的C结构域以及突变体在体内都可发生相互作用,说明C端结构域通过与N端结构域的分子内相互作用,影响终止密码子的识别活性;也进一步证实了C端结构域参与了密码子的识别过程。
  综合以上结果表明,四膜虫eRF1的N端结构域不是其识别终止密码子的唯一因子,C端结构域在一定程度上影响并决定了eRF1对终止密码子是别的特异性。本研究结果,旨在为揭示肽链释放因子识别终止密码子的分子机制提供数据支持。
[硕士论文] 郑蓉蓉
动物遗传育种与繁殖 华南农业大学 2017(学位年度)
摘要:EXOC4基因(Exocyst complex component4)基因属于Exocyst complex基因家族成员之一。Exocyst complex基因家族主要参与囊泡转运的生物学过程有关。前人研究发现,EXOC4基因中第二内含子中存在两个SNPs位点与母猪的乳头数之间存在显著相关关系,而母猪的乳头数与母猪繁殖性能存在显著的正相关,尤其影响出生窝重与断奶窝重。此外,本课题组前期对猪重要经济性状的全基因组关联分析结果显示,EXOC4基因的第七内含子中SNP rs81471943与杜洛克猪的繁殖性状显著相关。因此,本研究分析了EXOC4基因不同基因型对母猪繁殖性状的影响,并探索EXOC4基因的表达调控机理,为其在母猪繁殖性状的分子调控机制奠定基础。
  本研究以杜洛克猪、大白猪和长白猪及长大二元杂母猪为研究对象,通过PCR-RFLP技术进行EXOC4的基因分型,结合生产数据,分析不同基因型对母猪繁殖性状的影响。qRT-PCR定量分析EXOC4不同基因型母猪不同组织中mRNA水平的表达量变化。运用在线网站预测猪EXOC4基因启动子区转录因子,构建其缺失片段重组体,以猪卵巢颗粒细胞为细胞模型,通过双荧光检测确定核心启动子区。具体研究结果如下:
  (1)克隆EXOC4基因第七内含子中存在与外种猪繁殖性状相关的rs81471943位点(16079181-16079820),在+149706bp处存在T>C突变;
  (2)在检测387头外种猪群体中,C等位基因的频率0.864,远远高于T等位基因的频率(q(T)=0.136),且在抽检的整个外种猪群体中,EXOC4基因符合哈迪-温伯格平衡定律;
  (3)在杜洛克猪和长白猪群体中,EXOC4基因呈现出三种不同的基因型(CC、TC、CC)。在杜洛克群体中,CC型断奶窝重和断奶仔猪数显著高于TC型(P<0.05),但两种基因型个体在产仔数和初生重均表现差异不显著(P>0.05)。而在长白猪群体中,CC型初生重和断奶仔猪数显著低于TC型(P<0.05),但两种基因型个体在产仔数和断奶窝重均表现差异不显著(P>0.05)。而TT型个体与CC型和TC型个体在产仔数、初生重、断奶窝重和断奶仔猪数均表现差异不显著(P>0.05)。在大白猪群体中,只有两种基因型CC和TC,两种基因型个体在产仔数、初生重、断奶窝重和断奶仔猪数均表现不显著(P>0.05)。
  (4)EXOC4基因在不同基因型CC和TC的长大二元杂母猪的各个组织中均有表达。在基因型TC中,表达量较高为肝脏,其次是小脑、肾、大肠,而在基因型CC中,表达量较高的是大肠,其次是小脑、大脑、肺。其次,在肝脏、肾脏、小脑组织中,TC型表达量显著的高于CC型,而在肺和卵巢组织中,TC型表达量则显著的低于CC型。
  (5)克隆EXOC4基因启动子片段全长2791bp,并对外种猪进行启动子区遗传变异分析,发现SNP rs81471943不同基因型在EXOC4基因启动子区存在7个SNP位点,分别为-544C>G、-832G>A、-904G>A、-934G>A、-1646C>T、-1665A>G和-1781G>A。
  (6)根据SNP rs81471943与EXOC4基因启动子区SNP之间关联,发现总共有5中不同的单倍型,除了WZ-2(AGTGAAG-T)比较少见,其他的都比较常见。构建其他4种单倍型的报告基因重组载体,转染猪卵巢颗粒细胞,结果WZ-1(GACGGGC-C)的活性显著高于WZ-4(AACAGGC-T)(P<0.5),且其他单倍型间的活性两两间均差异不显著(P>0.05)。推测-1781G碱基和-934G碱基可能是WZ-1(GACGGGC-C)与其它单倍型造成转录活性差异的原因。
  (7)以前期克隆EXOC4基因启动子片段全长为模板构建EXOC4基因启动子报告基因重组载体,转染卵巢颗粒细胞,结果EXOC4-P2的活性较高,EXOC4-P3、EXOC4-P4活性显著降低(P<0.05);EXOC4-P2活性显著高于EXOC4-P1活性(P<0.05)。其中,-1781G>A刚好位于猪EXOC4基因正调控元件结合位点区域,故推测-1781G碱基突变可能是导致母猪泌乳力差异的主要原因。
  结论:猪EXOC4基因的5’调控区上游-1781bp处的G碱基的突变可能会影响外种母猪的泌乳力。
  (已选择0条) 清除
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

万方选题

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部