绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
万方知识发现服务平台
获取范围
  • 1 / 100
  (已选择0条) 清除 结果分析
找到 2282 条结果
[硕士论文] 李茜
生物化学与分子生物学 中国科学技术大学 2017(学位年度)
摘要:GlmZ是大肠杆菌中非编码的小RNA。它主要参与调控glmS mRNA的翻译表达,全长207个核苷酸,并且在调控的过程中依赖分子伴侣Hfq蛋白质。当细菌在准备分裂时,细胞中会大量合成生物膜,合成生物膜的必要条件就是需要大量的葡萄糖胺-6-磷酸(GlcN6P),而葡萄糖胺-6-磷酸需要葡萄糖胺-6-磷酸合成酶(GlmS)的催化。基因glmS就会被激活,转录出glmS mRNA。大肠杆菌中glmSmRNA的转录后调控是通过小RNA GlmZ来调控。
  在本实验中,我们试图通过SHAPE的方法研究小RNA GlmZ和RapZ蛋白质的相互作用,希望得到它们之间具体的结合位点。SHAPE的全称是Selective 2'-hydroxyl acylation analyzed by primer extension,就是对2'-OH选择性标记,然后通过引物延伸的方法得到RNA的二级结构。为了建立这种方法,我们先以tRNA作为实验对象,成功的进行了摸索实验。从SHAPE的实验结果可以得出tRNA的二级结构是经典的三叶草模型。然而在进一步使用SHAPE研究GlmZ的结构以及它和RapZ的结合位点过程中,我们遇到了若干实验问题,最终未能顺利完成这部分研究。同时我们还通过晶体学方法得到了RapZ蛋白质的晶体,并且收到了2套分辨率在3A以内的衍射数据,但是由于晶体堆积上的问题,结构并没有解出来。在其它研究中,我们还使用SHAPE技术研究了rox2 R2H1RNA的二级结构。
  另外,大肠杆菌中的CsdA蛋白质是一类DEAD-box RNA解旋酶,它是由629个氨基酸残基组成的多结构域的蛋白质。主要功能是参与细胞内的许多RNA有关的代谢过程,例如: RNA降解,前体mRNA的剪切,翻译起始,核糖体的生物合成等等。在之前的实验工作中我们已经发现了CsdA是由两个串联的RecA-like组成保守的核心结构域,一个二聚体结构域(DD)和一个RNA结合结构域(RBD)以及C端的尾巴构成,而且在二体的形态下发挥功能,并且我们已经得到各个结构域的结构和功能。CsdA的核心结构域主要发挥解旋酶和ATPase的功能,我们通过解旋实验发现CsdA要想行使解旋功能必须形成二体,但是并不需要两个核心结构域。而且通过酶活实验和荧光偏振实验发现,CsdA的RBD结构域在它结合RNA的过程中起到了重要的作用。
[硕士论文] 朱盼盼
化学 扬州大学 2017(学位年度)
摘要:离子液体表面活性剂不仅具备离子液体的特殊性质还具有表面活性剂特性,可以通过改变阴阳离子、碳链长度来设计具有某种特定功能的离子液体以满足人们的需求。异喹啉类衍生物具有抗肿瘤、抗癌、抗血小板聚集、镇痛等生物活性,以异喹啉为母体的化合物在药物传递等领域中具有潜在的应用价值。不仅如此,异喹啉环还具有光活性,将功能型阳离子异喹啉环和烷基长链引入到离子液体中,研究其在溶液中的聚集行为,进一步探讨了[C12iQuin]Br与DNA的相互作用,研究两者的作用机理,在此基础上探讨[C12iQuin]Br对药物与DNA作用方式的影响。本论文还比较了不同链长的[CnQuin]Br胶束化行为,探讨了疏水性烷基链在压缩DNA过程中的作用。本论文主要包括以下几个方面:
  1、利用表面张力、动态激光光散射(DLS)、核磁(NMR)、等温滴定微量热(ITC),透射电镜(TEM),荧光等技术研究了[C12iQuin]Br在缓冲液中的聚集行为。研究结果表明,[C12iQuin]Br在浓度较低时(小于CMC)就出现了较大尺寸的预聚集体结构,并且这一独特的结构呈现球形,随着浓度的[C12iQuin]Br溶液的进一步增大,预聚集体结构逐渐向胶束结构转变。根据2D NOESY谱图分析,预聚集体与胶束结构的分子排列方式一致,异喹啉环部分地进入疏水性胶核,并且相邻的异喹啉以π-π堆积方式堆积排列。此外,研究了烷基链长及盐浓度对[C12iQuin]Br聚集行为的影响,结果表明烷基链越长的[CniQuin]Br形成预聚集体时所需要的[CniQuin]Br的量越少,越有利于预聚集体结构的形成。盐浓度的增加导致紧密的胶束结构提前形成,并且预聚集体的尺寸随着盐浓度的增加而略有减小。
  2、利用紫外光谱、动态光散射(DLS)、低温冷冻透射电镜(cryo-TEM)、圆二色谱(CD)、稳态荧光光谱和荧光探针取代实验、Zeta电势、傅里叶红外吸收光谱(FT-IR)、等温滴定微量热(ITC)、1H NMR和2D-NOESY等技术揭示了离子液体表面活性剂结合DNA后并将其压缩的关键因素。通过紫外光谱中的几个等电点说明[C12iQuin]Br分子缔合到了DNA上形成了[C12iQuin]Br-DNA复合物。稳态荧光和时间分辨荧光数据表明[C12iQuin]Br的荧光被DNA猝灭,属静态猝灭。荧光探针取代实验表明[C12iQuin]Br可能是AT碱基特异性小沟槽光敏分子。DLS结果显示DNA分子在[C12iQuin]Br浓度比较低时开始被压缩,随着[C12iQuin]Br浓度的增加逐步由线圈向球形结构转变,cryo-TEM印证了这一结果。[C12iQuin]Br的加入使得DNA的碱基堆叠和双螺旋发生了改变,但仍保持B型构象。另外,烷基链越长的[CniQuin]Br与DNA的作用力越强。FI-IR谱图说明阳离子异喹啉环通过静电作用与负电荷的DNA磷酸根基团发生作用,且[C12iQuin]Br分子的疏水碳链与DNA碱基间存在疏水作用。Zeta电势和ITC结果表明疏水作用在DNA结构转变过程中占主导作用。1H NMR和2D NOESY图谱表明光活性[C12iQuin]Br发生AT特异性小沟槽缔合。[C12iQuin]Br浓度较低时,[C12iQuin]Br分子可能平躺于DNA小沟槽,异喹啉环平面插入碱基间,且异喹啉环上的H7与DNA一侧链上的磷酸根基团之间只有几个埃的距离,而环上的H4在DNA另一侧链的糖环1'H质子附近。当[C12iQuin]Br浓度大于0.24 mM,[C12iQuin]Br在DNA的小沟槽处缔合达到饱和。继续增加的[C12iQuin]Br分子可能结合在DNA表面,异喹啉环在DNA的磷酸根附近,疏水链与DNA表面有一定的角度。这种独特的缔合特性构筑了新的功能型的[C12iQuin]Br-DNA复合物,因此有望在光动力学治疗和基因传递中得到有效地应用。
  3、利用紫外光谱、荧光光谱、圆二色谱、时间分辨荧光等技术揭示了抗癌药物盐酸巴马汀分子与DNA之间的缔合模式。巴马汀与DNA结合后,荧光发射峰强度、吸光度、时间分辨荧光、圆二色谱图等光谱参数产生了变化。盐酸巴马汀本身荧光较弱,但随着DNA浓度的增加,荧光强度显著增强。实验证明盐酸巴马汀分子与DNA之间存在着静电作用和嵌插作用,二者之间形成的是动态复合物。利用紫外光谱、荧光光谱、时间分辨荧光、等温滴定微量热等技术研究了离子液体表面活性剂[C12iQuin]Br对DNA与盐酸巴马汀相互作用的影响。实验表明随着[C12iQuin]Br含量的增加,使得盐酸巴马汀分子逐渐从DNA的碱基对间排除,取代了巴马汀分子与DNA发生作用,实现了抗癌药物从DNA中的解离。
[硕士论文] 徐双斌
生物学 集美大学 2017(学位年度)
摘要:环状RNA在三十年前就已被报道。最近随着高通量测序技术的发展,研究人员在越来越多的物种中发现环状RNA,但在硬骨鱼中却仍鲜有报道。大黄鱼是我国一种重要的海水养殖鱼类,本研究通过利用大黄鱼基因组模拟得到的数据,对现有的两种挖掘环状RNA的生物信息学流程进行评估,从中选取合适的流程对实验室原有大黄鱼的真实转录组数据进行环状RNA的挖掘,并进行了大黄鱼雌雄鱼性腺环状RNA的测序、挖掘,比较了两者之间环状RNA的表达差异。主要的研究结果如下:
  1.利用模拟数据对目前常用的两种环状RNA挖掘流程,从不同的环性与线性转录本测序量方面进行评估,发现在环性转录本较低的条件下,其中的一款流程CIRCexplorer检测到的环状RNA的准确率较高。但在环性转录本较高的情况下,另一款流程CIRI检测到的环状RNA的准确率有所升高,挖掘到的环状RNA的数量也较多,但CIRCexplorer的准确率仍高于CIRI,挖掘到的环状RNA的数量仍低于CIRI。
  2.根据模拟数据的评估结果,利用CIRCexplorer对大黄鱼多组织混合样本的RNA seq数据进行环状RNA挖掘,检测到了975个环状RNA分子,其中65.95%来自编码基因的外显子;随机挑选3条进行验证,其中2条得到了确认。对挖掘到的外显子环状RNA来源基因进行GO以及KEGG富集分析,结果显示,这些来源基因主要富集在结合、翻译起始因子、细胞质内大分子代谢、翻译等通路中。对其进行microRNA靶点预测的结果显示,大黄鱼环状RNA中有丰富的miRNA的结合位点,其中有363个环状RNA具有超过5个潜在的microRNA结合位点,22个具有10个以上的miRNA-430与let-7家族的结合位点。
  3.进行了大黄鱼精巢和卵巢环状RNA测序,从测序数据中,共检测到环状RNA6115个,其中2693个在精巢中特异表达,1053个在卵巢中特异表达;余下2369个在精巢和卵巢都有表达的环状RNA中。表达差异分析结果显示,有1065个环状RNA的表达量在精巢相对上调,而有621个表达量在精巢中相对下调。对这些差异表达的环状RNA的编码基因进行GO富集分析,结果表明这些基因主要富集在神经系统发育(GO:0007399 nervoussystem development)、蛋白质结合(GO:0005515 protein binding)以及谷氨酸受体活动(GO:0004972 NMDA glutamate receptor activity)等GO术语上。KEGG代谢通过分析结果显示,雌雄性腺环状RNA的编码基因在脂类代谢途径(Ubiquitin meditated proteolysis)、孕激素介导的卵母细胞成熟(Progesterone-mediated oocyte maturation)以及泛素介导的蛋白酶解(TNF signaling pathway)等代谢通路中具有明显差异。性腺中检出的环状RNA具有丰富的miRNA结合位点,网络分析结果显示大黄鱼性腺中的circRNA-miRNA-mRNA可能具有复杂的调控网络。
[硕士论文] 王龙
信号与信息处理 扬州大学 2017(学位年度)
摘要:长非编码RNA(long non-coding RNA,lncRNA)是一类转录本长度大于200核酸的非编码RNA。随着高通量测序技术的广泛应用,已在生物体内发现大量lncRNA,其中有相当一部分的lncRNA具有重要的生物学功能,如参与胚胎干细胞凋零、细胞循环控制等细胞过程。在lncRNA的调控机制研究方面,已有一些模型被提出,如lncRNA能够招募或驱赶蛋白质对DNA的绑定、作为蛋白质复合体的骨架等。然而,lncRNA的机制和功能研究尚处于起始阶段。与蛋白质编码基因不同,大部分lncRNA不能用于产生蛋白质。同时,lncRNA与蛋白质编码基因或其转录产物——信使RNA(Messenger RNA,mRNA)有许多相似之处。在基因层面,lncRNA与蛋白质编码基因具有相似的组蛋白修饰轮廓和剪接信号;在转录过程中,lncRNA往往也是聚合酶的产物。基于长非编码RNA和蛋白质编码基因的特征和功能差异,推测两者的转录机制也有可能不同,进而影响功能表现。
  本文从预测和分析lncRNA的转录因子绑定位点(Transcription Factor Binding Site,TFBS)入手,研究lncRNA的转录过程。首先全面综述了TFBS预测算法和TFBS模型数据库。在此基础上,提出了名为lncRScan-TFBS的生物信息学方法,该方法根据来自染色质免疫沉淀——高通量测序实验(ChIP-Seq)的数据,分析与lncRNA关联的TFBS。lncRScan-TFBS的功能主要包括:报告输入ChIP-Seq峰和基因的基本统计信息、转录起始位点(Transcirption Start Site,TSS)与峰之间的距离,分别针对lncRNA和蛋白质编码基因的TFBS进行基序查找和富集度分析等。
  将lncRScan-TFBS应用于小鼠干细胞(Mouse Embryonic Stem Cell,mESC)的ChIP-Seq数据,实验结果表明调控因子c-Myc、 n-Myc、Esrrb、Klf4和Tcfcp2l1与CTCF的TFBS有重叠,说明它们共同参与转录调控过程。特别是,c-Myc和n-Myc的TFBS几乎完全重叠,并且它们都与CTCF的TFBS有较大的重叠,这表明它们可能通过这些相关的TF与CTCF紧密相互作用。实验结果并没有发现lncRNA特异性的转录因子绑定位点,但发现部分转录因子在调控lncRNA转录时,比调控蛋白质编码基因转录有更长的距离,这可能是lncRNA表达量较低的潜在原因。综上,lncRScan-TFBS可用于有效分析lncRNA的TFBS,进而帮助推断lncRNA特异性的转录模式。
[硕士论文] 史冰杰
生物医学工程 东南大学 2017(学位年度)
摘要:转录因子结合谱是指转录因子能够特异性识别并结合的所有DNA序列及其相对亲合性。目前鉴定转录因子DNA体内结合谱主要方法是依赖于染色体免疫共沉淀实验(ChIP)及高通量测序(ChIP-Seq)技术,是目前研究转录因子DNA体内结合谱的主要技术。ChIP-Seq技术是将ChIP实验与下一代测序技术相结合,通过ChIP实验得到能够与转录因子相结合的DNA片段,采用下一代测序技术对这些片段进行高通量测序,获得序列信息,通过生物信息学分析,研究转录因子调控网络。
  随着高通量测序技术的飞速发展,公共数据库中收录了大量的转录因子NF-κB结合谱数据。由于数据分析方法和软件繁多,采用标准统一的数据处理流程综合分析多组数据的研究较少,鉴于这种现状,本文通过分析NCBI数据库中的NF-κB ChIP-Seq数据,构建了一套具有通用性的转录因子ChIP-Seq数据分析流程:(1)原始测序数据收集整合;(2)数据格式统一化;(3)数据质量控制、评估、筛选;(4)原始数据预处理之后进行reads mapping,核验mapping率;(5)peak calling;(6)peak交集重叠分析,设定1bp重叠即认定为两个峰之间存在交集;(7)模体挖掘分析,首先,将peak按照富集倍数由高到低排序,取富集倍数排在前500的peak,然后对这些peak进行宽度截取,截取summit上下游各50bp,以此来保证MEME的运行速度和效率,获得最终模体。
  本文共收集到14篇文章的48个可用的NF-κB p65ChIP-Seq数据,其中12篇文章的42个数据是人的ChIP-Seq数据,2篇文章的数据是鼠的ChIP-Seq数据,依据数据实验组和对照组的设定情况分成27组。按照本文构建的ChIP-Seq数据分析流程,处理所有的NF-κB p65ChIP-Seq数据并进行建库,主要处理结果上传到服务器,以供查阅。
  筛选出实验条件相同的四种细胞ChIP-Seq数据分析结果进行深度挖掘分析,使用intersect组件进行重叠峰取交集,获得396个共有的转录因子结合峰。通过对这396个结合峰进行模体挖掘分析验证了这些结合峰与NF-κB p65高度相关,因此,这396个结合峰被确定为是NF-κB p65与DNA相互作用的高度保守结合区域。随后,对这些保守结合区域的关联基因进行了功能注释和信号通路分析,发现342个基因与细胞内的炎症反应和免疫应答存在着密切的关系,同时能够调节细胞的新陈代谢过程和细胞生长、分化以及凋亡,说明这些关联基因与NF-κB密切相关,作为NF-κB调控的保守靶基因能够在疾病诊断等方面起到重要作用。
  综上所述,本文构建了标准统一的NF-κB p65ChIP-Seq数据分析流程,依照该流程分析了大量的ChIP-Seq数据,并建立了p65ChIP-Seq数据库。同时,选取其中四种细胞的数据分析结果进行深度挖掘分析,获得396个高度保守的结合峰,并对这些结合区域的关联基因进行了GO功能分析和信号通路分析,为利用NF-κB靶基因进行疾病诊断等提供了重要资源。
[硕士论文] 黄可
预防兽医学 扬州大学 2017(学位年度)
摘要:PCR(Polymerase chain Reaction,聚合酶链式反应)是分子生物学中一种重要的诊断技术,灵敏度与特异性是表现其扩增效率的两个重要参考指标。影响PCR扩增效率的因素众多,而引物和探针的设计是一个PCR成功的关键。目前有关引物设计的研究多集中于引物的长度、GC含量等方面,而引物与模板的错误结合而引起的非特异性扩增或扩增效率下降的相关研究还很匮乏且不系统,并且无适用于临床应用的实例,目前还没有探针核苷酸错配对PCR检测影响的相关研究。为了提高PCR设计的效率和可信度,从引物与探针的核苷酸序列的特异性对扩增效率的影响进行研究十分必要,为引物与探针的设计提供更可靠的参考。
  在本论文的第二章中,我们以肺炎衣原体的全核酸为模板,在上下游引物的不同位点引入核苷酸错配,研究单个核苷酸错配、多个核苷酸错配在不同位点、数量以及错配类型对扩增效率的影响,并囊括了引物3'端4种碱基突变为其它任何碱基类型对扩增效率的影响;同时考虑到DNA聚合酶的影响,在经过对市场上商业化DNA聚合酶扩增效率的对比后,研究扩增效率较好的Takara和Platinum两种DNA聚合酶在引物发生核苷酸错配时对反应扩增效率的影响情况,本实验对扩增效率的界定是通过实时荧光定量PCR定量的拷贝数进行计算获得的。进一步研究,通过对FRET探针核苷酸进行错配,在FAM探针上的不同位点依次增加核苷酸错配的数量,研究其对PCR检测的核苷酸错配的容忍度。在第三章中,将错配研究所得到的结论应用于实际引物设计,对临床上18S rRNA序列同源性较高的巴贝斯虫以及泰勒虫进行分子区分,设计特异性地扩增巴贝斯虫的PCR,并且通过临床样品和其它参考方法比较,并用电泳和测序验证。
  上下游引物进行核苷酸错配时,其结果表明,单个核苷酸错配:Platinum DNA聚合酶比Takara DNA聚合酶的扩增效率更低,单个核苷酸错配对Takara DNA聚合酶的扩增效率没有太大影响(接近100%);引物3'端核苷酸由C变为A,以及由G变为C时扩增效率最差,由T变为C以及由A变为C时,扩增效率最好;距离3'端4个碱基位置发生错配时,扩增效率为82.3%;Platinum DNA聚合酶在引物3'端使用简并碱基,简并两个,三个,四个碱基的平均扩增效率分别为59.3%、43%、33.9%。多个核苷酸错配时:Platinum DNA聚合酶和Takara DNA聚合酶在引物5'端及引物中间的错配的平均扩增效率为92.6%和100%,对扩增效率影响不明显,5'端能够容忍连续8个核苷酸错配;Takara DNA聚合酶在引物3'端连续4个错配时扩增效率下降最快(15%以下);上下游引物错配位点不在3'端时,其总数加起来为10个时,扩增效率不低于40%。
  FAM探针进行核苷酸错配时,其结果表明:探针发生少数几个错配时,扩增效率没有影响,但在探针中间位置连续发生5个错配时,将直接导致没有扩增曲线;在任何位点发生错配时,其Tm值会随着错配个数的增加而逐渐下降,且错配位点发生在探针的中间时,其Tm值下降的更明显:发生4个核苷酸错配时,中间位点的Tm值下降10℃,下降幅度明显大于探针3'端与5'端错配4个时Tm下降的3℃。
  巴贝斯虫和泰勒虫是以蜱虫为传播媒介、胞内寄生的原虫,它们的18S rRNA序列高度相似,临床症状极度相近,实际检测中难以区分。本研究的文献查阅和初步试验表明,被大家最广泛认可的PCR方法不可以区分这二种病原体。本研究应用错配结论进行引物设计,建立区分巴贝斯虫与泰勒虫的PCR方法。在使用设计的巴贝斯虫特异性引物扩增人工构建的泰勒虫18S rRNA质粒时,当特异性引物与泰勒虫只差引物3'端最后一个核苷酸且模板浓度为100拷贝/反应时,若引物由G变为C,两种聚合酶都没有扩增出泰勒虫产物;由T变为G时,Takara DNA聚合酶扩增出泰勒虫产物,Platinum DNA聚合酶没有扩增出泰勒虫产物;由A变为C时,两种聚合酶都能扩增出泰勒虫产物。使用由G变为C这套特异性引物扩增40个来源不同的临床样品时,结果显示阳性率为7.5‰测序结果表明扩增序列正确,低于引用的常用的引物的50%与30%,且其测序结果中有泰勒虫序列出现。
  综上所述,本研究关于引物与探针核苷酸错配对扩增效率的影响表明,在引物3'端发生核苷酸错配时,不同DNA聚合酶的效率有差别,Platinum DNA聚合酶比Takara DNA聚合酶的特异性更强,而Takara DNA聚合酶的灵敏度更高,能够容忍较多的错配;引物3'端由G变为C和由T变为G时对PCR扩增效率影响最大;错配发生在距离3'端4个碱基或发生在5'端(能容忍连续8个错配)和中间时,对扩增效率的影响不大;上下游引物除3'端以外的其它位点错配在错配数量达到10个时仍然能有扩增反应。探针核苷酸在中间发生错配时对扩增效率的影响较大,能容忍的错配个数为5个核苷酸。本研究关于引物设计的实际应用表明:基于上述结论所建立的PCR方法可特异性地区分诊断巴贝斯虫和泰勒虫,这将为在临床情况下区分诊断类似于像巴贝斯虫与泰勒虫这种基因同源性较高的病原体提供了重要的参考依据。但关于错配延伸的相关机制目前尚不明确,对其进行更深入的研究将为引物和探针的设计提供更多的参考价值。
[硕士论文] 高宏珍
生物信息学 华中农业大学 2017(学位年度)
摘要:环状RNA是一类呈闭合环状结构的非编码RNA分子。近年来,二代测序技术的兴起和生物信息学的进步,使得大规模研究环状RNA成为可能。目前,关于环状RNA的研究仍然处在初步发展的阶段,还有很多环状RNA的功能是未知的,已有的成环机制尚不完善。
  本文利用4个人类细胞系和1个小鼠细胞系的RNA-Seq数据,使用三种环状RNA鉴定工具find circ,CIRCexplorer和CIRI,同时综合了ChIA-PET数据等来探讨环状RNA的成环机制。分析内容主要包括环状RNA鉴定、特征分析、成环机制探究,Host基因参与的染色质交互网络,及环状RNA功能相关的初步分析等。具体结果如下:
  在K562,GM12878,HeLa,hESC和mESC中分别鉴定出3275,2682,1501,1819,708个环状RNA,分别来自1871,1687,1070,1264,571个host基因,这些高可信度的环状RNA用于后续分析。
  绝大多数环状RNA倾向于使用转录本中间的外显子成环,具有较长的侧翼内含子,侧翼内含子上富集Alu元件及SRSF3等蛋白的结合位点。其表达具有细胞特异性,且细胞系间越保守的环状RNA,其表达量越高。少数转录本第一个和最后一个外显子也能参与形成环状RNA。
  我们使用RNAPⅡ的ChIA-PET数据,找出侧翼内含子间有染色质交互的环状RNA,与侧翼内含子互补配对的环状RNA进行比较,在GM12878中,我们发现染色质交互对于环状RNA的表达量具有显著的影响,相反地,侧翼内含子互补配对对于环状RNA的表达量没有显著影响。
  环状RNA的Host基因在K562 RNAPⅡ介导的染色质交互网络中度分布显著低于其他类型基因,而在GM12878中的结果相反。Host基因所富集的KEGG通路与白血病、结肠癌、前列腺癌等多种癌症相关。
[硕士论文] 卞非卡
生物医学工程 东南大学 2017(学位年度)
摘要:G-四联体(G4-DNA)是DNA的一种特殊二级结构。它是一条富含G碱基的短链,4个G碱基通过Hoogsteen氢键自组装成G-四分体,多个G-四分体通过π-π堆积作用形成G-四联体。人类基因组中含有高达376000个G4-DNA结构,广泛的存在于染色体端粒区域、基因的启动子区域、免疫蛋白开关区域以及外显子区域当中。G4-DNA结构参与了诸如细胞的增殖、基因的表达与调控、蛋白质的翻译等生物功能,因此对G4-DNA的高灵敏度、高准确度、快速的分析与相关疾病的诊断方法具有重要的研究意义。
  近年来,荧光编码微球技术取得了很大的进展,可广泛应用于核酸、蛋白质、糖类等生物组分的高通量、高灵敏度、快速的分析。其中量子点荧光编码微球既利用了量子点优良的光学性质,又使得编码更为多样解码更为方便。然而在大多数情况下其检测灵敏度还无法达到临床分析的要求,需要进一步集成信号放大技术。
  滚环扩增是一种高效的核酸检测信号放大方法,具有成本较低、操作简单、重复性好和无需改变温度的优点。本论文通过在二氧化硅包覆的量子点荧光编码微球表面进行滚环扩增反应,实现了对人类基因组不同区域的G4-DNA的高灵敏、多元检测。论文主要研究内容如下:
  1.使用高温热注射法合成了发射峰分别为513nm(绿色)和582nm(橙色)的CdSe@ZnS量子点。使用分散聚合法合成了聚苯乙烯微球种子,在此基础上使用种子聚合法合成了PSDM介孔微球。使用“溶胀-挥发”法包裹橙色和绿色两种量子点形成量子点荧光编码微球。利用St(o)ber法制备了二氧化硅包覆的量子点编码微球(Qbead@SiO2)。所构建的Qbead@SiO2具有优良的荧光稳定性。
  2.发展出了Qbead@SiO2-RCA分析法用于G4-DNA的高灵敏检测,检测限达到XXfM。该分析法的主要操作步骤包括:通过羰基二亚胺反应在Qbead@SiO2-COOH表面偶联capture probe序列,通过杂交固定Padlock DNA序列;靶标G4-DNA与PadlockDNA杂交,Padlock DNA在T4连接酶作用下封闭成环,并进一步在酶催化作用下复制扩增;ZnPc对RCA产物进行染色;通过流式细胞术对ZnPc荧光信号进行定量检测。
  3.基于三个Qbead@SiO2荧光编码,利用Qbead@SiO2-RCA分析法进一步实现了对三种G4-DNA序列的同时检测,检测特异性较好。
[硕士论文] 王超
生物医学工程 东南大学 2017(学位年度)
摘要:随着人类基因组的测定,后基因组时代面对着海量的基因组数据,所以实验室研究中对准确、快速、高通量的生物信息分析技术有着急迫的需求。从临床分析来看,当流行性传染病大规模爆发时每天有大量的临床样本需要在短时间内进行处理和分析,这部分工作将耗费大量的人力、物力,同时无法保证处理或分析的准确度。因此准确、快速、高通量地进行生化分析或生物信息获取,具有非常重要的实用价值。针对上述需求,本课题组研究并开发了基于磁性纳米颗粒的自动化核酸检测系统。本文立足于对该系统中多种耗材的精确移取技术的研究,为开发出合乎实际应用需求的全自动核酸检测系统奠定基础。
  针对全自动核酸检测系统中不同耗材的抓取和转移问题,本文设计并建立了耗材精确移取系统,包括三轴机械臂精确定位系统和基于FSR传感器的压力感知机械抓手模块。其中,三轴机械臂采用悬臂式的设计结构,以伺服系统为动力源,配合高精度滚珠丝杠,可带动机械臂定位到平台上的任何工位上。控制系统由两块以嵌入式芯片STM32F103ZET6为核心的控制板组成,通过搭载改进型的等频率S形算法,可提高机械臂运动速度和启停平稳性。基于FSR传感器的压力感知机械抓手利用固定在机械手指上的FSR传感器可实时读取抓取耗材过程中的压力数值,并与利用SOLIDWORKS软件中Simulation功能模型分析与实际测量得到的不同耗材有效抓取区域的判定条件进行对比,判断抓取的位置是否合理。耗材转移过程中,可通过设计的自锁梯形丝杠固定机械手指的位置,保持耗材的稳定。如果在转移过程中出现耗材偏移或者掉落等情况,FSR传感器可及时将异常压力数据反馈至控制芯片处理,从而保证实验安全进行。
  通过原点回归与不同距离的重复定位精度实验可以看出,机械臂的原点回归误差最大为0.055mm,不同运行距离的重复定位误差最大为0.06mm,这可满足系统定位的要求。对整个耗材精确移取系统测试实验结果表明,机械臂与基于FSR传感器的压力感知抓手配合,可以较好地完成耗材抓取与转移操作,且在转移过程中,基本不会出现耗材掉落和液体溢出的问题。
[硕士论文] 李尚毅
软件工程 武汉科技大学 2017(学位年度)
摘要:DNA和RNA核酸分子在生物的整个进化过程中是不可缺少的一部分。近年来随着生物技术的发展,经过优化设计的核酸分子的自组装技术在生物分子计算、生物传感器、靶向药物治疗等领域也有着重要应用。在这些领域中,核酸分子的优化设计和结构预测是一个重要的研究内容。核酸分子可以通过碱基的氢键吸引,折叠自身而形成多样的二级结构。任意的单链核酸分子都存在海量的碱基匹配组合,究竟哪种匹配的结构是核酸分子最稳定的结构是个复杂的组合优化问题。此外,包含假结的核酸分子二级结构预测问题已被证明是一个NP完全问题。因此,预测含假结的核酸分子的二级结构是一个重要的热点问题和难点问题,具有重要的理论意义和应用价值。目前,国内外许多学者已提出了预测核酸分子二级结构的各种算法。在目前已有的算法中,精确算法在核酸分子规模较小时有不错的搜索效果,但随着核酸分子碱基数量的增多,这些精确算法就显得有些无能为力,无法在有限的时间内预测出核酸分子的结构,且传统的动态规划算法无法预测出假结;另一方面,有些近似算法虽然能够处理碱基数量较多的核酸分子序列,但收敛速度过慢。
  本研究提出一种基于遗传算法的含假结的二级结构预测算法,允许在RNA分子骨架的下方连接氢键形成可平面的假结,最大程度地降低核酸分子的自由能。算法用茎区的长度和自由能一起作为作评估个体的标准,针对核酸分子的特点,提出了改进的交叉、变异遗传算子。本文利用PseudoBase数据库的核酸实例进行了测试,并与ProbKnot、Mfold、HotKnots等其它著名的核酸二级结构预测算法进行比较,分析结果证明了本文算法的有效性和可靠性。为了进一步提高求解较长的核酸分子的计算效率,本文选择了NVIDIA公司推出的CUDA并行计算模型,将遗传算法中种群初始化、适应度计算、选择、交叉、变异等重要的遗传算子进行并行化,利用GPU进行并行计算。实验结果表明,和传统的基于CPU的遗传算法相比,这种基于GPU的并行计算模式可以显著提高算法的效率。
[博士论文] 柳军涛
运筹学与控制论 山东大学 2017(学位年度)
摘要:当今的生物技术快速发展,生物学大数据每天以爆炸式的速度增长,这无疑给生物学研究和发展带来前所未有的机遇,然而传统的生物学分析方法已经无法处理如此庞大的数据。生物信息学,作为一门新兴的交叉学科应运而生,它将数学,计算机科学,统计学等结合起来研究和解决大数据下的生物学问题。其中一个非常基础,重要而又极具挑战性的问题就是序列拼接问题,转录组拼接就是其典型代表。转录组拼接就是利用RNA-seq等测序技术产生的海量测序片段拼接出实验组织中所有的表达转录本,并估计出其表达量。本文的研究主要集中在如何利用组合优化方法来解决转录组拼接问题,这对于新物种研究,以及与异常转录相关的人类复杂疾病研究等相关问题意义重大。
  第二代RNA-seq测序技术的快发展和广泛应用给转录组拼接工作带来无限机遇的同时,也伴随着在计算上前所未有的挑战。目前的拼接算法根据计算策略可大致分为两类:
  1)基于参考基因组的转录组拼接算法;
  2)从头转录组拼接算法。当有高质量的参考基因组存在时,可先将测序片段回贴到参考基因组上,之后,根据回贴的结果对每个基因分别进行转录组拼接。在参考基因组不存在,不完整,严重片段化或是在癌组织中大量突变等,从头转录组拼接就成为了非常重要的且是唯一的选择。从头拼接策略不需要依赖任何参考信息,直接从测序片段本身出发,重构出最终的表达转录体序列。无论是转录组拼接的何种策略,目前的算法在计算精度和计算效率上都存在明显的缺陷和严重的不足,导致其实际应用效果非常差。因此,两种策略都亟待开发出全新的,高质量的拼接算法,以准确重构出真核生物组织中的全长转录组。
  基于上述的考虑,本文设计全新的基于参考基因组的转录组拼接算法TransComb,这个算法给转录组拼接提出了全新的设计思路,极大的弥补了当前算法存在的严重缺陷。经过在模拟数据和多组真实数据上的测试,结果充分地表明,无论在模拟数据还是真实数据上,本文开发的拼接算法与其他主流拼接算法比较都展示出明显的优势:不仅具有更高的灵敏度,而且具有更高的准确度,对其他算法普遍存在的假阳性高的难题得到了极大程度的解决。而且,在计算资源消耗方面,TransComb使用的CPU时间明显更短且运行内存更低。经过综合的测试表明,TransComb无论是在计算精度上还是在计算效率上都显著超过其他拼接算法。
  本文的新算法TransComb具有以下几个明显的的创新点:
  1)新的技术构造出更加准确的剪接图。本文设计出使用双端测序信息来修复片段化的外显子的技术,以及为修复错误连接的外显子而设计出的窗口滑动技术。
  2)梳图模型和双端测序信息解决转录组拼接的核心难题。转录组拼接的核心难题就是外显子两侧进出边连接的不确定性,这也是目前几乎所有的拼接软件共存的一大漏洞。本文开发的梳图模型将测序覆盖度信息和双端测序信息合理的整合在一起,巧妙的解决了拼接的核心难题。
  3)全新的图模型:加权节点图。打破基于RNA-seq的转录组拼接算法依赖传统重叠图和剪接图的现状,我们的算法是在加权节点图的基础上完成拼接,节点图中包含了更多有效信息,因而克服了现有算法的若干缺陷。
  4)基于节点图设计的新的路的延伸策略。该策略在延伸过程中每一步都有节点图上边的权重作为依据,使得每一条延伸出的路都以很大概率代表一个表达的转录体,无论该转录体是高表达还是低表达。
  尽管TransComb在拼接方面表现出了明显的优势,但是其仍然存在不足之处。比如:
  1)TransComb在设计过程中没有实现并行化,因此,在程序设计方面还有待进一步提升。
  2)表达量估计算法设计没有将测序偏好等信息考虑进去,因此,在某些数据上的表达量估计中TransComb与其他主流算法效果接近,没有表现出明显的优势,这个过程还有待于进一步提高。
  最后,本文还将简要介绍我们开发的另一个转录组拼接算法BinPacker,该算法是不依赖参考信息的从头拼接算法。BinPacker把转录组拼接问题重新模型化为追踪一系列物品的轨迹模型,每个物品代表一种转录体,物品的尺寸表示该转录体的覆盖度。这个方法能够巧妙地将覆盖度信息合理的利用在拼接过程中,另外,BinPacker具备如下两个独有的特征:
  1)只有剪接图中的可变剪接事件作为拼接过程的考虑对象;
  2)拼接大量杂乱无章的测序片段的过程被形象的模型化为梳理剪接图中的边的过程。最后,我们同时在模拟数据和真实数据上测试BinPacker,测试结果显示,BinPacker在各种数据类型下均明显超过几乎所有现存的从头拼接软件,包括最主流的软件Trinity,在某些数据下,BinPacker的表现甚至超过了基于参考基因组的拼接算法,如StringTie。而且,相比于其他的拼接软件,BinPacker消耗更少的运行时间和更低的内存。
  TransComb和BinPacker已经用C++语言实现成一个开源的软件,两个软件可以通过以下网址下载:http://sourceforge.net/projects/transcriptomeassembly/files/
[硕士论文] 邱桂华
药物化学 南方医科大学 2017(学位年度)
摘要:微小RNA(microRNA,miRNA)是一类内源的、长度约为18~25nt的短链非编码RNA。miRNA具有基因调控作用,其表达水平异常往往与疾病的产生密切相关。因此,miRNA被视为一类新型的生物标记物。此外,病毒核酸非编码区域含有高度保守性的核酸序列,该保守核酸序列在病毒变异过程中能够保持不变。因此,无论是miRNA,还是病毒核酸保守序列,对其进行检测,在相关疾病的早期诊断和预测方面具有重要性意义。
  金属有机骨架(Metal-Organic Frameworks,MOFs)是由无机金属离子和有机配体配位自组装构筑形成的新型无机有机杂化材料。2013年,Chen等首次报道具有良好水稳定性的MOFs可与荧光标记的探针DNA(probe DNA,P-DNA)结合构筑P-DNA@MOF传感平台,用于荧光检测核酸分子。但是,MOFs用于核酸分子检测仍处在起步阶段,只有为数不多的MOFs被成功用于检测DNA/RNA,主要是因为大多数合成的MOFs对水不稳定。因此,构建具有水稳定性的MOFs结构,并从中筛选出能够灵敏特异性检测疾病相关的核酸分子对疾病的检测具有重要的意义。
  近年来,本课题组一直致力于设计并合成结构新颖、且具有良好水稳定性的MOFs及其生物性能研究。含亚甲基的季铵盐型多羧酸配体与金属离子构筑的MOFs具有良好水稳定性,可避免其在核酸分子检测中结构坍塌而导致检测失败。本论文研究了该类MOFs与荧光标记的探针DNA构筑P-DNA@MOF传感平台及其对疾病相关的RNA序列检测的性能:
  一、应用三维MOF{[Cu(Cmdcp)(phen)(H2O)]2·9H2O}5(1)分别与FAM荧光标记的P-DNA-1和ROX荧光标记的P-DNA-2结合构筑P-DNA-1@1和P-DNA-2@1传感平台,并成功用于荧光检测EBOV的保守序列片段(T1)及该病毒编码的类miRNA(T2)。其中,MOF1对P-DNA-1和P-DNA-2的淬灭率分别为75%和95%;对T1和T2的检测时间分别为12.5min和3.2min,检测限分别为63pM和206pM。为了克服操作繁琐、费时费力的缺点,进一步将P-DNA-1和P-DNA-2同时与MOF1结合构筑P-DNAs@1传感平台,并结合恒波长同步荧光检测法同时对T1和T2进行荧光检测。虽然MOF1对T1和T2的同步检测与单独检测活性相当,但是同步检测可以简称检测过程,节约检测时间。
  二、MOFs与P-DNA主要通过π-π堆积、静电以及氢键等作用力结合,增加MOFs结构中的π体系有利于MOFs更有效的与P-DNA结合。因此,我们通过引入稠环配体bipy(bipy=4,4'-bipyridine)和具有更大稠环体系的季铵盐羧酸Dcbb(Dcbb=1-(3,5-dicarboxybenzyl)-4,4'-bipyridiniumbromide)共同构建了二维MOF[Cu(dcbb)(bipy)(H2O)]n(2),并将其用于同步荧光检测ZIKV非编码区的3段保守序列片段T3、T4和T5。研究表明,MOF2对分别为FAM、ROX和Cy5荧光标记的P-DNA-4、P-DNA-5和P-DNA-6均具有良好的荧光淬灭性能,荧光淬灭率分别为88%、96%和80%,并且所构筑的P-DNAs@2能够高灵敏、高选择性地同步荧光检测T3、T4和T5,检测时间分别为12min、2.3min和3min,检测限分别为564pM、158pM和186pM。
  三、为了考察P-DNA@MOF传感平台的实用价值,我们将检测对象由病毒核酸非编码区的保守序列转为疾病相关的且表达异常的miRNA。采用课题组前期合成的一维MOF{[Cu(Dcbb)2(H2O)2]·10H2O}n(3)构建传感平台,用于荧光检测与胃癌相关的5种miRNA。由于目前仍未寻找到适用于同步荧光检测的5种荧光标记物,因此,我们对与miR-185(T6)、miR-20a(T7)、miR-92b(T8)、miR-25(T9)以及miR-210(T10)互补的5种DNA均进行FAM荧光标记,并分别与MOF3结合构筑P-DNA-6@3~P-DNA-10@3传感平台,淬灭率分别为87%、94%、77%、95%以及96%。P-DNA-6@3~P-DNA-10@3分别对T6~T10逐个进行荧光检测,检测时间分别为13min、14min、15min、19min以及38min;检测限分别为172pM、321pM、91pM、559pM以及132pM。本实验研究初步证明以MOFs构建的传感平台对多种miRNA检测的可行性。
  四、为了进一步研究MOFs构建的传感平台在细胞水平上对miRNA的检测性能,我们采用了对核酸酶稳定且对其靶向RNA的亲和力较普通核酸强的2'OMe-PS chimera(简称mDNA)来构建传感平台。我们采用FAM、TAMRA和Cy5分别对3种mDNA进行荧光标记得到P-mDNAs,并与三维的MOF{[Cu2(Cmdcp)2(bipy)(H2O)2]·0.5H2O}n(4)同时结合构筑荧光传感平台P-mDNAs@4用于同步荧光检测与口腔癌相关的miR-21、miR-155和miR-375。其中MOF4对P-m21、P-m155和P-m375的荧光淬灭率分别为89%、94%和87%;对T21、T155和T375的检测时间分别为5.3min、1.9min和1.5min;检测限分别为229pM、64pM和385pM。与P-DNAs@4传感平台(对T21、T155和T375的检测时间分别为13min、3.4min和2.6min;检测限分别为750pM、445pM和629pM)相比较,P-mDNAs@4对靶向miRNA的检测更为快速和灵敏。在此基础上,我们进一步将P-mDNA@4导入UM1、HSC3和SCC9这3种口腔癌细胞并成功地检测胞内高表达的miR-21、miR-155,而对低表达的miR-375没有显示检测效果。
  上述荧光检测中,MOF1-4分别构筑的荧光传感平台均能快速、灵敏、高选择性地检测相应的靶向RNA。我们还进一步通过结合常数的计算、荧光各向异性实验和PAGE凝胶电泳实验初步阐述了MOFs检测核酸分子的检测机理。
[硕士论文] 赵泽
生物化学与分子生物学 大连医科大学 2017(学位年度)
摘要:维持基因组的稳定性对细胞和组织发挥正常功能至关重要[1]。每天,人体内每个细胞在内源和外源因素作用下可发生多至105个DNA损伤。为了应对这些损伤,机体进化出复杂的系统来识别DNA损伤,停止细胞周期进程,调节细胞新陈代谢,修复DNA损伤,并在损伤不能修复时诱导细胞程序性死亡等。这一系列信号调控通路被称为DNA损伤应答通路[2,3]。如果DNA损伤不能及时、正确的被修复,会导致碱基突变或染色体的畸变,并最终导致肿瘤等恶性疾病的发生。严重的DNA损伤也可导致细胞死亡或细胞的衰老。在DNA损伤应答调控中,许多DNA损伤应答相关蛋白可以被磷酸化、泛素化、苏素化、甲基化和乙酰化等修饰调节[4,5]。除了多种酶对DNA损伤应答相关蛋白的修饰调节外,DNA损伤后,非编码 RNA包括微小非编码 RNA(miRNAs)和长链非编码 RNA(lncRNAs)也可以通过对靶基因进行转录后调节参与 DNA损伤应答[6]。miRNA是一类长度在22个核苷酸左右的非编码RNA。早期研究指出,敲低miRNA生成和功能发挥必须的dicer基因和ago2基因后,DNA损伤后细胞的生存率和细胞周期检测点阻滞水平会显著降低[7,8]。miRNA发挥功能的主要方式是通过碱基互补配对与靶基因mRNA结合,从而导致靶基因mRNA降解或mRNA翻译终止。DNA发生损伤时,miRNA可以直接调节DNA损伤应答相关蛋白的表达调节DNA损伤修复进程,也可以通过调节包括p53、E2F在内的转录调控因子的表达来调节DNA损伤修复进程。
  本研究收取了野生型果蝇w1118与p53突变果蝇p535A-1-42-4小时胚胎,使用4 Gy辐照处理,提取总RNA,寄送公司进行RNA-seq分析差异表达的miRNA。通过该策略,共鉴定发现了44个差异表达的miRNA;使用qPCR方法,U6 RNA作为内参,对随机选出10个miRNA,包括6个上调的miRNA(miR-263b,miR-137,miR-34,miR-375,miR-987,miR-284)和4个下调的miRNA(miR-1002,miR-2b-2,miR-7,miR-3)的RNA-seq结果进行了验证,结果显示 qPCR结果与 RNA-seq结果趋势一致,进一步证实RNA-seq结果真实可信。由于超过70%的果蝇miRNA已建立突变动物,本实验室由Bloomington果蝇株共享中心获得了30株miRNA突变的果蝇株,对其中的19株纯合存活果蝇进行了 DNA损伤敏感性检测。检测结果显示,10株miRNA突变果蝇对DNA损伤敏感,2株抵抗,7株与野生型果蝇没有差异。使用caspase-3染色,对10株辐照敏感的miRNA突变果蝇的翅膀胚芽组织(Wing Disc)进行检测,观察miRNA突变对DNA损伤诱导的细胞凋亡的影响。结果发现,辐照导致7株 miRNA突变果蝇的凋亡水平显著提升。使用分析软件 microRNA(http://www.microrna.org)和 TargetScan(http://www.targetscan.org)对miRNA的靶基因进行预测,发现果蝇促凋亡基因家族Reaper-Hid-Grim中的grim和sickle,效应caspase drice等是这些miRNA的潜在靶基因。本研究为在生物体水平阐明miRNA对DNA损伤应答的响应及对细胞凋亡的调控提供了重要数据基础。
[硕士论文] 张冬华
高分子化学与物理 中国科学技术大学 2017(学位年度)
摘要:本论文利用二维朗之万动力学模拟方法和理论分析研究了DNA发夹在拉力作用下的相转变行为。研究发现DNA发夹处于展开状态的概率与所施加的拉力大小有关,在拉力比较小时(f=1.5),DNA发夹几乎全部都处在折叠状态,展开状态只会偶尔出现。随着拉力的增加,由拉力导致的展开状态出现的频率会增加,直到拉力增加到f=2.0时,DNA发夹几乎全部处在展开状态。展开状态的概率与施加的拉力有定量关系,并且可以通过统计力学的角度进行解释。通过选取不同的参数组合,并进行大量的模拟实验,我们分别得到了DNA发夹的拉力-碱基配对强度和拉力-温度相图。所得相图表明碱基配对强度增强或温度降低都有利于DNA发夹处于折叠状态。DNA发夹在拉力作用下不会一直处在完全折叠或者是完全展开状态。DNA发夹可能只打开了一个或者几个碱基对。半打开状态是亚稳状态,在半打开状态时的自由能是局部最小值。模拟所得到的这些相图非常有益于加深人们对DNA发夹在拉力作用下的热力学性质的理解。另外通过朗之万动力学还得到了DNA发夹打开所需要的力与拉力速率的关系,以及DNA发夹打开时间和拉力之间的关系,此外还研究了DNA发夹打开概率与最大拉力和时间的关系。这些可以很好地帮助我们理解DNA发夹在拉力作用下的动力学性质。
[硕士论文] 刘婷
理论物理 华中师范大学 2017(学位年度)
摘要:microRNA(miRNA)是广泛存在于细胞中的一类最小的功能非编码RNA(non-coding RNA,ncRNA)。其生物学功能,主要表现为对靶基因(主要是信使RNA,mRNA)的调控。确定miRNA靶基因的方法有分子生物实验和信息学分析两种。实验方法是研究miRNA调控后mRNA的水平及其蛋白变化;生物信息学方法则是依据已被实验证实的miRNA与其靶基因序列之间的相互作用规律设计成的软件进行大数据分析,在基因库中寻找miRNA的可能调控的目的基因。
  实验研究表明:mir-260突变体能够加快秀丽隐杆线虫的衰老进程。可能的分子机制是mir-260通过间接影响基因jnk-1、eat-2的表达量来调控线虫的衰老进程。本文以mir-260为研究对象,以生物信息学预测和分子实验检测相结合的方法,研究mir-260对与衰老相关基因的直接调控。并结合实验数据,改进了基因调控的动力学模型。主要工作如下:
  在实验上,利用生物信息学方法(mircoRNA、mirSOM)预测mir-260的靶基因,并筛选出其中5个已报道与寿命有关的基因:coq-2、nuo-4、rps-10、tps-1、atp-3。进行分子实验,构建含有mir-260和上述靶基因的质粒,并将重组质粒转染到293T细胞,再利用双荧光素酶报告基因方法检测5个靶基因的荧光蛋白在不同时间的表达量。实验结果表明:1,coq-2、nuo-4、rps-10、tps-1、atp-3是mir-260靶基因;2,mir-260对靶基因的调控在转染后的36到60小时最强。
  在理论上,本文考虑了细胞内生物反应的累积性,改进了miRNA与mRNA相互作用的动力学模型,并利用改进后的模型,拟合实验数据。
[硕士论文] 张桂珊
信息与通信工程 汕头大学 2017(学位年度)
摘要:外显子是真核生物脱氧核糖核酸序列重要的功能区,准确地定位外显子区有利于理解蛋白质的结构与功能。真核生物包含长度为几个到几千个不等碱基对的外显子,而且较大比例外显子的长度都很小(<200碱基对)。鉴于短外显子缺乏明显的特征,因此寻找准确可靠的方法以自动确定短外显子的长度和位置显得尤为重要。而且准确定位基因组中外显子有利于设计药物与疾病治疗。例如,既往研究表明一些短外显子的突变在肿瘤侵袭的各个环节有着重要的作用。因而,识别短外显子仍然是一个开放性的问题。
  目前,预测外显子的方法大致可以分为两类:独立模型方法和依赖模型方法。依赖模型方法利用先验的基因组信息或者是在分析阶段通过训练分类器学习模型,独立模型方法不需要假设任何先验的信息来训练模型或估计参数。本文根据外显子与内含子信号的小波变换系数在相邻尺度之间的传播特性,利用B样条小波多尺度积来实现短外显子的预测,记为MP方法。该方法属于独立模型范畴。
  MP方法首先计算了外显子与内含子的小波系数在相邻尺度的Jensen-Shannon距离,发现相邻尺度上内含子信号的小波变换系数相关性比外显子弱。根据外显子与内含子小波系数在相邻尺度间存在的不同相关特性,通过将相邻尺度的小波系数相乘以增强外显子信号,抑制内含子噪声,进而实现对短外显子的准确预测。数据集HMR195和BG570是评估外显子预测方法性能的通用数据集,且这两个数据集中短外显子具有较高的比例。本文利用这两个数据集对MP方法在预测短外显子的预测性能进行评估,与现有五种独立模型方法相比,MP方法对长度范围(0,24]、[25,49]、[50,74]、[100,124]、[125,149]、[150,174]、[175,199]、[200,299]和[300,300+]外显子的探测准确率分别至少有26.8%、9.5%、8.2%、3.5%、10.2%、4.5%、7.8%、10.0%和4.4%的提高。
  基于MP的方法对短外显子进行预测的优点主要体现在两方面:(1)设计了一种新的B样条小波函数,在多尺度域提取外显子的周期三成分;一方面消除了窗口长度对预测结果的影响,另一方面该小波函数具有较高的曲线编辑自由度;(2)探索短外显子在B样条小波变换域在各相邻尺度的空间相关性,这些相关性特征有利于显现传统检测方法无法观测的潜在信息;(3)采用正向与反向结合的成对数值表示方法计算输出值,不仅反映了DNA的真实结构,而且提高了计算效率。
[硕士论文] 彭园园
凝聚态物理 郑州大学 2017(学位年度)
摘要:本文的主要内容是通过对准一维DNA分子结构的电荷输运性质进行研究,探索存在关联无序的低维体系的量子输运性质。具体讲,我们通过对具体的DNA分子链建立相应的紧束缚模型,然后,利用转移矩阵的方法,研究的输运性质对于其DNA序列,以及门电压等性质的依赖关系。
  论文的第一章,讲述了近年来对DNA分子导体的研究进展、研究意义。并对DNA分子本身的结构特点、构成因素,以及其上电荷的输运性质进行了简略的介绍。第二章讲述了目前常采用的处理DNA分子输运的理论模型,以及处理准一维体系输运性质常用的转移矩阵方法。我们通过建立DNA的紧束缚模型,并利用转移矩阵的方法,得到了邻近格点间的递推公式,进而给出了相应的转移矩阵。第三章里,利用紧束缚模型,我们推导了邻近格点间的递推公式.,借助转移矩阵方法,计算了李雅普诺夫指数、透射系数以及伏安特性相应的理论公式,并计算出了不同的 DNA分子链的李雅普诺夫指数、透射系数对于 DNA序列、门电压等的依赖关系,并对结果进行了分析。第四章是小结和展望。
[博士论文] 芦广庆
生物化学与分子生物学 北京协和医学院;中国医学科学院;清华大学医学部;北京协和医学院中国医学科学院 2017(学位年度)
摘要:保持基因组的完整性和稳定性对于生物体的存活是至关重要的。DNA双链断裂(DSB)是所有DNA损伤中最为严重的一种,可以通过外界因素(如电离辐射和化学诱变剂)和内源因素(如内源性DNA氧化以及DNA复制压力)产生。哺乳动物体内的DSB修复方式主要有两种:依赖于同源序列的同源重组(HR)和不依赖于同源序列的非同源末端连接(NHEJ)。近几年的研究发现,在经典的非同源末端连接(C-NHEJ)缺失的情况下,DSB末端仍然可以被有效地修复,预示着非经典末端连接(A-EJ)修复通路的存在。A-EJ活性已经在多种系统中得到证实,特别是在C-NHEJ核心因子(如DNA连接酶Ⅳ)缺陷的B细胞中,A-EJ介导的垮H基因座位置的抗体类别转换(CSR)效率是野生型细胞的50%。
  大量研究已经证实A-EJ的显著特点是对微同源序列(MH)的偏好性,以及在染色体转位过程中的重要作用。虽然目前已经有多个蛋白因子被报道参与A-EJ过程,但是其结果往往存在争议,特别是对参与A-EJ修复的DNA连接酶的研究还很不清楚。
  本研究利用CRISPR/Cas9系统,在Lig4缺陷的小鼠B细胞系CH12F3中完全敲除Lig1或者细胞核内的Lig3,建立只含有单个DNA连接酶(分别为Lig3和Lig1)的CH12F3细胞系。令人惊讶的是,只含有Lig1或Lig3的CH12F3细胞仍然具有A-EJ活性,可以有效地催化IgH基因座的CSR过程以及同一条染色体上由CRISPR/Cas9产生的DSB之间的染色体缺失;并且其活性与Lig1/Lig3同时存在的细胞没有明显差别。然而,在催化染色体转位方面,含有Lig1和Lig3的复合物显示出不同的特性。完全敲除细胞核中的Lig3,Lig4-/-细胞的染色体转位明显减少,而在完全敲除Lig1的细胞中则没有这种变化。另外,染色体转位连接处微同源序列的分析揭示了不同DNA连接酶催化活性的特异性。这些数据表明存在多种含DNA连接酶的复合物用以催化A-EJ过程。
  另外,本研究在小鼠B细胞中建立了CRISPR/Cas9高通量筛选方法,在野生型和Lig4缺陷的细胞中筛选参与CSR过程中DSB修复的基因。首先建立了Cas9稳定表达的CH12F3细胞系(野生型和Lig4缺陷型),并对sgRNA筛选的整个过程进行了优化。利用优化的实验条件,在Cas9稳定表达的WT和Lig4-/-CH12F3细胞中进行sgRNA文库的高通量筛选。对不同细胞群中的sgRNA进行高通量测序,通过MAGeCK分析方法,筛选IgA阳性细胞群中显著减少和IgA/IgM双阴性细胞群中显著增加的基因。在WT细胞中,筛选得到了DNA-PKcs和Lig4等核心C-NHEJ蛋白因子,以及一些已知的参与细胞因子介导的CSR过程的基因。对其它未知功能的候选基因进行检测,发现Brd9和Fbxo28缺失严重影响细胞因子介导的CSR。目前正在对这一结果进行进一步验证。同时,基于Cas9/sgRNA介导的CSR模型的高通量筛选也正在进行。
[硕士论文] 徐晓飞
药学 重庆大学 2017(学位年度)
摘要:Long interspersed nuclear elements(LINE-1 or L1)目前存在于人类基因组中最活跃的一种逆转座子,也是许多动物基因组中最成功的逆转座子。通过统计分析发现,人类基因组中大约存在百分之十七点五的序列由L1或其突变过后的部分序列构成,超过6700个L1元件的拷贝分布在人类基因组的各条染色体中。尽管拷贝数量大,但大部分L1元件在和完整的L1序列对比之后发现存在各种各样的突变和序列截断,这些不完整的L1序列往往缺失了转座过程所需的某些特定功能,直接导致这些突变体并不能独自的完成整个L1的转座过程。不过近年来不断有L1相关细胞培养实验表明可能存在一些具有活性的L1元件存在于人类基因组中,其中有一些还被证明具有很高的转座活性。在这些实验中,有的研究者克隆了人类基因组中一批具有高度完整性和可能具有活性的L1序列,并通过细胞实验观察这些挑选出来序列的转座率。和已知具有很高活性的L1转座子相比较,最终发现人类基因组中部分L1序列确实具有转座活性,并以此推测人类基因组序列中大约存在80~100条仍具有转座活性的L1序列。众所周知,L1作为一种仍能独自完成转座过程的转座子,其转座的现象严重的影响人类基因组的稳定性,且L1转座的发生往往会导致相应的疾病。由此可见,有活性L1序列的注释应该引起我们的高度关注。通过突变L1序列的某些位点来分析L1序列活性,是目前唯一的验证方法,这种方法也发现了很多突变位点会导致L1序列的失去或减弱转座活性。尽管如此,这种突变实验方法无形中增加了研究L1序列活性的门槛,让很多生物信息学研究者望而却步。因此,现在迫切的需要一种能够可靠的和易操作的方法来分析L1序列的活性。
  本文引入了一种基于支持向量机(SVM)、结合特征化的DNA序列的策略,旨在构造一个数学模型来深入的分析未知L1序列的活性。不同于其他方法,这里以核酸的种类、基团类型和氢键类型作为分类依据,用三条特征序列来唯一标识一条L1序列。蛋白质序列的描述符生成方法global protein sequence descriptors同样也被引入到这里,使用特征序列的组成、转换和分布来产生相应特征向量。最终本文会用一个13维度的特征向量来描述一条特征序列,一个39维度的特征向量代表一条L1序列的分子描述符。通过查阅文献,这里共收集到168条已知活性的L1序列,这些序列都将被用作SVM模型的训练数据。最后建立的SVM模型通过独立验证的检验,并得出了不错的验证结果。利用生成的最终模型去扫描人类基因组序列,共发现81条L1序列可能具有活性。
[博士论文] 郑燕
理论物理 内蒙古大学 2017(学位年度)
摘要:全基因组序列k-mer的使用是非随机的,不同种类的k-mer具有不同的生物学功能,发掘k-mer使用规律以及k-mer的生物学功能对于基因组结构进化和系统理解功能片段非常重要。上百个物种的k-mer频谱研究发现四足动物的k-mer频谱是多峰分布,其他生物的k-mer频谱是单峰分布。K-mer多峰谱产生的原因众说纷纭,有研究指出不同类型的功能或结构元件是产生多峰谱的主要原因,也有研究认为多峰谱是以G+C含量和CpG抑制为特征,还有研究认为多峰是由两类稀有k-mer形成的。所以基因组k-mer频谱产生的原因仍待研究。
  论文运用统计分析和生物信息学等方法,结合人类k-mer频谱的分布规律,研究了酵母基因组序列k-mer频谱的规律,探讨了CG类8-mer子集的独立进化机制,对CG类模体的生物学功能给出理论猜测和验证。主要研究内容如下:
  (1)计算得到人类1号染色体序列的8-mer相对模体数随频次的分布(简称8-mer频谱),发现8-mer频谱是三峰分布。将全部8-mer按照16种XY二核苷分类分成三个子集后,发现仅有CG二核苷分类下的三个子集CG0(不包含CG二核苷的8-mer)、CG1(包含一个CG的8-mer)和CG2(包含两个或两个以上CG的8-mer)各自形成独立的单峰分布,称之为CG类模体的独立进化规律。三个CG模体子集的分布位置与总体8-mer分布的三个峰严格对应。由此得出三个CG子集分布距离的远近是决定单峰分布还是多峰分布的直接原因。与随机序列的8-mer频谱比较,发现CG0模体的频谱位于随机中心附近,CG1和CG2模体的频谱远离随机中心。表明包含CG二核苷的8-mer是定向进化,不包含CG二核苷的8-mer是随机进化。CG三个子集的分布具有两个特征:(i) CG2和CG1分布的最概然频次明显低于CG0分布;(ii) CG2和CG1分布的宽度明显窄于CG0分布。这两特征表明CG2和CG1子集中的8-mer使用是保守的。分析三个CG子集、核小体中心序列(NCSs)和CpG岛(CGIs)的序列特征后,提出两个理论猜想:CG1模体是核小体结合模体;CG2模体是CGIs的模体单元。
  (2)酵母基因组序列的8-mer频谱为单峰分布。计算酵母中16种二核苷分类下8-mer相对模体数随频次的分布,发现只有CG子集分布具备人类CG子集分布的两个特征,表明酵母中CG2和CG1子集中的8-mer使用也是保守的,以及酵母的单峰分布是三个CG子集分布太近叠加后的结果。因此得到这样的结论:CG模体使用的进化独立规律从最简单的真核生物酵母就开始了。由于CG子集模体数目众多,用三个CG子集中m-mer(m=2,3,4)的频率来表征CG子集的模体信息。首先分析发现三个CG子集模体信息偏离总体8-mer的程度各不相同。然后考察了酵母基因组序列在16种XY1分类下m-mer使用的总偏离(新对称相对熵NSRE),发现CG分类下的模体使用偏离最大。得出CG二核苷在从简单到复杂的基因组进化中是功能元件产生和进化“核心”的结论。
  (3)为了验证CG1模体是否是核小体结合模体,分别将CG0、CG1和CG2子集的模体信息赋值到酵母的核小体中心序列和连接序列上做二分类评估。结果指出基于CG1模体信息得到的平均ROC面积(AUC)最大,说明CG1模体比起CG0和CG2模体更偏好核小体中心序列。然后基于CG1子集模体信息得到核小体中心序列上的NSRE分布,该分布与已出版的结果一致。结果显示富含模体决定核小体的基本框架,稀有模体决定核小体的精细结构。将标准组蛋白八聚体沿着DNA双链展开成一维排列后,NSRE分布的极大值区域与八个组蛋白位置存在极好的一一对应关系。这两个结果共同验证了CG1模体是核小体结合模体的猜想。
  (4)统计分析单碱基精度核小体位置数据,发现一些核小体处于挤压状态。根据挤压的位置将核小体分为四类:标准核小体;上游挤压核小体;下游挤压核小体;两端挤压核小体。基于CG1模体是核小体结合模体的结论,分析了四类核小体中心序列上NSRE的分布特征,发现挤压核小体随着挤压端和非挤压端序列结构的变化而变化,而且核小体受挤压的区域其序列的组织性更强。随后,核小体连接序列按长度增长的方式分类为11个长度组,利用MEME在线软件搜索了11个长度组中的保守模体,发现有四类保守模体,意味着连接序列的多样性。
  (5)为了验证CG2模体是否是CGIs的模体单元,分别将CG2、CG1和CG0模体信息赋值到酵母的CGIs和相应的非CpG岛序列上做ROC分析,得到的平均AUC值分别为0.95,0.80和0.02,显示CG2模体信息与CGIs的构成信息非常符合。在ROC曲线上选取最佳临界值,计算该临界值下的总精度(AAC)和相关系数(MCC),该结果进一步确认了CG2模体信息可以表征CGIs序列,从而验证了CG2模体是CGIs的结构单元。
  (已选择0条) 清除
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部