A. 蛋白质组学的研究技术
可以说,蛋白质组学的发展既是技术所推动的也是受技术限制的。蛋白质组学研究成功与否,很大程度上取决于其技术方法水平的高低。蛋白质研究技术远比基因技术复杂和困难。不仅氨基酸残基种类远多于核苷酸残基(20/ 4), 而且蛋白质有着复杂的翻译后修饰,如磷酸化和糖基化等,给分离和分析蛋白质带来很多困难。此外,通过表达载体进行蛋白质的体外扩增和纯化也并非易事,从而难以制备大量的蛋白质。蛋白质组学的兴起对技术有了新的需求和挑战。蛋白质组的研究实质上是在细胞水平上对蛋白质进行大规模的平行分离和分析,往往要同时处理成千上万种蛋白质。因此,发展高通量、高灵敏度、高准确性的研究技术平台是现在乃至相当一段时间内蛋白质组学研究中的主要任务。当前在国际蛋白质组研究技术平台的技术基础和发展趋势有以下几个方面: 通常可采用细胞或组织中的全蛋白质组分进行蛋白质组分析。也可以进行样品预分级,即采用各种方法将细胞或组织中的全体蛋白质分成几部分,分别进行蛋白质组研究。样品预分级的主要方法包括根据蛋白质溶解性和蛋白质在细胞中不同的细胞器定位进行分级,如专门分离出细胞核、线粒体或高尔基体等细胞器的蛋白质成分。样品预分级不仅可以提高低丰度蛋白质的上样量和检测,还可以针对某一细胞器的蛋白质组进行研究。
对临床组织样本进行研究,寻找疾病标记,是蛋白质组研究的重要方向之一。但临床样本都是各种细胞或组织混杂,而且状态不一。如肿瘤组织中,发生癌变的往往是上皮类细胞,而这类细胞在肿瘤中总是与血管、基质细胞等混杂。所以,常规采用的癌和癌旁组织或肿瘤与正常组织进行差异比较,实际上是多种细胞甚至组织蛋白质组混合物的比较。而蛋白质组研究需要的通常是单一的细胞类型。最近在组织水平上的蛋白质组样品制备方面也有新的进展,如采用激光捕获微解剖(Laser Capture Microdissection, LCM) 方法分离癌变上皮类细胞。 利用蛋白质的等电点和分子量通过双向凝胶电泳的方法将各种蛋白质区分开来是一种很有效的手段。它在蛋白质组分离技术中起到了关键作用。如何提高双向凝胶电泳的分离容量、灵敏度和分辨率以及对蛋白质差异表达的准确检测是目前双向凝胶电泳技术发展的关键问题。国外的主要趋势有第一维电泳采用窄pH梯度胶分离以及开发与双向凝胶电泳相结合的高灵敏度蛋白质染色技术,如新型的荧光染色技术。
质谱技术是目前蛋白质组研究中发展最快,也最具活力和潜力的技术。它通过测定蛋白质的质量来判别蛋白质的种类。当前蛋白质组研究的核心技术就是双向凝胶电泳-质谱技术,即通过双向凝胶电泳将蛋白质分离,然后利用质谱对蛋白质逐一进行鉴定。对于蛋白质鉴定而言,高通量、高灵敏度和高精度是三个关键指标。一般的质谱技术难以将三者合一,而最近发展的质谱技术可以同时达到以上三个要求,从而实现对蛋白质准确和大规模的鉴定。 做过双向凝胶电泳的人一定会抱怨它的繁琐、不稳定和低灵敏度等缺点。发展可替代或补充双向凝胶电泳的新方法已成为蛋白质组研究技术最主要的目标。目前,二维色谱 (2D-LC)、二维毛细管电泳 (2D-CE)、液相色谱-毛细管电泳 (LC-CE) 等新型分离技术都有补充和取代双向凝胶电泳之势。另一种策略则是以质谱技术为核心,开发质谱鸟枪法(Shot-gun)、毛细管电泳-质谱联用 (CE-MS)等新策略直接鉴定全蛋白质组混合酶解产物。随着对大规模蛋白质相互作用研究的重视,发展高通量和高精度的蛋白质相互作用检测技术也被科学家所关注。此外,蛋白质芯片的发展也十分迅速,并已经在临床诊断中得到应用。蛋白质组生物信息学
蛋白质组数据库是蛋白质组研究水平的标志和基础。瑞士的SWISS-PROT拥有目前世界上最大,种类最多的蛋白质组数据库。丹麦、英国、美国等也都建立了各具特色的蛋白质组数据库。生物信息学的发展已给蛋白质组研究提供了更方便有效的计算机分析软件;特别值得注意的是蛋白质质谱鉴定软件和算法发展迅速,如SWISS-PROT、Rockefeller大学、UCSF等都有自主的搜索软件和数据管理系统。最近发展的质谱数据直接搜寻基因组数据库使得质谱数据可直接进行基因注释、判断复杂的拼接方式。随着基因组学的迅速推进,会给蛋白质组研究提供更多更全的数据库。另外,对肽序列标记的从头测序软件也十分引人注目。
B. 高一生物,怎么理解蛋白质中至少含有的N和O原子数的算法,谢谢
氨基酸通式:中心碳原子外连4个集团,分别是-NH2(氨基),-COOH(羧基),-H(氢原子),-R(侧链基团)
大量氨基酸通过脱水缩合变成蛋白质,这个过程中,氨基酸的一个氨基中的一个H,和下一个氨基酸的羧基中的-OH(羟基)(高二化学能学到),结合变成水,剩下的部分为肽键,将两个氨基酸连接起来。
如果不管-R,那么有X个氨基酸连接成链状蛋白质(环状很少见),那么肽键数就是X-1个了呗
也就是说,每有一个肽键,就少了一个-OH和一个-H,也可以看成是少一个水H2O
最后在一个蛋白质的端位氨基酸,会分别留有一个氨基和一个羧基
到这里,所有的题目你都可以解决了。给你氨基酸的个数,无论给不给你R基有什么,你都可以计算出蛋白质中的N、R、H、C、肽键、氨基、羧基个数
比如:有100个氨基酸连成1个链状蛋白质,问至少含有多少个N和多少个O。想法:1个氨基酸通式中只有1个N,这个N形成肽键时没有消去,所以至少就有100个N!1个氨基酸通式有2个O,形成了肽键就少1个O,100个氨基酸有99个肽键,那一个肽键中就只有1个O,最尾巴的羧基还剩有2个O,所以至少有101个O。如果形成的是2个链状蛋白质,你可以看成是有50个氨基酸形成1个蛋白质再乘以二倍。以此类推,H、C等均能计算
因为你问的是如何理解,所以我把解题思路告诉你了。最后的各种结论公式,老师和辅导书上都有,不需要记,只要记住怎么想就行。
C. 生物信息学的应用
1,序列比对(Sequence Alignment)
序列比对的基本问题是比较两个或两个以上符号序列的相似性或不相似性.从生物学的初衷来看,这一问题包含了以下几个意义:从相互重叠的序列片断中重构DNA的完整序列.在各种试验条件下从探测数据(probe data)中决定物理和基因图存贮,遍历和比较数据库中的DNA序列比较两个或多个序列的相似性在数据库中搜索相关序列和子序列寻找核苷酸(nucleotides)的连续产生模式找出蛋白质和DNA序列中的信息成分序列比对考虑了DNA序列的生物学特性,如序列局部发生的插入,删除(前两种简称为indel)和替代,序列的目标函数获得序列之间突变集最小距离加权和或最大相似性和,对齐的方法包括全局对齐,局部对齐,代沟惩罚等.两个序列比对常采用动态规划算法,这种算法在序列长度较小时适用,然而对于海量基因序列(如人的DNA序列高达109bp),这一方法就不太适用,甚至采用算法复杂性为线性的也难以奏效.因此,启发式方法的引入势在必然,着名的BALST和FASTA算法及相应的改进方法均是从此前提出发的.
2, 蛋白质结构比对和预测
基本问题是比较两个或两个以上蛋白质分子空间结构的相似性或不相似性.蛋白质的结构与功能是密切相关的,一般认为,具有相似功能的蛋白质结构一般相似.蛋白质是由氨基酸组成的长链,长度从50到1000~3000AA(Amino Acids),蛋白质具有多种功能,如酶,物质的存贮和运输,信号传递,抗体等等.氨基酸的序列内在的决定了蛋白质的3维结构.一般认为,蛋白质有四级不同的结构.研究蛋白质结构和预测的理由是:医药上可以理解生物的功能,寻找dockingdrugs的目标,农业上获得更好的农作物的基因工程,工业上有利用酶的合成.直接对蛋白质结构进行比对的原因是由于蛋白质的3维结构比其一级结构在进化中更稳定的保留,同时也包含了较AA序列更多的信息.蛋白质3维结构研究的前提假设是内在的氨基酸序列与3维结构一一对应(不一定全真),物理上可用最小能量来解释.从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构.同源建模(homology modeling)和指认(Threading)方法属于这一范畴.同源建模用于寻找具有高度相似性的蛋白质结构(超过30%氨基酸相同),后者则用于比较进化族中不同的蛋白质结构.然而,蛋白结构预测研究现状还远远不能满足实际需要.
3, 基因识别,非编码区分析研究.
基因识别的基本问题是给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.非编码区由内含子组成(introns),一般在形成蛋白质后被丢弃,但从实验中,如果去除非编码区,又不能完成基因的复制.显然,DNA序列作为一种遗传语言,既包含在编码区,又隐含在非编码序列中.分析非编码区DNA序列目前没有一般性的指导方法.在人类基因组中,并非所有的序列均被编码,即是某种蛋白质的模板,已完成编码部分仅占人类基因总序列的3~5%,显然,手工的搜索如此大的基因序列是难以想象的.侦测密码区的方法包括测量密码区密码子(codon)的频率,一阶和二阶马尔可夫链,ORF(Open Reading Frames),启动子(promoter)识别,HMM(Hidden Markov Model)和GENSCAN,Splice Alignment等等.
4, 分子进化和比较基因组学
分子进化是利用不同物种中同一基因序列的异同来研究生物的进化,构建进化树.既可以用DNA序列也可以用其编码的氨基酸序列来做,甚至于可通过相关蛋白质的结构比对来研究分子进化,其前提假定是相似种族在基因上具有相似性.通过比较可以在基因组层面上发现哪些是不同种族中共同的,哪些是不同的.早期研究方法常采用外在的因素,如大小,肤色,肢体的数量等等作为进化的依据.近年来较多模式生物基因组测序任务的完成,人们可从整个基因组的角度来研究分子进化.在匹配不同种族的基因时,一般须处理三种情况:Orthologous: 不同种族,相同功能的基因;Paralogous: 相同种族,不同功能的基因;Xenologs: 有机体间采用其他方式传递的基因,如被病毒注入的基因.这一领域常采用的方法是构造进化树,通过基于特征(即DNA序列或蛋白质中的氨基酸的碱基的特定位置)和基于距离(对齐的分数)的方法和一些传统的聚类方法(如UPGMA)来实现.
5, 序列重叠群(Contigs)装配
根据现行的测序技术,每次反应只能测出500 或更多一些碱基对的序列,如人类基因的测量就采用了短枪(shortgun)方法,这就要求把大量的较短的序列全体构成了重叠群(Contigs).逐步把它们拼接起来形成序列更长的重叠群,直至得到完整序列的过程称为重叠群装配.从算法层次来看,序列的重叠群是一个NP-完全问题.
6, 遗传密码的起源
通常对遗传密码的研究认为,密码子与氨基酸之间的关系是生物进化历史上一次偶然的事件而造成的,并被固定在现代生物的共同祖先里,一直延续至今.不同于这种"冻结"理论,有人曾分别提出过选择优化,化学和历史等三种学说来解释遗传密码.随着各种生物基因组测序任务的完成,为研究遗传密码的起源和检验上述理论的真伪提供了新的素材.
7, 基于结构的药物设计
人类基因工程的目的之一是要了解人体内约10万种蛋白质的结构,功能,相互作用以及与各种人类疾病之间的关系,寻求各种治疗和预防方法,包括药物治疗.基于生物大分子结构及小分子结构的药物设计是生物信息学中的极为重要的研究领域.为了抑制某些酶或蛋白质的活性,在已知其蛋白质3级结构的基础上,可以利用分子对齐算法,在计算机上设计抑制剂分子,作为候选药物.这一领域目的是发现新的基因药物,有着巨大的经济效益.
8.生物系统的建模和仿真
随着大规模实验技术的发展和数据累积,从全局和系统水平研究和分析生物学系统,揭示其发展规律已经成为后基因组时代的另外一个研究 热点-系统生物学。目前来看,其研究内容包括生物系统的模拟(Curr Opin Rheumatol,2007,463-70),系统稳定性分析(Nonlinear Dynamics Psychol Life Sci,2007,413-33),系统鲁棒性分析(Ernst Schering Res Found Workshop, 2007,69-88)等方面。以SBML(Bioinformatics,2007,1297-8)为代表的建模语言在迅速发展之中,以布尔网络 (PLoS Comput Biol,2007,e163)、微分方程(Mol Biol Cell,2004,3841-62)、随机过程(Neural Comput,2007,3262-92)、离散动态事件系统等(Bioinformatics,2007,336-43)方法在系统分析中已经得到应 用。很多模型的建立借鉴了电路和其它物理系统建模的方法,很多研究试图从信息流、熵和能量流等宏观分析思想来解决系统的复杂性问题(Anal Quant Cytol Histol,2007,296-308)。当然,建立生物系统的理论模型还需要很长时间的努力,现在实验观测数据虽然在海量增加,但是生物系统的模型辨 识所需要的数据远远超过了目前数据的产出能力。例如,对于时间序列的芯片数据,采样点的数量还不足以使用传统的时间序列建模方法,巨大的实验代价是目前系 统建模主要困难。系统描述和建模方法也需要开创性的发展。
9.生物信息学技术方法的研究
生物信息学不仅仅是生物学知识的简单整理和、数学、物理学、信息科学等学科知识的简单应用。海量数据和复杂的背景导致机器学习、统 计数据分析和系统描述等方法需要在生物信息学所面临的背景之中迅速发展。巨大的计算量、复杂的噪声模式、海量的时变数据给传统的统计分析带来了巨大的困难, 需要像非参数统计(BMC Bioinformatics,2007,339)、聚类分析(Qual Life Res,2007,1655-63)等更加灵活的数据分析技术。高维数据的分析需要偏最小二乘(partial least squares,PLS)等特征空间的压缩技术。在计算机算法的开发中,需要充分考虑算法的时间和空间复杂度,使用并行计算、网格计算等技术来拓展算法的 可实现性。
10, 生物图像
没有血缘关系的人,为什么长得那么像呢?
外貌是像点组成的,像点愈重合两人长得愈像,那两个没有血缘关系的人像点为什么重合?
有什么生物学基础?基因是不是相似?我不知道,希望专家解答。
11, 其他
如基因表达谱分析,代谢网络分析;基因芯片设计和蛋白质组学数据分析等,逐渐成为生物信息学中新兴的重要研究领域;在学科方面,由生物信息学衍生的学科包括结构基因组学,功能基因组学,比较基因组学,蛋白质学,药物基因组学,中药基因组学,肿瘤基因组学,分子流行病学和环境基因组学,成为系统生物学的重要研究方法.从现在的发展不难看出,基因工程已经进入了后基因组时代.我们也有应对与生物信息学密切相关的如机器学习,和数学中可能存在的误导有一个清楚的认识.
D. DNA与蛋白质相互作用的研究方法有哪些
在许多的细胞生命活动中,例如DNA复制、mRNA转录与修饰以及病毒的感染等都涉及到DNA与蛋白质之间的相互作用的问题。重组DNA技术的发展,人们已分离到了许多重要的基因。现在的关键问题是需要揭示环境因子及发育信号究竟是如何控制基因的转录活性。为此需要:a、鉴定分析参与基因表达调控的DNA元件;b、分离并鉴定这些顺式元件特异性结合的蛋白质因子;这些问题的研究都涉及到DNA与蛋白质之间的相互作用。
研究DNA-蛋白质相互作用的实验方法主要包括:a、凝胶阻滞实验; b、DNase 1 足迹实验;c、甲基化干扰实验; d、体内足迹实验; f、拉下实验。研究蛋白质/ 核酸相互作用近期采用的新技术有:核酸适体技术、生物信息学方法、蛋白质芯片技术以及纳米技术等。
凝胶阻滞实验
1、概念:
凝胶阻滞实验(Gel retardation assay),要叫做DNA迁移率变动试验(DNA mobility shift assay)或条带阻滞实验(Band retardation assay)是在八十年代初期出现的用于在体外研究DNA与蛋白质相互作用的一种特殊的凝胶电泳技术。
2、原理:
在凝胶电泳中,由于电场的作用,裸露的DNA分子向正电极移动距离的大小是同其分子量的对数成反比。如果某种DNA分子结合上一种特殊的蛋白质,那么由于分子量的加大它在凝胶中的迁移作用便会受到阻滞,于是朝正极移动的距离也就相应的缩短,因而在凝胶中出现滞后的条带,这就是凝胶阻滞实验的基本原理。
3、过程:
首先制备细胞蛋白质提取物(理论上其中含有某种特殊的转录因子)
用放射性同位素标记待检测的DNA片段(含有转录因子的结合位点)
这种被标记的探针DNA同细胞蛋白质提取物一起进行温育,于是产生DNA-蛋白质复合物
在控制使DNA-蛋白质保持结合状态的条件下,进行非变性聚丙烯酰胺凝胶电泳
最后进行放射自显影,分析电泳结果
4、实验结果的分析:
a、如果有放射性标记的条带都集中于凝胶的底部,这就表明在细胞提取物中不存在可以同探针DNA相互结合的转录因子蛋白质;
b、如果在凝胶的顶部出现放射性标记的条带,这就表明细胞提取物存在可与探针DNA结合的转录因子蛋白质。
5、DNA竞争实验:
DNA竞争实验(DNA competitive assay)的具体做法如下:
在DNA-蛋白质结合的反应体系中加入了超量的非标记的竞争DNA(competitor DNA),如果它同探针DNA结合的是同一种转录因子蛋白质,那么由于竞争DNA与探针DNA相比是极大超量的,这样绝大部分转录因子蛋白质都会被竞争结合掉,而使探针DNA仍然处于自由的非结合状态,可以在电泳凝胶的放射自显影图片上就不会出现阻滞的条带;
如果反应体系中加入的竞争DNA并不能同探针DNA竞争结合同一种转录因子,结果在电泳凝胶中的放射自显影图片上就会出现阻滞的条带。
6、应用:
a、凝胶阻滞实验可以用于鉴定在特殊类型细胞蛋白质提取物中,是否存在能同某一特定的DNA(含有转录因子结合位点)结合的转录因子蛋白质;
b、DNA竞争实验可以用来检测转录因子蛋白质同DNA结合的精确序列部位;
c、通过竞争DNA中转录因子结合位点的碱基突变可以研究此种突变竞争性能及其转录因子结合作用的影响;
d、也可以利用DNA同特定转录因子的结合作用通过亲和层析来分离特定的转录因子。
DNaseI足迹实验
1、定义:
足迹实验(foot-printing assay),是一种用来检测被特定转录因子蛋白质特异性结合的DNA序列的位置及其核苷酸序列结构的专门实验方法。
2、原理:
当DNA分子中的某一区段同特异的转录因子结合之后便可以得到保护而免受DNaseI 酶的切割作用,而不会产生出相应的切割分子,结果在凝胶电泳放射性自显影图片上便出现了一个空白区,俗称为“足迹”。
3过程:
将待检测的双链DNA分子在体外用32P作5‘末端标记,并用适当的限制性内切酶切出其中的一个末端,于是便得到了一条单链末端标记的双链DNA
在体外同细胞蛋白质提取物(细胞核提取物也可以)混合,形成DNA-蛋白质复合体
在反应混合物中加入少量的DNase I,并控制用量使之达到平均每条DNA链,只发生一次磷酸二酯键的断裂:
a、如果蛋白质提取物中不存在与DNA结合的特定蛋白质,使DNase I消化之后,便会产生出距离放射性标记末端1个核苷酸,2个核苷酸,3个核苷酸------等等一系列前后长度均相差一个核苷酸的不间断的连续的DNA片段梯度群体;
b、如果DNA分子同蛋白质提取物中的某种转录因子结合,被结合部位的DNA就可以得到保护免受DNase I酶的降解作用;
除去蛋白,加样在20%序列胶上进行电泳分离,实验分两组:
a、实验组:DNA+蛋白质混合物
b、对照组:只有DNA,未与蛋白质提取物进行温育
最后进行放射性自显影,分析实验结果。
4、结果判断:
实验组凝胶电泳显示的序列,出现空白的区域表明是转录因子蛋白质结合部;与对照组序列比较,便可以得出蛋白质结合部位的DNA区段相应的核苷酸序列。
5、其他的足迹实验方法:
除了DNase1足迹试验之外,目前还发展出了若干种其他类型的足迹实验,例如:
a、 自由羟基足迹实验;b、菲咯啉铜足迹实验;c、DMS(硫酸二甲酯)足迹实验
DMS(硫酸二甲酯)足迹实验的原理
DMS能够使DNA分子中裸露的鸟嘌呤(G)残基甲基化,而六氢吡啶又会对甲基化的G残基作特异性的化学切割。如果DNA分子中某一区段同转录因子结合,就可以避免发生G残基的甲基化而免受六氢吡啶的切割作用。
甲基化干扰实验
1、概念:
甲基化干扰实验(Methylation interference assay)是根据DMS(硫酸二甲酯)能够使DNA分子中裸露的鸟嘌呤(G)残基甲基化,而六氢吡啶又会对甲基化的G残基作特异性的化学切割这一原理设计的另一种研究蛋白质同DNA相互作用的实验方法。
应用这种技术可以检测靶DNA中G残基的优先甲基化,对尔后的蛋白质结合作用究竟会有什么效应,从而更加详细的揭示出DNA与蛋白质相互作用的模式。
2、实验步骤:
用DMS处理靶DNA使之局部甲基化(平均每条DNA只发生一个G碱基甲基化作用)
同细胞蛋白质提取物一起进行温育,促进使DNA与蛋白质的结合
进行凝胶电泳形成两种靶DNA条带:
a、 其一没有同蛋白质结合的DNA正常电泳条带
b、其二同特异蛋白质结合而呈现滞后的DNA电泳条带
将这两种DNA电泳条带分别从凝胶中切出,并用六氢吡啶进行切割,结果为:
a)、甲基化的G残基被切割:因为转录因子蛋白质只能够同未发生甲基化的正常的结合位点结合,所以在转录因子DNA结合位点序列中的G残基如果被DMS甲基化之后,转录因子就无法同其结合位点(顺式元件)发生结合作用,从而使得结合位点中的G残基同样也要被六氢吡啶切割;
b)、不具有甲基化G残基的靶DNA 序列则不会被切割
将结合蛋白质的DNA条带和不结合蛋白质的DNA条带,经六氢吡啶切割作用之后,再进行凝胶电泳
作放射自显影,读片并分析结果
3、结果判断:
a、同转录因子蛋白质结合的靶DNA序列,经六氢吡啶切割之后,电泳分离呈现两条带,有一个空白区
b、不同转录因子蛋白质结合的靶DNA序列,经六氢吡啶切割后,电泳分离呈现三条带,没有空白区域的出现。
4、应用:
a、甲基化干扰实验可以用来研究转录因子与DNA结合位点中的G残基之间的联系;
b、是足迹实验的一种有效的补充手段,可以鉴定足迹实验中DNA与蛋白质相互作用的精确位置
5、缺点:
DMS只能使DNA序列中的G和A残基甲基化,而不能使T和C残基甲基化。
体内足迹实验
上面讨论的三种研究转录因子与DNA相互作用的方法,有一个共同的不足之处在于它们是在体外进行的实验,因此人们就会考虑这些实验结果是否能够反映细胞内发生的真实生命过程,即细胞内发生的真实的DNA与蛋白质的相互作用情况。
为了解答这个问题,科学家就设计出了一种体内足迹试验(in vivo foot-printing assay),该方法可以看做是体外DMS足迹实验的一个变种。
1、原理:
体内足迹试验的原理原则上同体外DMS足迹实验无本质差别,即
a、DMS能够使G残基甲基化;
b、六氢吡啶能特异的切割甲基化的G残基;
c、同特异转录因子蛋白质结合的识别序列中的G残基由于受到蛋白质的保护而不会被DMS甲基化,于是不会被六氢吡啶切割;
d、同对照的裸露的DNA形成的序列梯作比较,就会发现活细胞DNA形成的序列梯中缺少G残基没有被切割的相应条带。
2、过程:
用有限数量的化学试剂DMS处理完整的游离细胞,使渗透到胞内的DMS浓度恰好导致天然染色体DNA的G残基发生甲基化
对这些经过DMS处理的细胞提取DNA,并在体外加入六氢吡啶作消化反应
PCR扩增后作凝胶电泳分析,因为在体外实验中用的是克隆的DNA片段其数量足够,而在体内足迹实验中用的是从染色体DNA中分离获得的任何一种特异的DNA,其数量是微不足道的,所以需要经PCR扩增以获得足够数量的特异DNA
放射自显影,读片并记录读片的结果
3、结果判断:
a、能够同转录因子蛋白质结合的DNA区段其中G残基受到保护因而不会被DMS甲基化避免了六氢吡啶的切割作用;
b、体外裸露的DNA分子上,G残基被DMS甲基化而被六氢吡啶切割。
拉下实验(Pull-down assay)
拉下实验又叫做蛋白质体外结合实验(binding assay in vitro),是一种在试管中检测蛋白质之间相互作用的方法。其基本原理是将某种小肽(例如生物素、6-His标签以及谷胱甘肽转移酶等)的编码基因与诱饵蛋白的编码基因重组,表达为融合蛋白。分离纯化融合蛋白并与磁珠结合,使之固相化之后,再与表达目的蛋白的细胞提取物混合保温适当时间,例如在4℃下保温过夜,使目标蛋白同已经固定在磁珠表面的融合蛋白中的诱饵蛋白充分的结合。离心收集与固定化的融合蛋白(即与磁珠相互结合的融合蛋白)中的诱饵蛋白相结合的目的蛋白,经过煮沸处理使目的蛋白与诱饵蛋白相脱离从而从固相支持物(例如磁珠)上脱离下来,收集样品,再与目标蛋白的抗体作Western blotting分析,以检测出与诱饵蛋白的目标的目标蛋白。
一些新的研究蛋白质/ 核酸相互作用的方法和技术,主要从核酸适体技术、生物信息学方法、蛋白质芯片技术以及纳米技术等方面进行综述。
核酸适体技术
核酸适体(aptamer)指的是经过一种新的体外筛选技术——指数富集配体系统进化(systematic evolution of ligands by exponential enrichment,SELEX),从随机单链寡聚核苷酸文库中得到的能特异结合蛋白质或其他小分子物质的单链寡聚核苷酸,可以是RNA 也可以是DNA,长度一般为25~60 个核苷酸。SELEX 的筛选流程首先是利用现有的分子生物学技术人工合成一个含有1014~1015 个单链寡核苷酸序列的随机文库,序列长度往往在25~35 个核苷酸之间,单链的随机寡核苷酸序列容易形成可与蛋白质等配体特异性共价结合的二级结构,在这一高亲和力特异性结合的基础之上配体蛋白质同随机文库相互作用,选择性分离出核酸适体后,然后通过PCR或RT-PCR 等技术进行扩增。次一级文库再与配体蛋白质相互作用,反复多次循环,即可获得与配体蛋白质特异性高亲和力结合的核酸适体。核酸适体与配体间的亲合力(解离常数在皮摩和纳摩之间)常要强于抗原抗体之间的亲合力[3]。核酸适体所结合的靶分子范围非常广泛,除蛋白质之外,还能作用于酶、生长因子、抗体、基因调节因子、细胞黏附分子、植物凝集素、完整的病毒颗粒、病原菌等[4]。适体从20 世纪90 年代初出现以后,就得到了科研工作者的广泛关注,适体的研究工作得到了快速的发展。SELEX 筛选技术和核酸适体的高亲和性在蛋白质/ 核酸相互作用的研究中发挥了重要的作用。Wen等[5]研究了同细菌噬菌体Ff 基因5蛋白(g5p) 高亲和力结合的核酸适体,发现G 富集基序对于形成g5p 连接启动子结构,提供实际的g5p 连接位点具有重要的意义。White 等[6]利用SELEX 技术研究了一种PUM2HD (短小杆菌素同源结构域)及其RNA 核酸适体,发现在PUM2 氨基端有Ser和Glu/Ala富集区,并且PEB ( PUM2 连接元件)与果蝇反应元件的3'端具有亲缘关系,但又互不相同。Bouvent等[7]利用NRE(核仁蛋白识别元件) 发现了RNA 茎环上的RBD1 和RBD2 (折叠元件结构域),这对了解模式蛋白识别RNA 的结构过程具有重要意义。核酸适体以及SELEX 技术给蛋白质/ 核酸相互作用研究提供了一种新颖的研究方法,科研人员可以控制筛选条件得到与待研究蛋白质相互结合的核酸适体,避免了天然条件下研究蛋白质/ 核酸相互作用的困难性。但目前对核酸适体与靶蛋白相互作用的分析是在筛选条件与天然条件相同的假设基础上进行的,在这种筛选条件下得到的核酸适体与蛋白质之间的相互作用,和天然状态下的蛋白质/ 核酸之间的相互作用到底有何异同,这是一个亟待解决的问题,此问题的解决必将推动蛋白质/ 核酸相互作用的研究进展。
生物信息学方法
生物信息学是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它包含着生物信息的获取、处理、存储、分配、分析和解释的所有方面。具体地说,生物信息学是用数理和信息科学的观点、理论和方法去研究生命现象,组织和分析呈现指数增长的生物学数据的一门学科。Luscombe和Thornton[8]利用氨基酸序列的保守性构建计算机算法来预测蛋白质/DNA复合体中DNA的结合位点。Selvaraj等[9]将蛋白质/核酸复合体中原子电荷势能作为训练数据集,利用人工智能技术来预测蛋白质对DNA 的识别位点。Ahmad 等[10]将蛋白质的序列组成、可溶解性以及二级结构等信息数据用人工神经网络算法进行训练,构建了在线蛋白质/ 核酸结合预测技术,预测成功率达到了69%。此后Ahmad 和Sarai[11]将此技术进一步加强,在训练人工神经网络时加入了蛋白质进化关系的信息,使预测成功率提高了8.7%。目前建立在蛋白质/ 核酸相互作用基础上的较重要的数据库为蛋白质- 核酸识别数据库(http://gibk26.bse.kyutech.ac.jp/jouhou/3dinsight/recognition.html),利用该数据库能帮助研究者了解核酸被蛋白质识别的机制。该数据库包括以下几个组成部分。
2.1蛋白质-核酸复合物数据库蛋白质-核酸复合物数据库是一个包含蛋白质- 核酸复合物结构数据的数据库。这些数据根据蛋白质的识别序列和复合物中DNA 形式进行分类。使用者可以通过关键词、识别序列、D N A 形式等进行搜索,并且搜索结果可以直接链接到3DinSight数据库(在此处,可以通过三维结构浏览器,如RasMol 或者VRML 查看含有序列位点和突变位点的三维结构图)。该数据库也能让使用者检测依赖于序列的构象参数和DNA 的柔韧性,并以图表形式显示结果。
2.2核苷酸-氨基酸相互作用数据库核苷酸-氨基酸相互作用数据库搜集核苷酸和氨基酸间4 埃大小内的成对原子,能让使用者找到成对的核苷酸和氨基酸。使用者可以指定残基名称( 核苷酸或氨基酸)、原子类型和侧链/ 骨干。搜索后,带有距离值的所有原子对将被显示。搜索可直接链接到3DinSight 数据库,以RasMol 图片形式自动地突出展示复合物结构中所有原子对。使用者可以检测到每个结构中核苷酸和氨基酸的特别相互作用。
2.3蛋白质-核酸相互作用的热力学数据库(ProNIT)
蛋白质- 核酸相互作用的热力学数据库包含有序列、结构和一些热力学参量(如分裂常数、结合常数、吉布斯自由能的转换、焓和热容量、活性)等信息。该数据库允许使用者用不同条件(多种分类和显示选项)搜索数据。此外,ProNIT 超链接于其他重要的数据库,如PDB、核酸数据库NDB 、酶代码EC、蛋白质信息资源PIR 和ProTherm 等等。当前,在分子生物学和信息科学快速发展的影响下,生物信息学已经成为生物领域的指导科学,利用生物信息学方法研究蛋白质/核酸相互作用可以大大缩短研究工作的时间,达到事半功倍的效果。但受限于当前计算科学和算法领域的发展情况,生物信息学得到的结果与实际的结果还存在一定的偏差,仍需开展进一步的实验工作来进行验证。
生物芯片技术
生物芯片技术是基于生物大分子间相互作用的大规模并行分析方法,使得生命科学研究中所涉及的样品反应、检测、分析等过程得以连续化、集成化和微型化,现已成为当今生命科学研究领域发展最快的技术之一。目前的生物芯片主要有核酸芯片、蛋白质芯片和糖体芯片等几大类。蛋白质芯片是依靠手工、压印或喷墨的方法将探针蛋白点样在化学膜、凝胶、微孔板或玻片上形成阵列,经过与样品的杂交捕获靶蛋白,再用原子力显微镜、磷光成像仪、光密度仪或激光共聚焦扫描仪进行检测,获得靶蛋白表达的种类、数量及关联等信息。蛋白质芯片已经广泛用于研究蛋白质与核酸的相互作用,已成为一种进行高通量蛋白质与DNA 或RNA作用筛选的有效方法。Ge[12]运用蛋白质芯片检测蛋白质与核酸相互作用,他将包括通用转录因子、激活蛋白和辅激活蛋白在内的48种纯化蛋白质点样在硝酸纤维素膜制成通用蛋白质芯片,用腺病毒主要晚期启动子64 bp 双链DNA 片段、腺病毒主要晚期启动子64 bp 负链DNA 和SV40 早期前体mRNA 杂交,结果证明蛋白质芯片上的所有蛋白质都能够不同程度地特异性识别和结合双链和单链寡核苷酸片段,并且结合双链DNA 和单链DNA 的总体模式基本相同,说明大多数D N A 结合蛋白既能和双链DNA 结合,也能够和单链DNA 结合。蛋白质芯片与RNA 的作用研究表明,蛋白质芯片能够成功地分析RNA 与蛋白质间的识别性结合。蛋白质芯片技术最大优点在于快速和高通量,以往科研人员作研究时一次只能研究少量生物样品,借助蛋白质芯片,一次实验可同时研究大量生物样本,加速了蛋白质/ 核酸相互作用的研究。蛋白质芯片技术目前存在的问题有:(1)蛋白质芯片在制作过程中实验条件发生微小的变化便可能引起最后结果的不同,实验条件不易控制,使得实验结果的可重复性相对不足;(2) 目前用于蛋白质芯片制备的固相介质,如化学膜、凝胶和玻片都存在一些缺点,蛋白质在固相基质表面的固定往往会造成其解折叠,从而失去生物活性;(3)对结果的扫描、去除背景、数据处理等,目前还不能做得很完美,会导致假阳性、假阴性的存在。
纳米技术
纳米技术(nano scale technology) 是一门在0.1~100nm 空间尺度内操纵原子和分子,对材料进行加工、制造具有特定功能的产品、或对某物质进行研究,掌握其原子和分子的运动规律和特性的崭新高技术学科。核酸和蛋白质等生物大分子的大小也是在纳米尺度,随着科学技术的快速发展,越来越多的纳米技术被用来研究生物大分子。在蛋白质/ 核酸相互作用的研究工作中,目前使用较新的技术是利用纳米孔技术来进行研究。纳米孔(nanopore),可以简单地定义为内径为1~100nm 的微小洞孔,一般孔径应大于洞孔深度,或者处于同一量级。如果孔的深度远大于孔径,就称之为纳米孔道。纳米孔有天然存在的生物纳米孔,也有人工加工的纳米孔。它们都可以用来进行生命科学的相关研究,但是,理想的生物化学或生物物理研究应采用孔径稳定、坚固耐用、物化性能良好的固体纳米孔,这样的纳米孔应该由质地坚硬的固体薄膜材料加工制作。Li等[16]利用聚焦离子束(FIB)制作纳米孔,利用纳米孔将双螺旋DNA 从组蛋白八聚体上剥离下来,并探测这一过程,从而可以揭示核小体中包含的许多生物化学、物理信息。这是由于处于电场中的核小体在电场的作用下,DNA 分子穿越纳米孔,同时由于纳米孔的阻挡力,使组蛋白不能穿越,从而诱使DNA 从组蛋白八聚体上分离下来。通过准确检测DNA 分子穿孔过程中引起的电流阻塞效应,可将DNA 与组蛋白的相互作用的一些性质反映出来。目前已经取得了阶段性的成果。在纳米尺度上研究核酸与蛋白质相互作用,相较于其他的研究方法,优点是能够在生物活性环境中,保持生物大分子受到最少化学修饰干扰的状态下,对生物大分子的空间结构、动态变化、生化特性等进行直接研究。相信该技术可以提供更多、更详细的生物大分子相互作用、蛋白质功能等方面的信息,帮助我们解决一些深层次的生物学疑难问题。目前阻碍此方法广泛应用的一个最大难题是如何在纳米尺度上更好的操纵生物大分子,这需要生物科学、电子科学、材料科学等多学科的共同进展来推动此方法的发展和应用。