導航:首頁 > 源碼編譯 > 蛋白相互作用演算法

蛋白相互作用演算法

發布時間:2022-08-24 13:17:52

A. 蛋白質組學的研究技術

可以說,蛋白質組學的發展既是技術所推動的也是受技術限制的。蛋白質組學研究成功與否,很大程度上取決於其技術方法水平的高低。蛋白質研究技術遠比基因技術復雜和困難。不僅氨基酸殘基種類遠多於核苷酸殘基(20/ 4), 而且蛋白質有著復雜的翻譯後修飾,如磷酸化和糖基化等,給分離和分析蛋白質帶來很多困難。此外,通過表達載體進行蛋白質的體外擴增和純化也並非易事,從而難以制備大量的蛋白質。蛋白質組學的興起對技術有了新的需求和挑戰。蛋白質組的研究實質上是在細胞水平上對蛋白質進行大規模的平行分離和分析,往往要同時處理成千上萬種蛋白質。因此,發展高通量、高靈敏度、高准確性的研究技術平台是現在乃至相當一段時間內蛋白質組學研究中的主要任務。當前在國際蛋白質組研究技術平台的技術基礎和發展趨勢有以下幾個方面: 通常可採用細胞或組織中的全蛋白質組分進行蛋白質組分析。也可以進行樣品預分級,即採用各種方法將細胞或組織中的全體蛋白質分成幾部分,分別進行蛋白質組研究。樣品預分級的主要方法包括根據蛋白質溶解性和蛋白質在細胞中不同的細胞器定位進行分級,如專門分離出細胞核、線粒體或高爾基體等細胞器的蛋白質成分。樣品預分級不僅可以提高低豐度蛋白質的上樣量和檢測,還可以針對某一細胞器的蛋白質組進行研究。
對臨床組織樣本進行研究,尋找疾病標記,是蛋白質組研究的重要方向之一。但臨床樣本都是各種細胞或組織混雜,而且狀態不一。如腫瘤組織中,發生癌變的往往是上皮類細胞,而這類細胞在腫瘤中總是與血管、基質細胞等混雜。所以,常規採用的癌和癌旁組織或腫瘤與正常組織進行差異比較,實際上是多種細胞甚至組織蛋白質組混合物的比較。而蛋白質組研究需要的通常是單一的細胞類型。最近在組織水平上的蛋白質組樣品制備方面也有新的進展,如採用激光捕獲微解剖(Laser Capture Microdissection, LCM) 方法分離癌變上皮類細胞。 利用蛋白質的等電點和分子量通過雙向凝膠電泳的方法將各種蛋白質區分開來是一種很有效的手段。它在蛋白質組分離技術中起到了關鍵作用。如何提高雙向凝膠電泳的分離容量、靈敏度和解析度以及對蛋白質差異表達的准確檢測是目前雙向凝膠電泳技術發展的關鍵問題。國外的主要趨勢有第一維電泳採用窄pH梯度膠分離以及開發與雙向凝膠電泳相結合的高靈敏度蛋白質染色技術,如新型的熒光染色技術。
質譜技術是目前蛋白質組研究中發展最快,也最具活力和潛力的技術。它通過測定蛋白質的質量來判別蛋白質的種類。當前蛋白質組研究的核心技術就是雙向凝膠電泳-質譜技術,即通過雙向凝膠電泳將蛋白質分離,然後利用質譜對蛋白質逐一進行鑒定。對於蛋白質鑒定而言,高通量、高靈敏度和高精度是三個關鍵指標。一般的質譜技術難以將三者合一,而最近發展的質譜技術可以同時達到以上三個要求,從而實現對蛋白質准確和大規模的鑒定。 做過雙向凝膠電泳的人一定會抱怨它的繁瑣、不穩定和低靈敏度等缺點。發展可替代或補充雙向凝膠電泳的新方法已成為蛋白質組研究技術最主要的目標。目前,二維色譜 (2D-LC)、二維毛細管電泳 (2D-CE)、液相色譜-毛細管電泳 (LC-CE) 等新型分離技術都有補充和取代雙向凝膠電泳之勢。另一種策略則是以質譜技術為核心,開發質譜鳥槍法(Shot-gun)、毛細管電泳-質譜聯用 (CE-MS)等新策略直接鑒定全蛋白質組混合酶解產物。隨著對大規模蛋白質相互作用研究的重視,發展高通量和高精度的蛋白質相互作用檢測技術也被科學家所關注。此外,蛋白質晶元的發展也十分迅速,並已經在臨床診斷中得到應用。蛋白質組生物信息學
蛋白質組資料庫是蛋白質組研究水平的標志和基礎。瑞士的SWISS-PROT擁有目前世界上最大,種類最多的蛋白質組資料庫。丹麥、英國、美國等也都建立了各具特色的蛋白質組資料庫。生物信息學的發展已給蛋白質組研究提供了更方便有效的計算機分析軟體;特別值得注意的是蛋白質質譜鑒定軟體和演算法發展迅速,如SWISS-PROT、Rockefeller大學、UCSF等都有自主的搜索軟體和數據管理系統。最近發展的質譜數據直接搜尋基因組資料庫使得質譜數據可直接進行基因注釋、判斷復雜的拼接方式。隨著基因組學的迅速推進,會給蛋白質組研究提供更多更全的資料庫。另外,對肽序列標記的從頭測序軟體也十分引人注目。

B. 高一生物,怎麼理解蛋白質中至少含有的N和O原子數的演算法,謝謝

氨基酸通式:中心碳原子外連4個集團,分別是-NH2(氨基),-COOH(羧基),-H(氫原子),-R(側鏈基團)

大量氨基酸通過脫水縮合變成蛋白質,這個過程中,氨基酸的一個氨基中的一個H,和下一個氨基酸的羧基中的-OH(羥基)(高二化學能學到),結合變成水,剩下的部分為肽鍵,將兩個氨基酸連接起來。

如果不管-R,那麼有X個氨基酸連接成鏈狀蛋白質(環狀很少見),那麼肽鍵數就是X-1個了唄

也就是說,每有一個肽鍵,就少了一個-OH和一個-H,也可以看成是少一個水H2O

最後在一個蛋白質的端位氨基酸,會分別留有一個氨基和一個羧基

到這里,所有的題目你都可以解決了。給你氨基酸的個數,無論給不給你R基有什麼,你都可以計算出蛋白質中的N、R、H、C、肽鍵、氨基、羧基個數

比如:有100個氨基酸連成1個鏈狀蛋白質,問至少含有多少個N和多少個O。想法:1個氨基酸通式中只有1個N,這個N形成肽鍵時沒有消去,所以至少就有100個N!1個氨基酸通式有2個O,形成了肽鍵就少1個O,100個氨基酸有99個肽鍵,那一個肽鍵中就只有1個O,最尾巴的羧基還剩有2個O,所以至少有101個O。如果形成的是2個鏈狀蛋白質,你可以看成是有50個氨基酸形成1個蛋白質再乘以二倍。以此類推,H、C等均能計算


因為你問的是如何理解,所以我把解題思路告訴你了。最後的各種結論公式,老師和輔導書上都有,不需要記,只要記住怎麼想就行。

C. 生物信息學的應用

1,序列比對(Sequence Alignment)
序列比對的基本問題是比較兩個或兩個以上符號序列的相似性或不相似性.從生物學的初衷來看,這一問題包含了以下幾個意義:從相互重疊的序列片斷中重構DNA的完整序列.在各種試驗條件下從探測數據(probe data)中決定物理和基因圖存貯,遍歷和比較資料庫中的DNA序列比較兩個或多個序列的相似性在資料庫中搜索相關序列和子序列尋找核苷酸(nucleotides)的連續產生模式找出蛋白質和DNA序列中的信息成分序列比對考慮了DNA序列的生物學特性,如序列局部發生的插入,刪除(前兩種簡稱為indel)和替代,序列的目標函數獲得序列之間突變集最小距離加權和或最大相似性和,對齊的方法包括全局對齊,局部對齊,代溝懲罰等.兩個序列比對常採用動態規劃演算法,這種演算法在序列長度較小時適用,然而對於海量基因序列(如人的DNA序列高達109bp),這一方法就不太適用,甚至採用演算法復雜性為線性的也難以奏效.因此,啟發式方法的引入勢在必然,著名的BALST和FASTA演算法及相應的改進方法均是從此前提出發的.
2, 蛋白質結構比對和預測
基本問題是比較兩個或兩個以上蛋白質分子空間結構的相似性或不相似性.蛋白質的結構與功能是密切相關的,一般認為,具有相似功能的蛋白質結構一般相似.蛋白質是由氨基酸組成的長鏈,長度從50到1000~3000AA(Amino Acids),蛋白質具有多種功能,如酶,物質的存貯和運輸,信號傳遞,抗體等等.氨基酸的序列內在的決定了蛋白質的3維結構.一般認為,蛋白質有四級不同的結構.研究蛋白質結構和預測的理由是:醫葯上可以理解生物的功能,尋找dockingdrugs的目標,農業上獲得更好的農作物的基因工程,工業上有利用酶的合成.直接對蛋白質結構進行比對的原因是由於蛋白質的3維結構比其一級結構在進化中更穩定的保留,同時也包含了較AA序列更多的信息.蛋白質3維結構研究的前提假設是內在的氨基酸序列與3維結構一一對應(不一定全真),物理上可用最小能量來解釋.從觀察和總結已知結構的蛋白質結構規律出發來預測未知蛋白質的結構.同源建模(homology modeling)和指認(Threading)方法屬於這一范疇.同源建模用於尋找具有高度相似性的蛋白質結構(超過30%氨基酸相同),後者則用於比較進化族中不同的蛋白質結構.然而,蛋白結構預測研究現狀還遠遠不能滿足實際需要.
3, 基因識別,非編碼區分析研究.
基因識別的基本問題是給定基因組序列後,正確識別基因的范圍和在基因組序列中的精確位置.非編碼區由內含子組成(introns),一般在形成蛋白質後被丟棄,但從實驗中,如果去除非編碼區,又不能完成基因的復制.顯然,DNA序列作為一種遺傳語言,既包含在編碼區,又隱含在非編碼序列中.分析非編碼區DNA序列目前沒有一般性的指導方法.在人類基因組中,並非所有的序列均被編碼,即是某種蛋白質的模板,已完成編碼部分僅占人類基因總序列的3~5%,顯然,手工的搜索如此大的基因序列是難以想像的.偵測密碼區的方法包括測量密碼區密碼子(codon)的頻率,一階和二階馬爾可夫鏈,ORF(Open Reading Frames),啟動子(promoter)識別,HMM(Hidden Markov Model)和GENSCAN,Splice Alignment等等.
4, 分子進化和比較基因組學
分子進化是利用不同物種中同一基因序列的異同來研究生物的進化,構建進化樹.既可以用DNA序列也可以用其編碼的氨基酸序列來做,甚至於可通過相關蛋白質的結構比對來研究分子進化,其前提假定是相似種族在基因上具有相似性.通過比較可以在基因組層面上發現哪些是不同種族中共同的,哪些是不同的.早期研究方法常採用外在的因素,如大小,膚色,肢體的數量等等作為進化的依據.近年來較多模式生物基因組測序任務的完成,人們可從整個基因組的角度來研究分子進化.在匹配不同種族的基因時,一般須處理三種情況:Orthologous: 不同種族,相同功能的基因;Paralogous: 相同種族,不同功能的基因;Xenologs: 有機體間採用其他方式傳遞的基因,如被病毒注入的基因.這一領域常採用的方法是構造進化樹,通過基於特徵(即DNA序列或蛋白質中的氨基酸的鹼基的特定位置)和基於距離(對齊的分數)的方法和一些傳統的聚類方法(如UPGMA)來實現.
5, 序列重疊群(Contigs)裝配
根據現行的測序技術,每次反應只能測出500 或更多一些鹼基對的序列,如人類基因的測量就採用了短槍(shortgun)方法,這就要求把大量的較短的序列全體構成了重疊群(Contigs).逐步把它們拼接起來形成序列更長的重疊群,直至得到完整序列的過程稱為重疊群裝配.從演算法層次來看,序列的重疊群是一個NP-完全問題.
6, 遺傳密碼的起源
通常對遺傳密碼的研究認為,密碼子與氨基酸之間的關系是生物進化歷史上一次偶然的事件而造成的,並被固定在現代生物的共同祖先里,一直延續至今.不同於這種"凍結"理論,有人曾分別提出過選擇優化,化學和歷史等三種學說來解釋遺傳密碼.隨著各種生物基因組測序任務的完成,為研究遺傳密碼的起源和檢驗上述理論的真偽提供了新的素材.
7, 基於結構的葯物設計
人類基因工程的目的之一是要了解人體內約10萬種蛋白質的結構,功能,相互作用以及與各種人類疾病之間的關系,尋求各種治療和預防方法,包括葯物治療.基於生物大分子結構及小分子結構的葯物設計是生物信息學中的極為重要的研究領域.為了抑制某些酶或蛋白質的活性,在已知其蛋白質3級結構的基礎上,可以利用分子對齊演算法,在計算機上設計抑制劑分子,作為候選葯物.這一領域目的是發現新的基因葯物,有著巨大的經濟效益.
8.生物系統的建模和模擬
隨著大規模實驗技術的發展和數據累積,從全局和系統水平研究和分析生物學系統,揭示其發展規律已經成為後基因組時代的另外一個研究 熱點-系統生物學。目前來看,其研究內容包括生物系統的模擬(Curr Opin Rheumatol,2007,463-70),系統穩定性分析(Nonlinear Dynamics Psychol Life Sci,2007,413-33),系統魯棒性分析(Ernst Schering Res Found Workshop, 2007,69-88)等方面。以SBML(Bioinformatics,2007,1297-8)為代表的建模語言在迅速發展之中,以布爾網路 (PLoS Comput Biol,2007,e163)、微分方程(Mol Biol Cell,2004,3841-62)、隨機過程(Neural Comput,2007,3262-92)、離散動態事件系統等(Bioinformatics,2007,336-43)方法在系統分析中已經得到應 用。很多模型的建立借鑒了電路和其它物理系統建模的方法,很多研究試圖從信息流、熵和能量流等宏觀分析思想來解決系統的復雜性問題(Anal Quant Cytol Histol,2007,296-308)。當然,建立生物系統的理論模型還需要很長時間的努力,現在實驗觀測數據雖然在海量增加,但是生物系統的模型辨 識所需要的數據遠遠超過了目前數據的產出能力。例如,對於時間序列的晶元數據,采樣點的數量還不足以使用傳統的時間序列建模方法,巨大的實驗代價是目前系 統建模主要困難。系統描述和建模方法也需要開創性的發展。
9.生物信息學技術方法的研究
生物信息學不僅僅是生物學知識的簡單整理和、數學、物理學、信息科學等學科知識的簡單應用。海量數據和復雜的背景導致機器學習、統 計數據分析和系統描述等方法需要在生物信息學所面臨的背景之中迅速發展。巨大的計算量、復雜的雜訊模式、海量的時變數據給傳統的統計分析帶來了巨大的困難, 需要像非參數統計(BMC Bioinformatics,2007,339)、聚類分析(Qual Life Res,2007,1655-63)等更加靈活的數據分析技術。高維數據的分析需要偏最小二乘(partial least squares,PLS)等特徵空間的壓縮技術。在計算機演算法的開發中,需要充分考慮演算法的時間和空間復雜度,使用並行計算、網格計算等技術來拓展演算法的 可實現性。
10, 生物圖像
沒有血緣關系的人,為什麼長得那麼像呢?
外貌是像點組成的,像點愈重合兩人長得愈像,那兩個沒有血緣關系的人像點為什麼重合?
有什麼生物學基礎?基因是不是相似?我不知道,希望專家解答。
11, 其他
如基因表達譜分析,代謝網路分析;基因晶元設計和蛋白質組學數據分析等,逐漸成為生物信息學中新興的重要研究領域;在學科方面,由生物信息學衍生的學科包括結構基因組學,功能基因組學,比較基因組學,蛋白質學,葯物基因組學,中葯基因組學,腫瘤基因組學,分子流行病學和環境基因組學,成為系統生物學的重要研究方法.從現在的發展不難看出,基因工程已經進入了後基因組時代.我們也有應對與生物信息學密切相關的如機器學習,和數學中可能存在的誤導有一個清楚的認識.

D. DNA與蛋白質相互作用的研究方法有哪些

在許多的細胞生命活動中,例如DNA復制、mRNA轉錄與修飾以及病毒的感染等都涉及到DNA與蛋白質之間的相互作用的問題。重組DNA技術的發展,人們已分離到了許多重要的基因。現在的關鍵問題是需要揭示環境因子及發育信號究竟是如何控制基因的轉錄活性。為此需要:a、鑒定分析參與基因表達調控的DNA元件;b、分離並鑒定這些順式元件特異性結合的蛋白質因子;這些問題的研究都涉及到DNA與蛋白質之間的相互作用。
研究DNA-蛋白質相互作用的實驗方法主要包括:a、凝膠阻滯實驗; b、DNase 1 足跡實驗;c、甲基化干擾實驗; d、體內足跡實驗; f、拉下實驗。研究蛋白質/ 核酸相互作用近期採用的新技術有:核酸適體技術、生物信息學方法、蛋白質晶元技術以及納米技術等。
凝膠阻滯實驗
1、概念:
凝膠阻滯實驗(Gel retardation assay),要叫做DNA遷移率變動試驗(DNA mobility shift assay)或條帶阻滯實驗(Band retardation assay)是在八十年代初期出現的用於在體外研究DNA與蛋白質相互作用的一種特殊的凝膠電泳技術。
2、原理:
在凝膠電泳中,由於電場的作用,裸露的DNA分子向正電極移動距離的大小是同其分子量的對數成反比。如果某種DNA分子結合上一種特殊的蛋白質,那麼由於分子量的加大它在凝膠中的遷移作用便會受到阻滯,於是朝正極移動的距離也就相應的縮短,因而在凝膠中出現滯後的條帶,這就是凝膠阻滯實驗的基本原理。
3、過程:
首先制備細胞蛋白質提取物(理論上其中含有某種特殊的轉錄因子)
用放射性同位素標記待檢測的DNA片段(含有轉錄因子的結合位點)
這種被標記的探針DNA同細胞蛋白質提取物一起進行溫育,於是產生DNA-蛋白質復合物
在控制使DNA-蛋白質保持結合狀態的條件下,進行非變性聚丙烯醯胺凝膠電泳
最後進行放射自顯影,分析電泳結果
4、實驗結果的分析:
a、如果有放射性標記的條帶都集中於凝膠的底部,這就表明在細胞提取物中不存在可以同探針DNA相互結合的轉錄因子蛋白質;
b、如果在凝膠的頂部出現放射性標記的條帶,這就表明細胞提取物存在可與探針DNA結合的轉錄因子蛋白質。
5、DNA競爭實驗:
DNA競爭實驗(DNA competitive assay)的具體做法如下:
在DNA-蛋白質結合的反應體系中加入了超量的非標記的競爭DNA(competitor DNA),如果它同探針DNA結合的是同一種轉錄因子蛋白質,那麼由於競爭DNA與探針DNA相比是極大超量的,這樣絕大部分轉錄因子蛋白質都會被競爭結合掉,而使探針DNA仍然處於自由的非結合狀態,可以在電泳凝膠的放射自顯影圖片上就不會出現阻滯的條帶;
如果反應體系中加入的競爭DNA並不能同探針DNA競爭結合同一種轉錄因子,結果在電泳凝膠中的放射自顯影圖片上就會出現阻滯的條帶。
6、應用:
a、凝膠阻滯實驗可以用於鑒定在特殊類型細胞蛋白質提取物中,是否存在能同某一特定的DNA(含有轉錄因子結合位點)結合的轉錄因子蛋白質;
b、DNA競爭實驗可以用來檢測轉錄因子蛋白質同DNA結合的精確序列部位;
c、通過競爭DNA中轉錄因子結合位點的鹼基突變可以研究此種突變競爭性能及其轉錄因子結合作用的影響;
d、也可以利用DNA同特定轉錄因子的結合作用通過親和層析來分離特定的轉錄因子。
DNaseI足跡實驗
1、定義:
足跡實驗(foot-printing assay),是一種用來檢測被特定轉錄因子蛋白質特異性結合的DNA序列的位置及其核苷酸序列結構的專門實驗方法。
2、原理:
當DNA分子中的某一區段同特異的轉錄因子結合之後便可以得到保護而免受DNaseI 酶的切割作用,而不會產生出相應的切割分子,結果在凝膠電泳放射性自顯影圖片上便出現了一個空白區,俗稱為「足跡」。
3過程:
將待檢測的雙鏈DNA分子在體外用32P作5『末端標記,並用適當的限制性內切酶切出其中的一個末端,於是便得到了一條單鏈末端標記的雙鏈DNA
在體外同細胞蛋白質提取物(細胞核提取物也可以)混合,形成DNA-蛋白質復合體
在反應混合物中加入少量的DNase I,並控制用量使之達到平均每條DNA鏈,只發生一次磷酸二酯鍵的斷裂:
a、如果蛋白質提取物中不存在與DNA結合的特定蛋白質,使DNase I消化之後,便會產生出距離放射性標記末端1個核苷酸,2個核苷酸,3個核苷酸------等等一系列前後長度均相差一個核苷酸的不間斷的連續的DNA片段梯度群體;
b、如果DNA分子同蛋白質提取物中的某種轉錄因子結合,被結合部位的DNA就可以得到保護免受DNase I酶的降解作用;
除去蛋白,加樣在20%序列膠上進行電泳分離,實驗分兩組:
a、實驗組:DNA+蛋白質混合物
b、對照組:只有DNA,未與蛋白質提取物進行溫育
最後進行放射性自顯影,分析實驗結果。
4、結果判斷:
實驗組凝膠電泳顯示的序列,出現空白的區域表明是轉錄因子蛋白質結合部;與對照組序列比較,便可以得出蛋白質結合部位的DNA區段相應的核苷酸序列。
5、其他的足跡實驗方法:
除了DNase1足跡試驗之外,目前還發展出了若干種其他類型的足跡實驗,例如:
a、 自由羥基足跡實驗;b、菲咯啉銅足跡實驗;c、DMS(硫酸二甲酯)足跡實驗
DMS(硫酸二甲酯)足跡實驗的原理
DMS能夠使DNA分子中裸露的鳥嘌呤(G)殘基甲基化,而六氫吡啶又會對甲基化的G殘基作特異性的化學切割。如果DNA分子中某一區段同轉錄因子結合,就可以避免發生G殘基的甲基化而免受六氫吡啶的切割作用。
甲基化干擾實驗
1、概念:
甲基化干擾實驗(Methylation interference assay)是根據DMS(硫酸二甲酯)能夠使DNA分子中裸露的鳥嘌呤(G)殘基甲基化,而六氫吡啶又會對甲基化的G殘基作特異性的化學切割這一原理設計的另一種研究蛋白質同DNA相互作用的實驗方法。
應用這種技術可以檢測靶DNA中G殘基的優先甲基化,對爾後的蛋白質結合作用究竟會有什麼效應,從而更加詳細的揭示出DNA與蛋白質相互作用的模式。
2、實驗步驟:
用DMS處理靶DNA使之局部甲基化(平均每條DNA只發生一個G鹼基甲基化作用)
同細胞蛋白質提取物一起進行溫育,促進使DNA與蛋白質的結合
進行凝膠電泳形成兩種靶DNA條帶:
a、 其一沒有同蛋白質結合的DNA正常電泳條帶
b、其二同特異蛋白質結合而呈現滯後的DNA電泳條帶
將這兩種DNA電泳條帶分別從凝膠中切出,並用六氫吡啶進行切割,結果為:
a)、甲基化的G殘基被切割:因為轉錄因子蛋白質只能夠同未發生甲基化的正常的結合位點結合,所以在轉錄因子DNA結合位點序列中的G殘基如果被DMS甲基化之後,轉錄因子就無法同其結合位點(順式元件)發生結合作用,從而使得結合位點中的G殘基同樣也要被六氫吡啶切割;
b)、不具有甲基化G殘基的靶DNA 序列則不會被切割
將結合蛋白質的DNA條帶和不結合蛋白質的DNA條帶,經六氫吡啶切割作用之後,再進行凝膠電泳
作放射自顯影,讀片並分析結果
3、結果判斷:
a、同轉錄因子蛋白質結合的靶DNA序列,經六氫吡啶切割之後,電泳分離呈現兩條帶,有一個空白區
b、不同轉錄因子蛋白質結合的靶DNA序列,經六氫吡啶切割後,電泳分離呈現三條帶,沒有空白區域的出現。
4、應用:
a、甲基化干擾實驗可以用來研究轉錄因子與DNA結合位點中的G殘基之間的聯系;
b、是足跡實驗的一種有效的補充手段,可以鑒定足跡實驗中DNA與蛋白質相互作用的精確位置
5、缺點:
DMS只能使DNA序列中的G和A殘基甲基化,而不能使T和C殘基甲基化。
體內足跡實驗
上面討論的三種研究轉錄因子與DNA相互作用的方法,有一個共同的不足之處在於它們是在體外進行的實驗,因此人們就會考慮這些實驗結果是否能夠反映細胞內發生的真實生命過程,即細胞內發生的真實的DNA與蛋白質的相互作用情況。
為了解答這個問題,科學家就設計出了一種體內足跡試驗(in vivo foot-printing assay),該方法可以看做是體外DMS足跡實驗的一個變種。
1、原理:
體內足跡試驗的原理原則上同體外DMS足跡實驗無本質差別,即
a、DMS能夠使G殘基甲基化;
b、六氫吡啶能特異的切割甲基化的G殘基;
c、同特異轉錄因子蛋白質結合的識別序列中的G殘基由於受到蛋白質的保護而不會被DMS甲基化,於是不會被六氫吡啶切割;
d、同對照的裸露的DNA形成的序列梯作比較,就會發現活細胞DNA形成的序列梯中缺少G殘基沒有被切割的相應條帶。
2、過程:
用有限數量的化學試劑DMS處理完整的游離細胞,使滲透到胞內的DMS濃度恰好導致天然染色體DNA的G殘基發生甲基化
對這些經過DMS處理的細胞提取DNA,並在體外加入六氫吡啶作消化反應
PCR擴增後作凝膠電泳分析,因為在體外實驗中用的是克隆的DNA片段其數量足夠,而在體內足跡實驗中用的是從染色體DNA中分離獲得的任何一種特異的DNA,其數量是微不足道的,所以需要經PCR擴增以獲得足夠數量的特異DNA
放射自顯影,讀片並記錄讀片的結果
3、結果判斷:
a、能夠同轉錄因子蛋白質結合的DNA區段其中G殘基受到保護因而不會被DMS甲基化避免了六氫吡啶的切割作用;
b、體外裸露的DNA分子上,G殘基被DMS甲基化而被六氫吡啶切割。
拉下實驗(Pull-down assay)
拉下實驗又叫做蛋白質體外結合實驗(binding assay in vitro),是一種在試管中檢測蛋白質之間相互作用的方法。其基本原理是將某種小肽(例如生物素、6-His標簽以及谷胱甘肽轉移酶等)的編碼基因與誘餌蛋白的編碼基因重組,表達為融合蛋白。分離純化融合蛋白並與磁珠結合,使之固相化之後,再與表達目的蛋白的細胞提取物混合保溫適當時間,例如在4℃下保溫過夜,使目標蛋白同已經固定在磁珠表面的融合蛋白中的誘餌蛋白充分的結合。離心收集與固定化的融合蛋白(即與磁珠相互結合的融合蛋白)中的誘餌蛋白相結合的目的蛋白,經過煮沸處理使目的蛋白與誘餌蛋白相脫離從而從固相支持物(例如磁珠)上脫離下來,收集樣品,再與目標蛋白的抗體作Western blotting分析,以檢測出與誘餌蛋白的目標的目標蛋白。
一些新的研究蛋白質/ 核酸相互作用的方法和技術,主要從核酸適體技術、生物信息學方法、蛋白質晶元技術以及納米技術等方面進行綜述。
核酸適體技術
核酸適體(aptamer)指的是經過一種新的體外篩選技術——指數富集配體系統進化(systematic evolution of ligands by exponential enrichment,SELEX),從隨機單鏈寡聚核苷酸文庫中得到的能特異結合蛋白質或其他小分子物質的單鏈寡聚核苷酸,可以是RNA 也可以是DNA,長度一般為25~60 個核苷酸。SELEX 的篩選流程首先是利用現有的分子生物學技術人工合成一個含有1014~1015 個單鏈寡核苷酸序列的隨機文庫,序列長度往往在25~35 個核苷酸之間,單鏈的隨機寡核苷酸序列容易形成可與蛋白質等配體特異性共價結合的二級結構,在這一高親和力特異性結合的基礎之上配體蛋白質同隨機文庫相互作用,選擇性分離出核酸適體後,然後通過PCR或RT-PCR 等技術進行擴增。次一級文庫再與配體蛋白質相互作用,反復多次循環,即可獲得與配體蛋白質特異性高親和力結合的核酸適體。核酸適體與配體間的親合力(解離常數在皮摩和納摩之間)常要強於抗原抗體之間的親合力[3]。核酸適體所結合的靶分子范圍非常廣泛,除蛋白質之外,還能作用於酶、生長因子、抗體、基因調節因子、細胞黏附分子、植物凝集素、完整的病毒顆粒、病原菌等[4]。適體從20 世紀90 年代初出現以後,就得到了科研工作者的廣泛關注,適體的研究工作得到了快速的發展。SELEX 篩選技術和核酸適體的高親和性在蛋白質/ 核酸相互作用的研究中發揮了重要的作用。Wen等[5]研究了同細菌噬菌體Ff 基因5蛋白(g5p) 高親和力結合的核酸適體,發現G 富集基序對於形成g5p 連接啟動子結構,提供實際的g5p 連接位點具有重要的意義。White 等[6]利用SELEX 技術研究了一種PUM2HD (短小桿菌素同源結構域)及其RNA 核酸適體,發現在PUM2 氨基端有Ser和Glu/Ala富集區,並且PEB ( PUM2 連接元件)與果蠅反應元件的3'端具有親緣關系,但又互不相同。Bouvent等[7]利用NRE(核仁蛋白識別元件) 發現了RNA 莖環上的RBD1 和RBD2 (折疊元件結構域),這對了解模式蛋白識別RNA 的結構過程具有重要意義。核酸適體以及SELEX 技術給蛋白質/ 核酸相互作用研究提供了一種新穎的研究方法,科研人員可以控制篩選條件得到與待研究蛋白質相互結合的核酸適體,避免了天然條件下研究蛋白質/ 核酸相互作用的困難性。但目前對核酸適體與靶蛋白相互作用的分析是在篩選條件與天然條件相同的假設基礎上進行的,在這種篩選條件下得到的核酸適體與蛋白質之間的相互作用,和天然狀態下的蛋白質/ 核酸之間的相互作用到底有何異同,這是一個亟待解決的問題,此問題的解決必將推動蛋白質/ 核酸相互作用的研究進展。
生物信息學方法
生物信息學是在生命科學的研究中,以計算機為工具對生物信息進行儲存、檢索和分析的科學。它包含著生物信息的獲取、處理、存儲、分配、分析和解釋的所有方面。具體地說,生物信息學是用數理和信息科學的觀點、理論和方法去研究生命現象,組織和分析呈現指數增長的生物學數據的一門學科。Luscombe和Thornton[8]利用氨基酸序列的保守性構建計算機演算法來預測蛋白質/DNA復合體中DNA的結合位點。Selvaraj等[9]將蛋白質/核酸復合體中原子電荷勢能作為訓練數據集,利用人工智慧技術來預測蛋白質對DNA 的識別位點。Ahmad 等[10]將蛋白質的序列組成、可溶解性以及二級結構等信息數據用人工神經網路演算法進行訓練,構建了在線蛋白質/ 核酸結合預測技術,預測成功率達到了69%。此後Ahmad 和Sarai[11]將此技術進一步加強,在訓練人工神經網路時加入了蛋白質進化關系的信息,使預測成功率提高了8.7%。目前建立在蛋白質/ 核酸相互作用基礎上的較重要的資料庫為蛋白質- 核酸識別資料庫(http://gibk26.bse.kyutech.ac.jp/jouhou/3dinsight/recognition.html),利用該資料庫能幫助研究者了解核酸被蛋白質識別的機制。該資料庫包括以下幾個組成部分。
2.1蛋白質-核酸復合物資料庫蛋白質-核酸復合物資料庫是一個包含蛋白質- 核酸復合物結構數據的資料庫。這些數據根據蛋白質的識別序列和復合物中DNA 形式進行分類。使用者可以通過關鍵詞、識別序列、D N A 形式等進行搜索,並且搜索結果可以直接鏈接到3DinSight資料庫(在此處,可以通過三維結構瀏覽器,如RasMol 或者VRML 查看含有序列位點和突變位點的三維結構圖)。該資料庫也能讓使用者檢測依賴於序列的構象參數和DNA 的柔韌性,並以圖表形式顯示結果。
2.2核苷酸-氨基酸相互作用資料庫核苷酸-氨基酸相互作用資料庫搜集核苷酸和氨基酸間4 埃大小內的成對原子,能讓使用者找到成對的核苷酸和氨基酸。使用者可以指定殘基名稱( 核苷酸或氨基酸)、原子類型和側鏈/ 骨幹。搜索後,帶有距離值的所有原子對將被顯示。搜索可直接鏈接到3DinSight 資料庫,以RasMol 圖片形式自動地突出展示復合物結構中所有原子對。使用者可以檢測到每個結構中核苷酸和氨基酸的特別相互作用。
2.3蛋白質-核酸相互作用的熱力學資料庫(ProNIT)
蛋白質- 核酸相互作用的熱力學資料庫包含有序列、結構和一些熱力學參量(如分裂常數、結合常數、吉布斯自由能的轉換、焓和熱容量、活性)等信息。該資料庫允許使用者用不同條件(多種分類和顯示選項)搜索數據。此外,ProNIT 超鏈接於其他重要的資料庫,如PDB、核酸資料庫NDB 、酶代碼EC、蛋白質信息資源PIR 和ProTherm 等等。當前,在分子生物學和信息科學快速發展的影響下,生物信息學已經成為生物領域的指導科學,利用生物信息學方法研究蛋白質/核酸相互作用可以大大縮短研究工作的時間,達到事半功倍的效果。但受限於當前計算科學和演算法領域的發展情況,生物信息學得到的結果與實際的結果還存在一定的偏差,仍需開展進一步的實驗工作來進行驗證。
生物晶元技術
生物晶元技術是基於生物大分子間相互作用的大規模並行分析方法,使得生命科學研究中所涉及的樣品反應、檢測、分析等過程得以連續化、集成化和微型化,現已成為當今生命科學研究領域發展最快的技術之一。目前的生物晶元主要有核酸晶元、蛋白質晶元和糖體晶元等幾大類。蛋白質晶元是依靠手工、壓印或噴墨的方法將探針蛋白點樣在化學膜、凝膠、微孔板或玻片上形成陣列,經過與樣品的雜交捕獲靶蛋白,再用原子力顯微鏡、磷光成像儀、光密度儀或激光共聚焦掃描儀進行檢測,獲得靶蛋白表達的種類、數量及關聯等信息。蛋白質晶元已經廣泛用於研究蛋白質與核酸的相互作用,已成為一種進行高通量蛋白質與DNA 或RNA作用篩選的有效方法。Ge[12]運用蛋白質晶元檢測蛋白質與核酸相互作用,他將包括通用轉錄因子、激活蛋白和輔激活蛋白在內的48種純化蛋白質點樣在硝酸纖維素膜製成通用蛋白質晶元,用腺病毒主要晚期啟動子64 bp 雙鏈DNA 片段、腺病毒主要晚期啟動子64 bp 負鏈DNA 和SV40 早期前體mRNA 雜交,結果證明蛋白質晶元上的所有蛋白質都能夠不同程度地特異性識別和結合雙鏈和單鏈寡核苷酸片段,並且結合雙鏈DNA 和單鏈DNA 的總體模式基本相同,說明大多數D N A 結合蛋白既能和雙鏈DNA 結合,也能夠和單鏈DNA 結合。蛋白質晶元與RNA 的作用研究表明,蛋白質晶元能夠成功地分析RNA 與蛋白質間的識別性結合。蛋白質晶元技術最大優點在於快速和高通量,以往科研人員作研究時一次只能研究少量生物樣品,藉助蛋白質晶元,一次實驗可同時研究大量生物樣本,加速了蛋白質/ 核酸相互作用的研究。蛋白質晶元技術目前存在的問題有:(1)蛋白質晶元在製作過程中實驗條件發生微小的變化便可能引起最後結果的不同,實驗條件不易控制,使得實驗結果的可重復性相對不足;(2) 目前用於蛋白質晶元制備的固相介質,如化學膜、凝膠和玻片都存在一些缺點,蛋白質在固相基質表面的固定往往會造成其解折疊,從而失去生物活性;(3)對結果的掃描、去除背景、數據處理等,目前還不能做得很完美,會導致假陽性、假陰性的存在。
納米技術
納米技術(nano scale technology) 是一門在0.1~100nm 空間尺度內操縱原子和分子,對材料進行加工、製造具有特定功能的產品、或對某物質進行研究,掌握其原子和分子的運動規律和特性的嶄新高技術學科。核酸和蛋白質等生物大分子的大小也是在納米尺度,隨著科學技術的快速發展,越來越多的納米技術被用來研究生物大分子。在蛋白質/ 核酸相互作用的研究工作中,目前使用較新的技術是利用納米孔技術來進行研究。納米孔(nanopore),可以簡單地定義為內徑為1~100nm 的微小洞孔,一般孔徑應大於洞孔深度,或者處於同一量級。如果孔的深度遠大於孔徑,就稱之為納米孔道。納米孔有天然存在的生物納米孔,也有人工加工的納米孔。它們都可以用來進行生命科學的相關研究,但是,理想的生物化學或生物物理研究應採用孔徑穩定、堅固耐用、物化性能良好的固體納米孔,這樣的納米孔應該由質地堅硬的固體薄膜材料加工製作。Li等[16]利用聚焦離子束(FIB)製作納米孔,利用納米孔將雙螺旋DNA 從組蛋白八聚體上剝離下來,並探測這一過程,從而可以揭示核小體中包含的許多生物化學、物理信息。這是由於處於電場中的核小體在電場的作用下,DNA 分子穿越納米孔,同時由於納米孔的阻擋力,使組蛋白不能穿越,從而誘使DNA 從組蛋白八聚體上分離下來。通過准確檢測DNA 分子穿孔過程中引起的電流阻塞效應,可將DNA 與組蛋白的相互作用的一些性質反映出來。目前已經取得了階段性的成果。在納米尺度上研究核酸與蛋白質相互作用,相較於其他的研究方法,優點是能夠在生物活性環境中,保持生物大分子受到最少化學修飾干擾的狀態下,對生物大分子的空間結構、動態變化、生化特性等進行直接研究。相信該技術可以提供更多、更詳細的生物大分子相互作用、蛋白質功能等方面的信息,幫助我們解決一些深層次的生物學疑難問題。目前阻礙此方法廣泛應用的一個最大難題是如何在納米尺度上更好的操縱生物大分子,這需要生物科學、電子科學、材料科學等多學科的共同進展來推動此方法的發展和應用。

閱讀全文

與蛋白相互作用演算法相關的資料

熱點內容
什麼app零粉分發視頻有收益 瀏覽:162
肯亞程序員 瀏覽:638
新科源碼 瀏覽:659
如何判斷伺服器有沒有帶寬 瀏覽:41
天正建築批量刪除命令 瀏覽:94
cad最下面的一排命令都什麼意思 瀏覽:456
pythonimportcpp 瀏覽:850
W10的系統怎麼給U盤加密 瀏覽:370
華為手機代碼編程教學入門 瀏覽:762
和彩雲沒會員怎樣解壓 瀏覽:634
androidimageview保存 瀏覽:387
新買店鋪什麼伺服器 瀏覽:883
文件夾能直接刻錄嗎 瀏覽:493
androidxmpp刪除好友 瀏覽:969
javac哪個前景好 瀏覽:428
中華英才網app為什麼不能搜索了 瀏覽:660
伺服器域名是什麼意思 瀏覽:52
Linux導出mysql命令 瀏覽:159
無詐建鄴是什麼app 瀏覽:228
python中的雙色球 瀏覽:168