㈠ 有一串dna序列存儲為一個文件,名為dna.txt。寫一個python程序,列印出所
破譯的過程其實挺簡單 現在我們知道,DNA的信息儲存是由3連密碼子儲存的,總共四種核苷酸,在DNA里是A T C G 在RNA里是A U C G 在轉錄的時候T和U是對等的,所以我們可以把它也看成是一種核苷酸.它們每三個一組,通過不同的排列組合方式,表達一種氨基酸,所以基因鏈可以通過讀取三連密碼子,來進行破譯.在最初破譯三連密碼子的時候,有一個確定的方向,就是肯定一定數量的核苷酸的排列組合,對應的一個氨基酸信息,方向確定之後,接下來的工作就是確定密碼子的數量,也就是說,幾個鹼基對應一個氨基酸,現已知道構成蛋白質的氨基酸共20種,那麼四種鹼基不可能一一對應,如果是2種鹼基排列,則有16種組合,也不夠,那麼接下來就是3種鹼基的排列,總共有64種組合,可以完全覆蓋20種氨基酸,如果是4種鹼基,則有256種組合,雖然也完全覆蓋了20種氨基酸,但是數量太過懸殊,從一切節約的生命原則來看,未免信息量過大,會造成信息儲存的傳遞的負擔.所以當初的科學家暫定是3種鹼基的組合為一個密碼子.說實話,這有些運氣的成分.當然,這種運氣是被後來的事實驗證了的.接下來就是確定各種鹼基組合分別對應的是哪種氨基酸,這是個繁瑣的工作,其實原理很簡單,就是人工合成一段DNA,然後用來表達,看這段DNA序列最後合成的是哪種氨基酸.比如 首先要確定的是密碼子「AAA」的信息 那麼我們就合成一段序列「AAA AAA AAA AAA AAA AAA AAA」將其翻譯成蛋白之後,發現這一段序列由7個賴氨酸組成,那麼就可以相信,賴氨酸是由三個A編碼的.當然,用64個密碼子表示20種氨基酸,肯定會有重復,這就是密碼子的簡並性,就是會有多個密碼子表示一個氨基酸,具體就不細說了.
㈡ 怎麼用python將這個文件里同類鹼基序列提出了來
擴展名-文件說明 * .0 - Hacha Split存檔 * .000 - DoubleSpace壓縮檔 * .001 - 7-Zip壓縮Split檔 * .7z - 7-Zip壓縮檔 * .ace -WinAce壓縮檔 * .ain - AIN壓縮存檔 * .alz - ALZip存檔 * .apz - Autoplay Media Studio Exported Project *
㈢ 將DNA序列在Python問題,怎麼解決
1#!/usr/bin/python
2#-*-coding:utf-8-*-
3"將DNA序列轉換為RNA序列,即將T轉換為U即可,利用字元串的replace方法"
5f=open('./test.txt','r')
6line=f.read()
7dna2rnaline=line.replace('T','U')
8f.close()
9f=open('./test.txt','w')
10line=f.write(dna2rnaline)
11f.close()#了解DNA序列和RNA序列的鹼基差別
㈣ 求用perl或者python提取fasta格式中每個序列從一個位置到另一個位置的序列(每個序列位置都不一樣)
這個其實很簡單,只是邏輯要通順。
我給你perl的解決思路:
首先,你要確定你的fasta文件的內容的規律性。比如每段序列的開始是不是都會有一些特殊的標志。那麼可以用next函數,將這些不是序列的內容跳過。
然後開始讀取每一行,將每一行的內容串聯起來,直到讀取到下一段序列開始的標記
(該處使用if判斷,如果讀到標記就停止記錄,可以有個好辦法,你前期使用一個$num,前面讀取的每行都串聯給$seq,然後當你判斷到標記符號出現以後,讓$num++,並把$array[$num]=$seq,此處要注意一下,這里還要記得讓$seq為空一下否則會出大問題的,然後就可以記錄此條序列並進入下一條序列的讀取了)
如此反復判斷讀取,最終可以將每個序列都讀取出。
只要發現規律,有了思路,讀取序列簡直是分分鍾的事情,思路以及發現規律性最為重要。
㈤ 用python或Perl如何提取文本中多條序列同一區間的鹼基,求解答!!!
題主你好,
python代碼及測試結果見截圖:
寫在最後: 上面的測試文件我隨便寫了兩行,其中第1行的A-N和第2行的a-n是48-61個字元
希望可以幫到題主, 歡迎追問
㈥ python如何自動生成單個隨機字母(a-z)
1:mport random
#導入random模塊 用於生產隨機數功能
2:a = random.randint(97, 122)
#利用random.randint()函數生成一個隨機整數a,使得97<=a<=122
#對應從「a」到「z」的ASCII碼
3:c = chr(a)
#將a表示的ASCII碼轉換為對應的字母,這里的c就是你要的隨機字母
4:print c
#將字母輸出,完成
㈦ 如何用PYTHON提取基因序列里的小寫字元串(內含子)
樓上的代碼正確
內含子是不會小寫的,小寫了說明大家已經知道那是內含子了。……你這個程序還有啥意義。