㈠ 有一串dna序列存储为一个文件,名为dna.txt。写一个python程序,打印出所
破译的过程其实挺简单 现在我们知道,DNA的信息储存是由3连密码子储存的,总共四种核苷酸,在DNA里是A T C G 在RNA里是A U C G 在转录的时候T和U是对等的,所以我们可以把它也看成是一种核苷酸.它们每三个一组,通过不同的排列组合方式,表达一种氨基酸,所以基因链可以通过读取三连密码子,来进行破译.在最初破译三连密码子的时候,有一个确定的方向,就是肯定一定数量的核苷酸的排列组合,对应的一个氨基酸信息,方向确定之后,接下来的工作就是确定密码子的数量,也就是说,几个碱基对应一个氨基酸,现已知道构成蛋白质的氨基酸共20种,那么四种碱基不可能一一对应,如果是2种碱基排列,则有16种组合,也不够,那么接下来就是3种碱基的排列,总共有64种组合,可以完全覆盖20种氨基酸,如果是4种碱基,则有256种组合,虽然也完全覆盖了20种氨基酸,但是数量太过悬殊,从一切节约的生命原则来看,未免信息量过大,会造成信息储存的传递的负担.所以当初的科学家暂定是3种碱基的组合为一个密码子.说实话,这有些运气的成分.当然,这种运气是被后来的事实验证了的.接下来就是确定各种碱基组合分别对应的是哪种氨基酸,这是个繁琐的工作,其实原理很简单,就是人工合成一段DNA,然后用来表达,看这段DNA序列最后合成的是哪种氨基酸.比如 首先要确定的是密码子“AAA”的信息 那么我们就合成一段序列“AAA AAA AAA AAA AAA AAA AAA”将其翻译成蛋白之后,发现这一段序列由7个赖氨酸组成,那么就可以相信,赖氨酸是由三个A编码的.当然,用64个密码子表示20种氨基酸,肯定会有重复,这就是密码子的简并性,就是会有多个密码子表示一个氨基酸,具体就不细说了.
㈡ 怎么用python将这个文件里同类碱基序列提出了来
扩展名-文件说明 * .0 - Hacha Split存档 * .000 - DoubleSpace压缩档 * .001 - 7-Zip压缩Split档 * .7z - 7-Zip压缩档 * .ace -WinAce压缩档 * .ain - AIN压缩存档 * .alz - ALZip存档 * .apz - Autoplay Media Studio Exported Project *
㈢ 将DNA序列在Python问题,怎么解决
1#!/usr/bin/python
2#-*-coding:utf-8-*-
3"将DNA序列转换为RNA序列,即将T转换为U即可,利用字符串的replace方法"
5f=open('./test.txt','r')
6line=f.read()
7dna2rnaline=line.replace('T','U')
8f.close()
9f=open('./test.txt','w')
10line=f.write(dna2rnaline)
11f.close()#了解DNA序列和RNA序列的碱基差别
㈣ 求用perl或者python提取fasta格式中每个序列从一个位置到另一个位置的序列(每个序列位置都不一样)
这个其实很简单,只是逻辑要通顺。
我给你perl的解决思路:
首先,你要确定你的fasta文件的内容的规律性。比如每段序列的开始是不是都会有一些特殊的标志。那么可以用next函数,将这些不是序列的内容跳过。
然后开始读取每一行,将每一行的内容串联起来,直到读取到下一段序列开始的标记
(该处使用if判断,如果读到标记就停止记录,可以有个好办法,你前期使用一个$num,前面读取的每行都串联给$seq,然后当你判断到标记符号出现以后,让$num++,并把$array[$num]=$seq,此处要注意一下,这里还要记得让$seq为空一下否则会出大问题的,然后就可以记录此条序列并进入下一条序列的读取了)
如此反复判断读取,最终可以将每个序列都读取出。
只要发现规律,有了思路,读取序列简直是分分钟的事情,思路以及发现规律性最为重要。
㈤ 用python或Perl如何提取文本中多条序列同一区间的碱基,求解答!!!
题主你好,
python代码及测试结果见截图:
写在最后: 上面的测试文件我随便写了两行,其中第1行的A-N和第2行的a-n是48-61个字符
希望可以帮到题主, 欢迎追问
㈥ python如何自动生成单个随机字母(a-z)
1:mport random
#导入random模块 用于生产随机数功能
2:a = random.randint(97, 122)
#利用random.randint()函数生成一个随机整数a,使得97<=a<=122
#对应从“a”到“z”的ASCII码
3:c = chr(a)
#将a表示的ASCII码转换为对应的字母,这里的c就是你要的随机字母
4:print c
#将字母输出,完成
㈦ 如何用PYTHON提取基因序列里的小写字符串(内含子)
楼上的代码正确
内含子是不会小写的,小写了说明大家已经知道那是内含子了。……你这个程序还有啥意义。