怎么用ncbi数据库查找基因序列编号

怎么用ncbi数据库查找基因序列编号,第1张

GI编号是NCBI网站的所有序列相关数据库的流水编号,其最有用的特征就是唯一性对于每一条递交给NCBI的序列,都会付给一个编号,而

且这个编号对应的序列不可更改这个编号对应这个唯一的一条序列,类似与我们用的身份z号因此,利用GI在NCBI中查询时,你只要把数据库(蛋白质/

核苷酸)选对,只要输入这个号码就可以把相应的序列调出来

值得一提的是登录号(Accession Number)每一个递交的序列,除了获得一个GI号,还会被赋予一个登录号递交序列的作者利用登录号对序列进行修改和完善每一次修改的序列会获得一个新的GI号,登录号不变,但会追加一个流水的版本号

因此,GI号和带版本号的登录号都唯一定位到唯一条序列

NCBI 分类学数据库(taxonomy database)不是分类学或系统发育信息的信息源(primary source),而且也没有自己的一套完整的分类学系统,相反它只是努力整合各种各样来源的系统发育和分类学的知识,包括发表的文献、基于网络的数据库、序列提交者的建议以及来自NCBI 外部的分类学专家。因此NCBI 的分类学数据库不是一个系统发育或分类学的“专家数据库”(Wheeler et al, 2000)。

获取序列所对应的分类学信息有两种方法。

一种方法,从NCBI 网站下载gi与taxid 对应表,在Taxonomy 数据库的FTP 地址下载。这个目录下有多个压缩文件,其中针对Windows *** 作系统的两个针对蛋白质序列和核苷酸序列的压缩文件分别是gi_taxid_protdmpgz 和gi_taxid_nucldmpgz 文件。这两个文件都只有两列,左边为gi 号,右边为Taxid。由于这些文件非常大,因此用浏览器来打开这些文件几乎是不可能的。随着时间的推移,这两个文件会越来越大,不过速度不会是指数增长的,并且在美国东部时间的每个星期一2:00 am NCBI 会对其进行更新。

对于Windows 用户还有一个文件称为taxdumpzip 文件。文件解压缩后包括1 个prt 文件和6 个dmp 文件。Gencodedmp 文件保存有不同的密码子表,与同目录的gcprt 联合使用;mergeddmp 是保存有合并的taxid 号的对应表;nodesdmp 是结点信息;divisiondmp 是较大的几个分类;namesdmp 结点名称信息,每个id 对应多行。这些数据被Phylogenie 软件包中的blammer 程序用于构建进化树。

利用ftp 地址的连接利用>

在NCBI主页上方search栏左边有一个database选择框,点击下拉三角形选择nucleotide(如图红框)在search栏输入基因名搜索即可以人的orc1基因为例,在搜索结果中选择mRNA和complete

cds序列的结果都可以,如下点击进入序

CDS(Coding Sequence)特征域被认为是DNA生成蛋白质的翻译指令,利用CDS特征域构建外显子-内含子数据库(Exon-Intron Database,EID)是研究内含子起源、进化和功能的重要手段

以上就是关于怎么用ncbi数据库查找基因序列编号全部的内容,包括:怎么用ncbi数据库查找基因序列编号、谁知道怎样在NCBI中找数据库、ncbi数据库怎么查找基因序列等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://www.54852.com/sjk/9682523.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-30
下一篇2023-04-30

发表评论

登录后才能评论

评论列表(0条)

    保存