
ncbi使用教程
AAA3381664
2016-11-04 19054人看过
NCBI (National Center for Biotechnology Information)是指美国国立生物技术信息中心。理解自然无声但精妙的关于生命细胞的语言是现代分子生物学的要求。通过只有四个字母来代表DNA化学亚基的字母表,出现了生命过程的语法,其最复杂形式就是人类。阐明和使用这些字母来组成新的“单词和短语”是分子生物学领域的中心焦点。数目巨大的分子数据和这些数据的隐秘而精细的模式使得计算机化的数据库和分析方法成为绝对的必须。挑战在于发现新的手段去处理这些数据的容量和复杂性,并且为研究人员提供更好的便利来获得分析和计算的工具,以便推动对我们遗传之物和其在健康和疾病中角色的理解。在生物学研究中,NCBI提供了大量的生物信息分析工具以及文献。所以学号检索方法是进入新生物学领域的必备技能。Blast工具、PubMed文献数据库等。
工具/原料
浏览器 NCBI网址
方法/步骤
1/9 分步阅读
首先进入NCBI主页。
Map view演示,主要是找到相关基因在染色体上的位置,以人类IL-6基因为例。
点击Map View
查看剩余1张图
2/9
选择物种,点击Go;
设置filter,过滤信息;
点击Genes seq查询序列
查看剩余4张图
3/9
最后进入序列下载页面,可以直接下载。可以选择多种格式,一般选择fasta。
查看剩余2张图
4/9
通过clone查询相关基因的cDNA序列
选择clone数据库,search基因描述。
查看剩余2张图
5/9
对基因的蛋白质序列和mRNA查询。
查看剩余1张图
6/9
也可对序列进行查询。基因组展示。
查看剩余1张图
7/9
也可以查询序列信息。
查看剩余1张图
8/9
查询已知引物,通过probe数据库搜索。
查看剩余1张图
9/9
同源性比对blast。有多种比对方式。DNA,RNA,Protein等比对模式,排列越高表示同源性越强。也可以进行引物比对。
查看剩余2张图
注意事项
简单演示仍需深入了解
21世纪是生物科学的世纪
软件 NCBI
编辑于2016-11-04,内容仅供参考并受版权保护
赞 踩分享
bsci认证机构哪家好
电子文献载体类型标识:
DB/OL—联机网上数据库 DB/MT—磁带数据库 M/CD—光盘图书
CP/DK—磁盘软件 J/OL—网上期刊 EB/OL—网上电子广告
电子文献的著录格式:
[序号]主要责任者电子文献题名[电子文献类型标识/载体类型标识]电子文献的出处或可获得的地址,发表或更新日期/引用日期(任选)。
NCBI (National Center for Biotechnology Information[1] )是指美国国立生物技术信息中心。理解自然无声但精妙的关于生命细胞的语言是现代分子生物学的要求。通过只有四个字母来代表DNA化学亚基的字母表,出现了生命过程的语法,其最复杂形式就是人类。阐明和使用这些字母来组成新的“单词和短语”是分子生物学领域的中心焦点。数目巨大的分子数据和这些数据的隐秘而精细的模式使得计算机化的数据库和分析方法成为绝对的必须。挑战在于发现新的手段去处理这些数据的容量和复杂性,并且为研究人员提供更好的便利来获得分析和计算的工具,以便推动对我们遗传之物和其在健康和疾病中角色的理解。
后来的参议员Claude Pepper意识到信息计算机化过程方法对指导生物医学研究的重要性,发起了在1988年11月4日建立国立生物技术信息中心(NCBI)的立法。NCBI是在NIH的国立医学图书馆(NLM)的一个分支。NLM是因为它在创立和维护生物信息学数据库方面的经验被选择的,而且这可以建立一个内部的关于计算分子生物学的研究计划。NCBI的任务是发展新的信息学技术来帮助对那些控制健康和疾病的基本分子和遗传过程的理解。
NCBI有一个多学科的研究小组包括计算机科学家,分子生物学家,数学家,生物化学家,实验物理学家,和结构生物学家,集中于计算分子生物学的基本的和应用的研究。这些研究者不仅仅在基础科学上做出重要贡献,而且往往成为应用研究活动产生新方法的源泉。他们一起用数学和计算的方法研究在分子水平上的基本的生物医学问题。这些问题包括基因的组织,序列的分析,和结构的预测。目前研究计划的一些代表是:检测和分析基因组织,重复序列形式,蛋白domain和结构单元,建立人类基因组的基因图谱,HIV感染的动力学数学模型,数据库搜索中的序列错误影响的分析,开发新的数据库搜索和多重序列对齐算法,建立非冗余序列数据库,序列相似性的统计显著性评估的数学模型和文本检索的矢量模型。另外,NCBI研究者还坚持推动与NIH内部其他研究所及许多科学院和政府的研究实验室的合作。
先来讲讲NCBI的。
用FTP登陆ftpncbinihgov(windows下可以直接打开或是用迅雷/Flastget等下载工具)。cd gene/DATA(windows下依次找到gene/DATA这个文件夹)。ls一下,里面的文件大概有:
ncftp /gene/DATA > ls
ASN_BINARY/ gene2sts gene_refseq_uniprotkb_collabgz
ASN_OLD/ gene2unigene go_processxml
gene2accessiongz gene_groupgz mim2gene
gene2gogz gene_historygz misc/
gene2pubmedgz GENE_INFO/ README
gene2refseqgz gene_infogz
下面主要解释一下一些常用的文件。
1,gene2accessiongz,这里面的数据比较多,包含有NCBI所有的accession。但主要有以下的:
tax_id GeneID nucleotide_accession nucleotide_gi protein_accession protein_gi
2,gene2gogz,主要是Gene与GO之间的一一对应。里面的数据主要有:
tax_id GeneID GO_ID GO_term
3702 814629 GO:0003676 ucleic acid binding
3,gene2pubmedgz,主要是Gene与Pubmed ID的一一对应。
tax_id GeneID PubMed_ID
9 1246500 9873079
4,gene2unigene,Gene与Unigene数据库的一一对应
GeneID UniGene_cluster
1268433 Aga201
5,gene2refseqgz,这个就不多讲。跟gene2accessiongz类似。不过其中的accession都是RefSeq数据库的。
6,gene_infogz,是NCBI的Gene数据库。包含有Gene的gene_name(Symbol),第几号染色体等。主要有:
tax_id GeneID Symbol chromosome description
大概就这些。如果你会用Linux,这些大批量的一一对应是非常简单的。在GO/EMBL/Uniprot等也有类似的批量对应。以后有需要有讲到。
以上就是关于ncbi怎么用全部的内容,包括:ncbi怎么用、NCBI网上电子数据库参考文献格式怎么写、如何利用NCBI Unigene数据库里的序列等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)