
如何从海量高通量测序数据中筛选出目标数据?这是困扰大多数老师的一个难题!
我以一个excel的简单函数为例,演示一下如何从表格中快速筛选感兴趣的基因等信息。
函数的名称是 VLOOKUP函数 ,该函数是Excel表中的一个纵向查找函数,学会该函数之后, 可以方便我们从所有基因的结果中筛选我们关心的基因相关信息,比如:基因的长度、基因在样品中的表达量、基因的注释等等信息 。
VLOOKUP函数需要输入4个值:
1、要查找的值,比如:基因的ID;
2、需要查找的区域;
3、区域中包含返回值的列号,也就是找到相关值之后返回第几列的信息;
4、精确匹配或者近似匹配,一般我们选择精确匹配。精确匹配采用0/FALSE、近似匹配采用1/TRUE。
一般来说,我们做完转录组测序,都会有一个总表,表里有所有基因的ID、长度、表达量、差异倍数、注释信息等等,表格很大,内容很多。
如果我们想提取某些差异基因的基因长度信息,那么我们该如何 *** 作呢?
我们需要在需要提取长度信息的差异基因表中加上一列gene_length列。
然后插入VLOOKUP函数,按要求输入4个参数,点击确定即可。
以上是利用基因ID在总表中查找一列信息,比较简单。如果我们想查找多列信息该如何 *** 作呢?
方法相似,我们可以在总表中插入deg_gene列,然后去差异基因表中查找基因ID即可,具体 *** 作如下:
到这里,一个简单的Excel表筛选基因信息的方法就介绍完了,实际上在公司给出转录组标准分析之后,很多个性化都可以由自己解决,您需要的仅仅是高手领进门!
更多生物信息课程:
1 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接: 基因家族分析实 *** 课程 、 基因家族文献思路解读
2 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接: 转录组(有参)结果解读 ; 转录组(无参)结果解读
3 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接: WGCNA-加权基因共表达网络分析
4 转录组数据怎么挖掘?学习链接: 转录组标准分析后的数据挖掘 、 转录组文献解读
5 微生物16S/ITS/18S分析原理及结果解读 、 OTU网络图绘制 、 cytoscape与网络图绘制课程
6 生物信息入门到精通必修基础课,学习链接: linux系统使用 、 perl入门到精通 、 perl语言高级 、 R语言画图
7 医学相关数据挖掘课程,不用做实验也能发文章,学习链接: TCGA-差异基因分析 、 GEO芯片数据挖掘 、 GSEA富集分析课程 、 TCGA临床数据生存分析 、 TCGA-转录因子分析 、 TCGA-ceRNA调控网络分析
8其他课程链接: 二代测序转录组数据自主分析 、 NCBI数据上传 、 二代测序数据解读 。
进行因子分析的前提条件是,各变量之间应该低度相关。
因子分析的主要目的是用来描述隐藏在一组测量到的变量中的一些更基本的,但又无法直接测量到的隐性变量。因此因子分析的首要前提就是各个变量之间应该具有一定的相关度,不要求相关度过高,只是低度相关
比如,如果要测量学生的学习积极性,课堂中的积极参与,作业完成情况,以及课外阅读时间可以用来反应积极性。而学习成绩可以用期中,期末成绩来反应。在这里,学习积极性与学习成绩是无法直接用一个测度测准,它们必须用一组测度方法来测量,然后把测量结果结合起来,才能更准确地把握。
换句话说,这些变量无法直接测量。可以直接测量的可能只是它所反映的一个表征,或者是它的一部分。在这里,表征与部分是两个不同的概念。表征是由这个隐性变量直接决定的。隐性变量是因,而表征是果,比如学习积极性是课堂参与程度的一个主要决定因素。
扩展资料
因子分析的应用
在市场调研中,研究人员关心的是一些研究指标的集成或者组合,这些概念通常是通过等级评分问题来测量的,如利用李克特量表取得的变量。每一个指标的集合(或一组相关联的指标)就是一个因子,指标概念等级得分就是因子得分。
因子分析在市场调研中有着广泛的应用,主要包括:
1、消费者习惯和态度研究(U&A)
2、品牌形象和特性研究
3、服务质量调查
4、个性测试
5、形象调查
6、市场划分识别
7、顾客、产品和行为分类
—因子分析
一、简单的数据统计分析,excel就足够了。
二、复杂点的数据统计分析,如相关性、线性、非线性、时间序列等,用excel也足够了,只是要用到excel的数据分析模块。该模块可以在excel的宏加载中找到。
三、spss可以做第二点所有的内容,不同的是,spss除此之外,还可以做数据挖掘,如聚类分析、因子分析、神经网络等。但是一般的数据分析人员是不会用到这些复杂的功能的。
故,学excel的数据分析模块已足够。学了spss可以加分。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)