工具入口:
www.chrislifescience.club:3838/R/AnnoE2
1、火山图
根据数据来源有两个种模式:
第一种:从TCGA数据中筛选
1.勾选FromTCGAdata选项,在下拉菜单中选择肿瘤。
2.如果你需要筛选lncRNA:勾选Need Annotation和FilterLnc,这个时候已经可以看到结果了。如果不需要这步不需要操作。
3.勾选Select gene,在表格中找到自己想呈现的lncRNA,点击DownloadPlotPdf下载结果。
第二种:DIY数据
一、输入的表格要求:
1、格式为csv!!!
至少要有三列:分别是
基因名(Gene Symbol),倍数(log2FlodChange),p值(padj),在右上那几个列名中分别填写自己表格中各列的名字。以测试数据为例:分别填写,logFC,p,Symbol。
二、如果geneID是ENSG,内置注释功能,点选Need Annotation输入ENSG列名。
二、如果geneID是ENSG,内置注释功能,点选Need Annotation输入ENSG列名。
图像修饰
1.火山图加上自己配色选项。之前站长精选配色依然可以选择,如果想自己DIY,请选择YouLike,然后在调色板选颜色,火山图会实时更新。
2.升级指示基因功能。可以实现单选多选,并与表格交互。你想选哪个基因,在右边表格点一下。左边图就会更新。
ps出现红色的提示不要担心,记得把Select Gene那个勾上。
3.优化输出。图片可以直出矢量pdf,不用担心图像因为页面大小变形,输出的pdf是正常的,这样在手机上也可以使用。
下面这个是使用视频教程。
2、GSEA使用方法:
1、数据准备:
1)格式csv,在上1的位置输入。
2)如果基因名是ENSGxxxx的不要担心,在2的位置ENSG所在那列的名字。在3的地方勾选。下面的456就不要改动了。
3)如果是芯片数据,或者自己DIY的数据,数据中至少应该包括:倍数列,p值列,基因名列。分别在图中4、5、6填入。以测试数据为例:分别填写,logFC,p,Symbol。注意!这时在3的地方不要勾选。
2、出表出图:
1)图中右上角的表格是GSEA的结果,10的位置可以下载。
2) 下面的图是GSEA的结果图,可以在表格中选择想画图的基因集ID。这里可以多选(最多10个),11的位置下载的是GESA的PDF图像。
3)7的位置准备了三个配色方案可选择
4)在8的位置选择Geneset,c1站长从来没用过,直接去掉。选择c2的时候要等待15秒右下角有进度条。
3、根据AUC与单因素COX结果筛选的生存曲线+ROC图
这里大大的感谢:Daying!
1、数据准备:
1)格式csv。其中包括生存期数据(时间+事件状态)例如这样:
2、运行
2)输入进去以后,你需要等待~~因为第一步是批量并行计算单因素COX+AUC,这个过程站长测试,200基因x150样本,至少要1分钟。一般要等1分钟,结果出来以后右上角那个表格会有变化。
3)右上角的表格可以进行,各列筛选,比如5年生存期AUC>0.7 & 单因素COX p<0.05 & prognosis is bad。
4)选择你要的那个基因,以后下面会自动生成ROC与生存期曲线。
3、输出
5)当然可以调色
6)当然可以下载,了解站长的应该知道怎么下。
同学们看黑板,这里要重点说明一下!!!!!
批量COX+AUC真的很吃机!
站长服务器cpu是10核20线程的单cpu,试过跑2000基因就要3分钟了,推测跑40000个基因要跑1个小时。
求诸位放过站长的服务器和家里的电费。
基因筛选一下在跑,最好是200个基因x200以内个样本。
如果跑的过程中,出现
画面不动的情况,千万别盯着,去刷刷朋友圈,看看站长的教程。
如果没有结果过了五分钟还没有出现,要淡定,去筛筛自己的基因,缩小一下范围。再来一次!
可能有同学要问,站长加一个cpu不就解决问题了!
嗯,这个同学很聪明!
加个cpu大概需要5000RMB,
但是,因为钱都给娃买奶粉了,真的加不起了!
如果真的想更好的体验这个工具,只能靠大家自己了。
站长开了赞赏通道,网站来源的赞赏,都用于升级服务器使用。
升级了也能为大家更好的服务。
在这里谢谢大家了~