Day6-Bran R包

原创

用户10858331

发布于 2023-12-02 20:35:43

1560

发布于 2023-12-02 20:35:43

文章被收录于专栏：生信学习小组2023生信学习小组2023

安装和加载R包

镜像设置

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源

options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大

安装

联网

install.packages(" ") <包在CRAN网站

BiocManager::install(" ") <包在Biocductor

可以搜索包在哪

加载

library()

require()

dplyr五个基础函数

mutate(),新增列

mutate(test,?new?=?Sepal.Length?\*?Sepal.Width)

select(),按列筛选

按列号筛选

select(test,1)

select(test,c(1,5))

按列名筛选

select(test,?Petal.Length,?Petal.Width)

vars?<-?c("Petal.Length",?"Petal.Width")

select(test,?one\_of(vars))

filter()筛选行

filter(test,?Species?==?"setosa")

filter(test,?Species?==?"setosa"&Sepal.Length?>?5?)

filter(test,?Species?%in%?c("setosa","versicolor"))

arrange() 按照某一列或某几列对整个表格进行排序

arrange(test,?Sepal.Length) #默认从小到大排序

arrange(test,?desc(Sepal.Length)) #用desc从大到小

summaries() 汇总

summarise(test,?mean(Sepal.Length),?sd(Sepal.Length)) #?计算Sepal.Length的平均值和标准差

group\_by(test,?Species)
summarise(group\_by(test,?Species),mean(Sepal.Length),?sd(Sepal.Length))

#先按照Species分组，计算每组Sepal.Length的平均值和标准差

dplyr处理关系数据

先给test1和test2赋值

test1?<-?data.frame(x?=?c('b','e','f','x'),??z?=?c("A","B","C",'D'))
test2?<-?data.frame(x?=?c('a','b','c','d','e','f'),??y?=?c(1,2,3,4,5,6))

內连inner_join,取交集

inner\_join(test1,?test2,?by?=?"x")

左连left_join

left\_join(test1,?test2,?by?=?'x')

left\_join(test2,?test1,?by?=?'x')

全连

full\_join(?test1,?test2,?by?=?'x')

半连接：返回能够与y表匹配的x表所有记录

semi\_join(x?=?test1,?y?=?test2,?by?=?'x')

反连接：返回无法与y表匹配的x表的所记录

anti\_join(x?=?test2,?y?=?test1,?by?=?'x')

简单合并

bind_rows()函数需要两个表格列数相同，而bind_cols()函数则需要两个数据框有相同的行数

先给a,b,c赋值

bind\_rows(a,?b)

bind\_cols(a,?c)

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

学习笔记

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

学习笔记

登录后参与评论

0 条评论

热度

Day6-Bran R包

Day6-Bran R包

安装和加载R包

镜像设置

安装

加载

dplyr五个基础函数

mutate(),新增列

select(),按列筛选

按列号筛选

按列名筛选

filter()筛选行

arrange() 按照某一列或某几列对整个表格进行排序

summaries() 汇总

dplyr处理关系数据

內连inner_join,取交集

左连left_join

全连

半连接：返回能够与y表匹配的x表所有记录

反连接：返回无法与y表匹配的x表的所记录

简单合并

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐