前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Day6-Bran R包

Day6-Bran R包

原创
作者头像
用户10858331
发布2023-12-02 20:35:43
1560
发布2023-12-02 20:35:43
举报

安装和加载R包

镜像设置

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源

options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大

安装

联网

install.packages(" ") <包在CRAN网站

BiocManager::install(" ") <包在Biocductor

可以搜索包在哪

加载

library()

require()


dplyr五个基础函数

mutate(),新增列

mutate(test,?new?=?Sepal.Length?\*?Sepal.Width)

select(),按列筛选

按列号筛选

select(test,1)

select(test,c(1,5))

按列名筛选

select(test,?Petal.Length,?Petal.Width)

vars?<-?c("Petal.Length",?"Petal.Width")

select(test,?one\_of(vars))

filter()筛选行

filter(test,?Species?==?"setosa")

filter(test,?Species?==?"setosa"&Sepal.Length?>?5?)

filter(test,?Species?%in%?c("setosa","versicolor"))

arrange() 按照某一列或某几列对整个表格进行排序

arrange(test,?Sepal.Length) #默认从小到大排序

arrange(test,?desc(Sepal.Length)) #用desc从大到小

summaries() 汇总

summarise(test,?mean(Sepal.Length),?sd(Sepal.Length)) #?计算Sepal.Length的平均值和标准差

代码语言:txt
复制
group\_by(test,?Species)
summarise(group\_by(test,?Species),mean(Sepal.Length),?sd(Sepal.Length)) 

#先按照Species分组,计算每组Sepal.Length的平均值和标准差


dplyr处理关系数据

先给test1和test2赋值

代码语言:txt
复制
test1?<-?data.frame(x?=?c('b','e','f','x'),??z?=?c("A","B","C",'D'))
test2?<-?data.frame(x?=?c('a','b','c','d','e','f'),??y?=?c(1,2,3,4,5,6))

內连inner_join,取交集

inner\_join(test1,?test2,?by?=?"x")

左连left_join

left\_join(test1,?test2,?by?=?'x')

left\_join(test2,?test1,?by?=?'x')

矢量是有顺序的,test1和test2位置不同,结果不同
矢量是有顺序的,test1和test2位置不同,结果不同

全连

full\_join(?test1,?test2,?by?=?'x')

半连接:返回能够与y表匹配的x表所有记录

semi\_join(x?=?test1,?y?=?test2,?by?=?'x')

反连接:返回无法与y表匹配的x表的所记录

anti\_join(x?=?test2,?y?=?test1,?by?=?'x')

简单合并

bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数

先给a,b,c赋值

bind\_rows(a,?b)

bind\_cols(a,?c)


原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 安装和加载R包
    • 镜像设置
      • 安装
        • 加载
        • dplyr五个基础函数
          • mutate(),新增列
            • select(),按列筛选
              • 按列号筛选
              • 按列名筛选
            • filter()筛选行
              • arrange() 按照某一列或某几列对整个表格进行排序
                • summaries() 汇总
                • dplyr处理关系数据
                  • 內连inner_join,取交集
                    • 左连left_join
                      • 全连
                        • 半连接:返回能够与y表匹配的x表所有记录
                          • 反连接:返回无法与y表匹配的x表的所记录
                            • 简单合并
                            领券
                            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
                            http://www.vxiaotou.com