前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >20231220-简单文件格式读取

20231220-简单文件格式读取

原创
作者头像
lishuya
修改2023-12-21 14:22:37
1180
修改2023-12-21 14:22:37
举报

简单复习上一节内容

1认识csv格式

  1. csv格式是以分割符(逗号,空格,制表符\t)分开内容的纯文本文件,EXCLE打开csv文件是识别分隔符,把内容装进格子里,R语言打开csv文件,是把纯文本文件装进一个数据框,在R语言中,对数据框进行操作,相应的改动不会被同步到csv文件中
  2. 如果想要对原本的文件进行修改,把修改后的内容重新写为csv文件 write.csv(x,file="x.csv")
  3. 一个文件的本质是由生成它的函数决定,并不是由后缀决定,后缀只是起到提示作用 本节课的函数总结:
  4. read.csv("x.csv")读取csv文件 read.table("x.txt")读取txt文件 write.csv(x,file="x.csv") 导出csv文件 write.table(x,file="x.txt")导出txt文件

2R语言特有的文件格式 R.data

保存的是变量,不是表格文件,支持保存多个文件

save(x,file="x.R.data") 保存Rdata

load("x.Rdata")加载 R.data

3默认参数不适用读取文件所导致的隐形错误

(1)读取txt文件,没有正确识别列名

修改办法 read.table("x.txt",**header=T**)增加默认参数

(2)读取csv文件时,没有正确识别行名,并且更改列名中的不规范符号(例如将其他符号更改为句号)

修改办法 read.csv("x.csv",rownames=1,check.names=F)

(3)数据框不允许重复的行名 如果读取失败需要先去重复,在来设置行名

(4)有时数据中有一些缺失值,文件读取失败

解决办法:read.table("x.txt",header=T,fill=T) 把缺失值用NA来代替,但R语言读取TXT文件时,会把所有的空格识别为一个分隔符,直接把后一列数据识别为前一行数据,然后把后一列数据用NA来补充。这样会导致数据紊乱,所以外面需要多检查自己数据。这个错误可以用一些函数来避免掉

  • read.delim("x.txt") data.table::fread("x.txt",data.table=F)

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 简单复习上一节内容
  • 1认识csv格式
  • 2R语言特有的文件格式 R.data
  • 3默认参数不适用读取文件所导致的隐形错误
    • (1)读取txt文件,没有正确识别列名
      • (2)读取csv文件时,没有正确识别行名,并且更改列名中的不规范符号(例如将其他符号更改为句号)
        • (3)数据框不允许重复的行名 如果读取失败需要先去重复,在来设置行名
          • (4)有时数据中有一些缺失值,文件读取失败
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
          http://www.vxiaotou.com