2023年12月2日发(作者:)
R语言读取csv文件csv文件Comma-Separated Values,逗号分隔符值,其文件以文本格式存储表格数据。语言用读取csv文件,读取返回一个的内存对象。(file, header = TRUE, sep = ",", quote = """, dec = ".", fill = TRUE, = "", ...)file,读取文件的名字。header,布尔值,表示文件第一行是否含有列名。sep,列分隔符,默认是逗号。一般用的分隔符有:,(逗号):(冒号);(分号)(tab)空格特殊单个字符,比如 |, #quote,指文本文件中的引用字符,一般字符串的值都会被quote字符串包含起来。比如说name的字段,值可以写成:"Rose"'Rose'Rose这个就是不同quote的使用。一般就是双引号,单引号和不使用引号这三种。dec是指文件中用于小数点的字符,一般有点和逗号两种。比如说中国用的就是点,3.1415926.法国用的就是逗号3,同只有个别默认值不一样,比如分隔符。其他的参数都是一样的。所以除了上面的参数外,还有下面这些里面的参数。(file, header = FALSE, sep = "", quote = ""'", dec = ".", numerals = c("", "", ""), , , = !stringsAsFactors, s = "NA", colClasses = NA, nrows = -1, skip = 0, = TRUE, fill = !, = FALSE, = TRUE, = "#", allowEscapes = FALSE, flush = FALSE, stringsAsFactors = sAsFactors(), fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)例子1 简单读取接下来我们看一下简单的例子。这个是demo的数据文件Name,Age,Grade"Rose", 23, 5"Bob", 21, 5"Henry", 20, 4"Lily", 22, 4.5读取的R script和结果。我们可以看到Name是字符值,Age是int值,Grade是numeric值。> gradeData <- ("")> gradeData Name Age Grade1 Rose 23 5.02 Bob 21 5.03 Henry 20 4.04 Lily 22 4.5> str(gradeData)'': 4 obs. of 3 variables: $ Name : Factor w/ 4 levels "Bob","Henry",..: 4 1 2 3 $ Age : int 23 21 20 22 $ Grade: num 5 5 4 4.5>
例子2 读取NA值我们修改一下文件,让文件有空值。Name,Age,Grade"Rose", 23, 5"Bob", , 5"Henry", 20, 4"Lily", 22, 4.5读取结果可以看到一个缺失值。> gradeData <- ("")> gradeData Name Age Grade1 Rose 23 5.02 Bob NA 5.03 Henry 20 4.04 Lily 22 4.5>
例子3 指定分隔符文件内容修改为Name;Age;Grade"Rose";23;5"Bob";;5读取结果。用默认的逗号分隔符读取,只有一列。设置正确的分隔符后,就读出了正确的列数。> gradeData <- ("")> gradeData 1 Rose;23;52 Bob;;5> gradeData <- ("",sep=";")> gradeData Name Age Grade1 Rose 23 52 Bob NA 5>


发布评论