mydata #说明:复制ex_quote = f">
搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
很楠不爱3
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
TDengine 的查询性能与老牌时序数据库相比如何?来看看_tdengine in查询
2
【求助】DevEcoStudio无法运行虚拟机问题_deveco_studio 模拟器打不开
3
利用桥接联网实现虚拟机下window7和linux kali互ping_kali和win7怎么ping通
4
【图像处理】 常用边缘检测算法对比分析_边缘增强模版对比
5
python中open函数打开文件_Python open函数详解:打开指定文件
6
Vue2的响应式原理_vue2响应式原理
7
angular 事件派发和监听_angular事件监听
8
什么是小程序半定制开发?
9
Anaconda+pycharm(在pytorch环境下)安装PyQt5及环境配置_pyuic5安装
10
滑动窗口限流 java_Java限流的算法有哪些?
当前位置:
article
> 正文
R读取数据_quote = f
作者:很楠不爱3 | 2024-03-06 23:37:31
赞
踩
quote = f
一、文本格式
1、csv文本格式(即逗号分隔文件):
> data<-read.csv("D:\\work\\data\\1.csv",header = F)
#说明:header = T(TURE)是默认状态,有标题栏,可修改为F(FALSE)。
2、txt文本格式:
> data<-read.table("D:\\work\\data\\1.txt",quote=F,header = T)
#说明:quote=F表示引号不读取。
3、读取剪贴板中数据:
> data <- read.table("clipboard", header = T, sep = '\t')
#说明:sep="\t" 表示以tab(制表符)为分隔符。
> mydata <- read.delim("clipboard")
#说明:复制excel表格时使用。
#说明:encoding='utf-8'可能可以解决读取中文乱码的问题。
二、excel文件:
1、程序包RODBC
> library(RODBC)
> z <- odbcConnectExcel("c:/data/body.xls")
> foo <- sqlFetch(z, "Sheet1")
> close(z)
#说明:64位系统不能正确使用,可能是由于excel所用access不是64位的和缺少相应的java环境,连接不上。
2、程序包XLconnect
>install.packages('XLConnect')
>library(XLConnect)
>xls <- loadWorkbook('d:/数据分析/R/4.xlsx')
>readWorksheet(xls, '统计表')
#说明:建立连接时,必须输入文件的绝对路径
3、程序包xlsx
>library(xlsx)
>read.xls("body.xlsx",sheetName="nba",header=T)
#说明:注意文件路径、编码等问题。
4、程序包readxl
>install.packages("readxl")
>read_excel("my-spreadsheet.xls", sheet="data")
#说明:sheet="data"或者sheet=2(位置)。
5、程序到openxlsx
>install.packages("openxlsx", dependencies=TRUE)
>readWorkbook(xlsxFile, sheet = 1, startRow = 1, colNames = TRUE,
rowNames = FALSE, detectDates = FALSE, skipEmptyRows = TRUE,
skipEmptyCols = TRUE, rows = NULL, cols = NULL, check.names = FALSE,
namedRegion = NULL, na.strings = "NA", fillMergedCells = FALSE)
#说明:对大的数据量效果好。
三、不规则文本格式读取:
1、编码:非-ASCII字符字段,要确保以正确的编码方式读取。encoding="latin1/utf-8"。
2、首行:header = TRUE/T。
3、分隔符: sep = "\t"(\t为制表符分割),也可以是其他任何符号,等。
4、缺失值:NA表示缺失,na.strings表示字符串,NaN,Inf和-Inf表示数值列。
5、忽略尾部空字段: fill = TRUE。
6、忽略中间空字段:blank.lines.skip = FALSE,fill = TRUE。
7、变量类型:as.is 会抑制字符向量转换成因子(仅此功能);colClasses运行为输入中的每个列(非每个变量),对标签列同样适用。
8、注释:注释符#后该行会被忽略,当作空白行。要读取可用comment.char = ""(读取速度也会加快)。
9、"\"终止字符。
10、读大的数据格子(data grid)时,效率最重要。设定 comment.char = "",以原子向量类型(逻辑型,整型,数值型,复数型,字符型或原味型)设置每列的colClasses ,给定需要读入的行数 nrows (适当地高估一点比不设置这个参数好)等措施会提高效率。
11、参数列表:file,header,sep,quote,dec,row.names,col.names,as.is,na.strings,colClasses,nrows,skip,check.names
fill,strip.white,blank.lines.skip,comment.char。
四、读取spss(sav)/sas(xport/ssd)数据:
1、程序包foreign
>install.packages("foreign")
>library(foreign)
>tempdata=read.spss("dataname.sav")
#说明:文件名不能超过8个字符,变量名长于8字符会被截断。
2、程序包Hmisc
>install.packages("Hmisc")
>library(Hmisc)
>tempdata=spss.get("dataname.sav")
3、程序包memisc
>install.packages("memisc")
>library(memisc)
>tempdata0<-as.data.set(spss.system.file("D:/dataname.sav"))
>tempdata<-as.data.frame(tempdata0)
#说明:程序包foreign与Hmisc对SPSS格式兼容不太好,尤其是变量名有中文或不规则字符串时。
4、新程序包sas7bdat.parso
五、学习资料及程序包地址:
1、R官方地址:http://www.r-project.org/
2、R开发者论坛:http://r.789695.n4.nabble.com/
3、CRAN:http://cran.rstudio.com/
4、RForge:https://r-forge.r-project.org/
六、R的演进及功能块:
1、RevolutionAnalytics公司的RHadoop产品,让R可以直接调用Hadoop集群资源
2、RStudio公司的RStudio产品,给了我们对于编辑软件新的认识
3、RMySQL, ROracle, RJDBC 打通了R和数据库访问通道
4、rmongodb, rredis, RHive, rhbase, RCassandra 打通过R和NoSQL的访问通道
5、Rmpi, snow 打通了单机多核并行计算的通道
6、Rserve,rwebsocket 打通了R语言的跨平台通信的通道
7、R不仅是学术界的语言,更将成为工业界必备的语言。
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/很楠不爱3/article/detail/202215
推荐阅读
article
接口
性能
优化
技巧_
接口
遍历
数据
太
多
导致反应
慢
...
性能
优化
_
接口
遍历
数据
太
多
导致反应
慢
接口
遍历
数据
太
多
导致反应
慢
...
赞
踩
article
递归
解决
最长
公共
子
序列
问题(
LCS
)_
递归
算法
最长
连续
公共
子
序列
...
问题:给定两个字符串,求解这两个字符串的
最长
公共
子
序列
(Longest Common Sequence)。比如字符串1:...
赞
踩
article
【
算法
】
LCS
算法
以及其
JAVA
的实现_实现非递归
算法
求
lcs
java
...
LCS
问题是动态规划的经典问题,同时也算作入门问题吧。其目的是要求出两个串的最长公共子串。例如如下两个串:串1:ABCB...
赞
踩
article
最长
公共
子
序列
-
递归
.动态规划_
递归
算法
输出
最长
公共
子
序列
...
最长
公共
子
序列
-
递归
给出两个字符串,求出这样的一个
最长
的
公共
子
序列
的长度,而且每个字符的先后顺序和原串中的先后顺序一致,...
赞
踩
article
Docker
技术
入门
与
实战
(
第
2版)....
容器
技术
系列
Docker
技术
入门
与
实战
第
2版杨保华 戴王剑 曹亚仑 编著图书在版编目(CIP)数据
Docker
技术
入门
与
...
赞
踩
article
更简洁更高效,
Doris
对比
ClickHouse
、
MySQL
、
Presto
、
HBase
_doris ...
介绍构建统一的OLAP(在线分析处理平台)。_doris 支持
hbase
查询吗doris 支持
hbase
查询吗 ...
赞
踩
article
3GPP
使用方法与
协议
下载
_
4gpp
...
关于
3GPP
3GPP
,3rd Generation Partnership Project,即第三代合作伙伴计划。htt...
赞
踩
article
dockerfile
使
用
详解_
dockerfile
怎么
用
...
用
于延迟构建命令的执行。简单的说,就是 Dockerfile 里
用
ONBUILD 指定的命令,在本次构建镜像的过程中不...
赞
踩
article
【
云
原生
与
5G
】微
服务
加持
5G
核心网
_
中国移动
5g
核心网
云
原生
...
微
服务
架构是一种架构,更是一种理念,任何先进的理念都将被不同行业和领域融合升级,相互推动,如同4G带来了移动互联网时代,...
赞
踩
article
完美解决Python中出现的
ValueError
:
not
enough
values
to
unp...
问题描述:[name,dialogue] = i.split(’:’,1)
ValueError
:
not
enough
...
赞
踩
article
学习笔记
21.07
.05:利用
pyechart
和
openpyxl
绘制
柱状图
_
openpyxl
柱状图
颜...
# 使用import导入
openpyxl
模块import
openpyxl
# 使用from...import从pyech...
赞
踩
article
如何在
Java
中
加密
和解密
zip
文件
?_
java
zip
压缩
加密
...
首先,我们将使用ZipFile addFile()方法将一个名为aFile.txt的
文件
压缩
到一个名为compres...
赞
踩
article
空间
坐标
(
系
)如何
进行
变换
?_
空间
坐标
转换...
要描述某一物体在现实场景的位置,通常以三维
空间
坐标
系
下的
坐标
进行
说明,当物体位置或自身
进行
变化时,可以用放射
变换
说明物体...
赞
踩
article
通过多
进程
并发方式(
fork
)实现
服务器
(注意要
回收
子
进程
)...
2、
子
进程
完成数据交互后,close(cfd);此时成为僵尸
进程
,所以需要在父
进程
中收尸,
回收
进程
描述符等资源。但此时父...
赞
踩
article
Hello
Git
_
晴耕
物语博客...
14个短视频:身临其境讲述
Git
基本概念与常见用法2个Docker镜像:提供超便捷客户端服务端(含图形界面)实验环境1篇...
赞
踩
article
Python
利用
BeautifulSoup
和
正则
表达式
来爬取旅游网数据_
python
正则
爬取...
import reimport requestsimport timefrom bs4 import Beautiful...
赞
踩
article
ios
数据
存储
的
5
种方式_实时
数据
dr
ios
多级
存储
...
ios
数据
存储
的
5
种方式NSUserDefaults(Preference偏好设置) plist
存储
归档 SQLite...
赞
踩
article
tomcat
启动
后
无法访问
到
8080
页面的原因...
tomcat
启动
后
无法访问
8080
页面的原因分析_
tomcat
启动
后
无法访问
到
8080
页面
tomcat
启动
后
无法访问
到...
赞
踩
article
java
--错误总结_illegal
modifier
for the method
main
; o...
遇到一个记下来一个1 Illegal
modifier
for parameter elementData;
only
...
赞
踩
article
Base64
加密
解密...
Base64
加密
解密。_base64base64 一.简介
Base64
是网络上最常见的用于传输...
赞
踩
相关标签
性能优化
mysql
算法
数据结构
java
动态规划
递归法
运维
操作系统
devops
clickhouse
hbase
5g
网络通信
协议栈
1024程序员节
docker
linux
android
前端
后端
python
split函数
列表