R运行环境安装完成后,下一步就是考虑如何导入数据了。R Studio中集成了交互式图形界面数据导入功能。能够直接读取的格式为:CSV、EXCEL、SPSS、SAS和Stata。下面我们就以EXCEL文件为例,介绍一下这个操作过程。
首先我们选择从EXCEL文件导入,打开如下界面:
然后浏览选择要导入的EXCEL文件。需要注意的是,EXCEL文件最好是英文名称或拼音,中文名称有时会出问题。而且最好把文件事先放入根目录下的专用文件夹,尽量避免层层嵌套的文件夹路径。
当我们选中所要导入的文件后,界面就变成了下面的样子。首先我们看到的是数据预览,省去了数据导入后用head命令再次查看的麻烦。RStudio已经同时为我们判断出了数据属性,当然也可以手动更改修正数据属性。我们可以在左下的选项中更改文件名称,选择是否把第一行当作默认字段,以及导入后是否立即查看等。尤其需要注意的是,RStudio在这个导入界面的右下方给出了操作代码。把这些代码拷贝到代码执行窗口执行的话,其实现的功能是一样的。也可以说图形交互界面其实就是为这些代码套上了一层图形界面而已。
点击"import"导入后,数据预览就出现在了RStudio界面的左上部分,同时右上界面列出了数据集及其简要描述。
在左下代码执行窗口输入:summary(employeekpi),回车执行,我们就得到了这个数据集的描述性统计概要,所有数值型字段都给出了最大、最小、均值、四分位以及缺失值等统计数据。
End.
作者:王厚东-客户体验与数据分析
来源:微博
本文均已和作者授权 如转载请与作者联系
- 我的微信公众号
- 微信扫一扫
- 我的微信公众号
- 微信扫一扫
评论