导入

在本书的这一部分,你将学习如何将更广泛的数据导入 R,以及如何将其转化为对分析有用的形式。有时,这只是调用相应数据导入包中的一个函数那么简单。但在更复杂的情况下,为了得到你更喜欢使用的整洁矩形数据,可能需要进行整理和转换。

我们的数据科学模型,其中“导入”部分以蓝色突出显示。
Figure 1: 数据导入是数据科学过程的开始;没有数据你就无法进行数据科学!

在本书的这一部分,你将学习如何访问以下列方式存储的数据:

我们在这里没有讨论两个重要的 tidyverse 包:haven 和 xml2。如果你正在处理来自 SPSS、Stata 和 SAS 文件的数据,请查看 haven 包,https://haven.tidyverse.org。如果你正在处理 XML 数据,请查看 xml2 包,https://xml2.r-lib.org。否则,你需要做一些研究来确定你需要使用哪个包;谷歌是你的好朋友 😃。