可视化

读完本书的第一部分后,你已经(至少在表面上)了解了从事数据科学所需的最重要的工具。 现在是时候开始深入细节了。 在本书的这一部分,你将更深入地学习数据可视化。

我们的数据科学模型,其中“可视化”部分以蓝色突出显示。
Figure 1: 数据可视化通常是数据探索的第一步。

每一章都将探讨创建数据可视化的一个或几个方面。

这三章将带你进入可视化世界的大门,但还有更多的知识有待学习。 学习更多知识的最佳途径是阅读 ggplot2 专著:ggplot2: Elegant graphics for data analysis。 该书更深入地探讨了底层理论,并提供了更多关于如何组合各个部分来解决实际问题的示例。 另一个很棒的资源是 ggplot2 扩展库 https://exts.ggplot2.tidyverse.org/gallery/。 这个网站列出了许多用新的几何对象 (geom) 和标度 (scale) 来扩展 ggplot2 的包。 如果你想用 ggplot2 做一些看起来很困难的事情,这里是一个很好的起点。