在每节,先运行以下这几行程序。
library(ggplot2)
library(ggpubr)
library(ggtext) #用于个性化图表
library(dplyr) #用于数据处理
p_base <- ggplot(data = mtcars, aes(x = wt, y = mpg)) + geom_point()
在ggplot2中,geom_jitter是一个用于创建散点图(scatter plot)的几何对象(geom)。与geom_point不同,geom_jitter通过在绘制点的位置上添加随机噪声(抖动),以避免点重叠,使得在高密度区域也能清晰地看到每个点。这对处理分类变量或数据点重叠的场景特别有用。geom_jitter主要用于以下场景
- 避免点重叠:在分类数据中,不同类别的点可能重叠或堆叠在一起,geom_jitter通过稍微移动点的位置来减少这种重叠。
- 展示数据的分布:在数据集中,每个点代表一个观测值,通过抖动,可以更好地看到数据的分布和密度。
geom_jitter的基本使用方法如下: ggplot(data, aes(x = , y = )) + geom_jitter(width = <水平抖动量>, height = <垂直抖动量>, …)
其中:
- data:包含绘图数据的数据集。
- aes(x, y):映射数据中的变量到图形的x和y轴。
- width:水平抖动的范围,默认值为0.4。
- height:垂直抖动的范围,默认值为0.4。
ggplot(mtcars, aes(x = cyl, y = mpg)) +
geom_point()
在以上图中,重叠过多。许多数据点绘制在相同的位置,导致难以看清数据的分布。让我们用geom_jitter()。
ggplot(mtcars, aes(x = cyl, y = mpg)) +
geom_jitter(width = 0.2)
我们可以给geom_jitter() 增加颜色,大小,形状等。