geom_jitter函数-R语言ggplot2快速入门16-技术教程-四时宝库

在每节，先运行以下这几行程序。

library(ggplot2) 
library(ggpubr) 
library(ggtext) #用于个性化图表 
library(dplyr) #用于数据处理
p_base <- ggplot(data = mtcars, aes(x = wt, y = mpg)) + geom_point()

在ggplot2中，geom_jitter是一个用于创建散点图（scatter plot）的几何对象（geom）。与geom_point不同，geom_jitter通过在绘制点的位置上添加随机噪声（抖动），以避免点重叠，使得在高密度区域也能清晰地看到每个点。这对处理分类变量或数据点重叠的场景特别有用。geom_jitter主要用于以下场景

避免点重叠：在分类数据中，不同类别的点可能重叠或堆叠在一起，geom_jitter通过稍微移动点的位置来减少这种重叠。
展示数据的分布：在数据集中，每个点代表一个观测值，通过抖动，可以更好地看到数据的分布和密度。

geom_jitter的基本使用方法如下： ggplot(data, aes(x = , y = )) + geom_jitter(width = <水平抖动量>, height = <垂直抖动量>, …)

其中：

data：包含绘图数据的数据集。
aes(x, y)：映射数据中的变量到图形的x和y轴。
width：水平抖动的范围，默认值为0.4。
height：垂直抖动的范围，默认值为0.4。

ggplot(mtcars, aes(x = cyl, y = mpg)) +
  geom_point()

在以上图中，重叠过多。许多数据点绘制在相同的位置，导致难以看清数据的分布。让我们用geom_jitter()。

ggplot(mtcars, aes(x = cyl, y = mpg)) +
   geom_jitter(width = 0.2)

我们可以给geom_jitter() 增加颜色，大小，形状等。

四时宝库

程序员的知识宝库

geom_jitter函数-R语言ggplot2快速入门16