四时宝库

程序员的知识宝库

geom_jitter函数-R语言ggplot2快速入门16

在每节,先运行以下这几行程序。

library(ggplot2) 
library(ggpubr) 
library(ggtext) #用于个性化图表 
library(dplyr) #用于数据处理
p_base <- ggplot(data = mtcars, aes(x = wt, y = mpg)) + geom_point()

在ggplot2中,geom_jitter是一个用于创建散点图(scatter plot)的几何对象(geom)。与geom_point不同,geom_jitter通过在绘制点的位置上添加随机噪声(抖动),以避免点重叠,使得在高密度区域也能清晰地看到每个点。这对处理分类变量或数据点重叠的场景特别有用。geom_jitter主要用于以下场景

  • 避免点重叠:在分类数据中,不同类别的点可能重叠或堆叠在一起,geom_jitter通过稍微移动点的位置来减少这种重叠。
  • 展示数据的分布:在数据集中,每个点代表一个观测值,通过抖动,可以更好地看到数据的分布和密度。

geom_jitter的基本使用方法如下: ggplot(data, aes(x = , y = )) + geom_jitter(width = <水平抖动量>, height = <垂直抖动量>, …)

其中:

  • data:包含绘图数据的数据集。
  • aes(x, y):映射数据中的变量到图形的x和y轴。
  • width:水平抖动的范围,默认值为0.4。
  • height:垂直抖动的范围,默认值为0.4。
ggplot(mtcars, aes(x = cyl, y = mpg)) +
  geom_point()

在以上图中,重叠过多。许多数据点绘制在相同的位置,导致难以看清数据的分布。让我们用geom_jitter()。

ggplot(mtcars, aes(x = cyl, y = mpg)) +
   geom_jitter(width = 0.2)

我们可以给geom_jitter() 增加颜色,大小,形状等。

发表评论:

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言
    友情链接