今天写的时间序列还是比较基础的,和传统的2个变量没什么太大的区别,之后会给大家写点进阶的,欢迎关注。
今天用到的数据为gapminder数据集,这个数据集是dslabs包自带的数据集,数据集的主要内容就是全球的经济和健康状况,具体变量大家自行查看,这篇文章我们主要看作图。
实例操练
加载包和导入数据:
library(tidyverse)
library(dslabs)
data(gapminder)
gapminder %>% as_tibble()
比如我们想画出美国婴儿出生率的点图:
gapminder %>%
filter(country == "United States") %>%
ggplot(aes(year, fertility)) +
geom_point()
通过上面的点图很容易看出来美国不同时期fertility的变化趋势,当图中的点的间距相当的时候我们可以将点图直接转化为线图:
gapminder %>%
filter(country == "United States") %>%
ggplot(aes(year, fertility)) +
geom_line()
一次画两个国家
很多时候,我们会想要对不同国家的数据进行对比,此时我们会画2个线图在同一个图中:
countries <- c("South Korea","Germany")
gapminder %>% filter(country %in% countries) %>%
ggplot(aes(year,fertility)) +
geom_line()
运行上面的代码并不能得到我们想要的结果:
我们看它会默认把所有的点连起来,很尴尬,此时我们需要指定分组group。
countries <- c("South Korea","Germany")
gapminder %>% filter(country %in% countries & !is.na(fertility)) %>%
ggplot(aes(year, fertility, group = country)) +
geom_line()
这下就好了,不过这个图给你,还是不知道哪个线对应哪个国家,所以我们需要图例:
countries <- c("South Korea","Germany")
gapminder %>% filter(country %in% countries & !is.na(fertility)) %>%
ggplot(aes(year,fertility, col = country)) +
geom_line()
可以看到有了col这个参数后就自动进行了分组操作,推荐大家直接用col参数就行,不用考虑group参数。
给图加标签
有些时候标签比图例好使,怎么在一个图的特定位置加标签呢?看下面代码:
labels <- data.frame(country = countries, x = c(1975,1965), y = c(60,72))
gapminder %>%
filter(country %in% countries) %>%
ggplot(aes(year, life_expectancy, col = country)) +
geom_line() +
geom_text(data = labels, aes(x, y, label = country), size = 5) +
theme(legend.position = "none")
解释以下上面的代码:上面的代码中我们首先定义了一个包含label坐标的数据框:label;然后我们在原图中加了一个geometry:geom_text,在geom_text中使用的数据就是我们定义的数据框,最后我们使用了没有图例的主题。
小结
今天给大家介绍了时间序列的画图,其实没介绍啥特别的,主要有用的还是图中标签的添加方法,关于详细的ggplot2作图,请看我之前的文章,感谢大家耐心看完。发表这些东西的主要目的就是督促自己,希望大家关注评论指出不足,一起进步。内容我都会写的很细,用到的数据集也会在原文中给出链接,你只要按照文章中的代码自己也可以做出一样的结果,一个目的就是零基础也能懂,因为自己就是什么基础没有从零学Python和R的,加油。
(站外链接发不了,请关注后私信回复“数据链接”获取本头条号所有使用数据)
往期内容: