作者:丁点helper?
来源:丁点帮你?
通过之前的文章,大家已经了解到,用R语言集成开发环境 RStudio进行数据整理和统计分析,其实是一个读取、处理、保存对象的过程。如果你忘记了这里的『对象』指的是什么,可以去复习前天的文章。今天我们要学习的就是RStudio是如何读取、处理和保存对象的。
R中的函数
说到函数,大家最先想到的可能是:Y=X+3 这样的一元一次函数,这个函数会帮我们生成 X+3 的结果,其功能是求和。
2024年09月12日
作者:丁点helper?
来源:丁点帮你?
通过之前的文章,大家已经了解到,用R语言集成开发环境 RStudio进行数据整理和统计分析,其实是一个读取、处理、保存对象的过程。如果你忘记了这里的『对象』指的是什么,可以去复习前天的文章。今天我们要学习的就是RStudio是如何读取、处理和保存对象的。
R中的函数
说到函数,大家最先想到的可能是:Y=X+3 这样的一元一次函数,这个函数会帮我们生成 X+3 的结果,其功能是求和。
2024年09月12日
今天看了case_when的用法,基本上和ifelse差不多,但是idelse只有2个判断结果:TRUE or FALSE,这个在实际数据分析中肯定是不够用的,所以今天给大家写写case_when.
先来看一个实际的使用例子,感受一下:
x <- c(-2, -1, 0, 1, 2)
case_when(x < 0 ~ "Negative",
x > 0 ~ "Positive",
TRUE ~ "Zero")
#> [1] "Negative" "Negative" "Zero" "Positive" "Positive"
2024年09月12日
R语言中大量的包提供了丰富的函数可以帮助我们解决数据处理中的各种问题。但是有时,我们还需要根据自己的需求来编写自己的函数。
在R语言中,定义一个函数语法格式为:
functionname <- function( arglist )
2024年09月12日
R语言提供了强大的绘图功能,帮助用户进行相关的数据分析。plot函数是一种常用的绘图函数,用其可以绘制散点图、曲线图等。
R语言中plot()函数的基本格式如下:
plot(x,y,...)
2024年09月12日
数据模拟可以帮助我们更好的理解真实世界,今天给大家写写如何在R中做数据模拟。
很多的分布都可以用R进行模拟,首先来看看最简单的正态分布的模拟,代码如下
x <- rnorm(n = 10000, mean = 10, sd = 1.5)
hist(x)
mean(x)
sd(x)
2024年09月12日
用法:apply(X, MARGIN, FUN, ...)
X:矩阵或数组;
MARGIN:1表示行,2表示列,也可以是c(1,2);
FUN:应用的函数;
···:所应用的函数的参数;
2024年09月12日
从总体中抽取样本的方法有很多种,比较常用的就是简单随机抽样。从容量为N的总体中随机抽取出容量为n的样本,每个样本被抽取到的可能性相等,则抽到的样本是一个容量为n的简单样本。如果每次抽取的样本不放回到总体中,一直抽取到n为止,则这种抽样称为无放回抽样。如果每次抽取到一个样本,做记录后,再将样本放回到总体,重复这个过程,直至抽满n个样本为止,则称这种抽样为有放回的抽样。
在R语言中可以使用sample()函数模拟抽样,其语法格式如下:
2024年09月12日
为了尽量追求简洁,尽量不把时间浪费在部署环境这些琐事上,aardio 将会自动检测 R 语言环境,如果没找到,就会全自动安装部署好 R 环境。
用法特简单:
2024年09月12日
arules和arulesViz是R语言中两个专用于关联分析的软件包。其中arules用于关联规则的数字化生成,提供Apriori和Eclat这两种快速挖掘频繁项集和关联规则算法的实现函数;而arulesViz包作为arules的扩展包,提供了集中实用而新颖的关联规则可视化技术,使得关联分析从算法运行到结果呈现一体化。在此之前,请先安装这两个软件包。
Apriori是最经典的关联分析挖掘算法,原理清晰且实现方便,可以说是学习关联分析的入门算法,但效率低;而Eclat算法则在运行效率方面有所提升。
2024年09月12日
原创 小浣熊 科研猫
是时候关注我们一波了
经过前面几次推文的学习,相信大家对R语言已经有了一个大概的了解,同时也初步感受了R语言在数据处理领域的强大功能,不过实话实说,前面的内容还只是R语言应用的冰山一角而已。从这次推文开始,我们就要正式开始接触R语言对数据处理的强大能力。
在正文内容开始之前,我先给大家推荐一个文档https://google.github.io/styleguide/Rguide.xml