1. apply 对数组或者矩阵行或者列使用函数
用法:apply(X, MARGIN, FUN, ...)
X:矩阵或数组;
MARGIN:1表示行,2表示列,也可以是c(1,2);
FUN:应用的函数;
···:所应用的函数的参数;
2024年09月12日
用法:apply(X, MARGIN, FUN, ...)
X:矩阵或数组;
MARGIN:1表示行,2表示列,也可以是c(1,2);
FUN:应用的函数;
···:所应用的函数的参数;
2024年09月12日
从总体中抽取样本的方法有很多种,比较常用的就是简单随机抽样。从容量为N的总体中随机抽取出容量为n的样本,每个样本被抽取到的可能性相等,则抽到的样本是一个容量为n的简单样本。如果每次抽取的样本不放回到总体中,一直抽取到n为止,则这种抽样称为无放回抽样。如果每次抽取到一个样本,做记录后,再将样本放回到总体,重复这个过程,直至抽满n个样本为止,则称这种抽样为有放回的抽样。
在R语言中可以使用sample()函数模拟抽样,其语法格式如下:
2024年09月12日
为了尽量追求简洁,尽量不把时间浪费在部署环境这些琐事上,aardio 将会自动检测 R 语言环境,如果没找到,就会全自动安装部署好 R 环境。
用法特简单:
2024年09月12日
arules和arulesViz是R语言中两个专用于关联分析的软件包。其中arules用于关联规则的数字化生成,提供Apriori和Eclat这两种快速挖掘频繁项集和关联规则算法的实现函数;而arulesViz包作为arules的扩展包,提供了集中实用而新颖的关联规则可视化技术,使得关联分析从算法运行到结果呈现一体化。在此之前,请先安装这两个软件包。
Apriori是最经典的关联分析挖掘算法,原理清晰且实现方便,可以说是学习关联分析的入门算法,但效率低;而Eclat算法则在运行效率方面有所提升。
2024年09月12日
原创 小浣熊 科研猫
是时候关注我们一波了
经过前面几次推文的学习,相信大家对R语言已经有了一个大概的了解,同时也初步感受了R语言在数据处理领域的强大功能,不过实话实说,前面的内容还只是R语言应用的冰山一角而已。从这次推文开始,我们就要正式开始接触R语言对数据处理的强大能力。
在正文内容开始之前,我先给大家推荐一个文档https://google.github.io/styleguide/Rguide.xml
2024年09月12日
R语言是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。下面为大家介绍一些R语言数据挖掘常用的包和函数的集合:
基于模型的方法: mclust
基于密度的方法: dbscan
基于验证的方法: cluster.stats
2024年09月12日
df$A可以索引数据框df中列名为A的列的所有值。那么假如列名是一个R对象怎么做?
df <- data.frame(A=1:5, B=(1:5)*2)
df$A
## [1] 1 2 3 4 5
needed_column = 'A'
# df$needed_column ? Wrong
# 注意是双方括号
df[[needed_column]]
## [1] 1 2 3 4 5
2024年09月12日
R语言中的scan函数除了可以从键盘获取数据外,还可以从文件中读取数据,下面将介绍如何从文本文件以及CSV文件中读取数据的方法。
假设在R的当前工作目录中有一个文件:student.txt,其存储的数据如下图所示,每个数据以空格分隔。
可以使用下面的语句从该文件中读取出数据:
(1)scan("student.txt", what="c") #以字符串的格式读取数据
2024年09月12日
首先请亲们注意一下,今天的标题是个问句,且结尾处带了个问号
为了避免误解,我先讲清楚,起这名字的原因是我溜神跑偏时看了一堆貌似无用的东西,引发了一场不务正业的探索,而不是今天打算正儿八经跟大家解释这个东西的意思
今天的插播一方面是因为后面怎么写压根想不出来,可以说思路乱得跟车祸现场一样一样的了,另一方面是缘于一个简单的操作失误
敲代码的过程中不小心在半当中磕到回车键本来不是什么大不了的事情,但是R软件有那么个比较有意思的地方,那就是当你单单就打出一个函数名,后面啥也没有的敲下回车,你会直接在终端界面上看到一个额外的帮助内容,像这样
2024年09月12日
使用R语言可以轻松实现聚类分析,stats、cluster、fpc和mclust是常用的四个聚类分析软件包。
stats主要包含一些基本的统计函数,如用于统计计算和随机数生成等;
cluster专用于聚类分析,包含很多聚类相关的函数及数据集;
fpc含有若干聚类算法函数,如固定点聚类、线性回归聚类、DBSCAN聚类等;