R语言是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。下面为大家介绍一些R语言数据挖掘常用的包和函数的集合:
聚类
基于模型的方法: mclust
基于密度的方法: dbscan
基于验证的方法: cluster.stats
2024年09月12日
R语言是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。下面为大家介绍一些R语言数据挖掘常用的包和函数的集合:
基于模型的方法: mclust
基于密度的方法: dbscan
基于验证的方法: cluster.stats
2024年09月12日
df$A可以索引数据框df中列名为A的列的所有值。那么假如列名是一个R对象怎么做?
df <- data.frame(A=1:5, B=(1:5)*2)
df$A
## [1] 1 2 3 4 5
needed_column = 'A'
# df$needed_column ? Wrong
# 注意是双方括号
df[[needed_column]]
## [1] 1 2 3 4 5
2024年09月12日
R语言中的scan函数除了可以从键盘获取数据外,还可以从文件中读取数据,下面将介绍如何从文本文件以及CSV文件中读取数据的方法。
假设在R的当前工作目录中有一个文件:student.txt,其存储的数据如下图所示,每个数据以空格分隔。
可以使用下面的语句从该文件中读取出数据:
(1)scan("student.txt", what="c") #以字符串的格式读取数据
2024年09月12日
首先请亲们注意一下,今天的标题是个问句,且结尾处带了个问号
为了避免误解,我先讲清楚,起这名字的原因是我溜神跑偏时看了一堆貌似无用的东西,引发了一场不务正业的探索,而不是今天打算正儿八经跟大家解释这个东西的意思
今天的插播一方面是因为后面怎么写压根想不出来,可以说思路乱得跟车祸现场一样一样的了,另一方面是缘于一个简单的操作失误
敲代码的过程中不小心在半当中磕到回车键本来不是什么大不了的事情,但是R软件有那么个比较有意思的地方,那就是当你单单就打出一个函数名,后面啥也没有的敲下回车,你会直接在终端界面上看到一个额外的帮助内容,像这样
2024年09月12日
使用R语言可以轻松实现聚类分析,stats、cluster、fpc和mclust是常用的四个聚类分析软件包。
stats主要包含一些基本的统计函数,如用于统计计算和随机数生成等;
cluster专用于聚类分析,包含很多聚类相关的函数及数据集;
fpc含有若干聚类算法函数,如固定点聚类、线性回归聚类、DBSCAN聚类等;
2024年09月12日
判别算法在R语言中实现主要涉及4个软件包中的相关函数,它们依次为MASS、klaR、class和kknn。其中MASS包含有大量实用而先进的统计计数函数及适用数据集;klaR与class都主要用于分类技术,其中klaR还含有若干用于可视化技术的函数;而kknn中则是基于有权重K最邻近原理的分类、回归及聚类技术的相关函数。
接下来将对上述5中算法的5个核心函数进行详细介绍。
2024年09月12日
R语言提供了计算典型分布的分布函数、分布律或概率密度函数,以及分布函数的反函数的各种函数。
例如、考虑正态分布,设μ是均值,σ^2是方差,对于任意的变量x,其分布函数为:
pnorm(x,μ ,σ )
对应的概率密度函数为:
dnorm(x,μ ,σ )
计算标准正态分布上α/2(α =0.05)分位点,其计算公式为:
qnorm(1-0.025,0,1) = 1.959964
产生100个标准正态分布的随机数:
2024年09月12日
今天的内容很无聊,无聊到我开始前去睡了一会儿,看到一半的时候忍不住又趴了一会儿,估计写完还得躺下
先集中放一下今天撩到的全体成员,虽然在R中还有很多很多其他的检验函数,但是以有限的脑力去应对无限的知识本身是一种作死行为,所以,就放几个一般能用到的好了
var.test F检验
t.test t检验
cor.test Pearson相关系数、Spearman秩相关系数、Kendall相关系数
wilcox.test 秩和检验
2024年09月12日
sqrt : 开平方函数
abs : 绝对值函数
exp : 2.71828…
expm1 : 当x的绝对值比1小很多的时候,它将能更加正确的计算exp(x)-1
log : 对数函数
log10 : 对数(底为10)函数
log2 : 对数(底为2)函数
sin : 正弦函数
cos : 余弦函数
tan : 正切函数
asin : 反正弦函数
2024年09月12日
摘要:首先介绍下在本文出现的几个比较重要的概念: 函数计算(Function Compute): 函数计算是一个事件驱动的服务,通过函数计算,用户无需管理服务器等运行情况,只需编写代码并上传。函数计算准备计算资源,并以弹性伸缩的方式运行用户代码,而用户只需根据实际代码运行所消耗的资源进行付费。
首先介绍下在本文出现的几个比较重要的概念:
函数计算(Function Compute): 函数计算是一个事件驱动的服务,通过函数计算,用户无需管理服务器等运行情况,只需编写代码并上传。函数计算准备计算资源,并以弹性伸缩的方式运行用户代码,而用户只需根据实际代码运行所消耗的资源进行付费。函数计算更多信息参考。