主要数据预处理扩展函数介绍。
关注二幺幺统计课堂公众号可以加入学术交流,群免费获得各种数据资源。大家好,我们已经学习了数据预处理中的数据清洗,数据规划,除了以上操作的一些函数以外,而还提供了很多其他的一些函数。本小节将扩展介绍一些其他的统计函数,我这里主要列举了五个。
·第一个lm是做线性回归的,它是利用因变量与自变量去建立线性回归模型这样的计算。
2024年09月12日
主要数据预处理扩展函数介绍。
关注二幺幺统计课堂公众号可以加入学术交流,群免费获得各种数据资源。大家好,我们已经学习了数据预处理中的数据清洗,数据规划,除了以上操作的一些函数以外,而还提供了很多其他的一些函数。本小节将扩展介绍一些其他的统计函数,我这里主要列举了五个。
·第一个lm是做线性回归的,它是利用因变量与自变量去建立线性回归模型这样的计算。
2024年09月12日
R是用于统计分析、绘图的语言和操作环境。这里介绍如何使用R语言的ggplot2扩展包生成图形。
我们首先使用R语言的pressure数据集和qlpot()函数来个简单的例子:
> library(ggplot2)
> qplot(temperature,pressure,data = pressure)
再使用qplot()来一个稍微复杂一点的图形
2024年09月12日
饼图显示一个数据系列中各项的大小与各项总和的比例。也就是说我们想直观的看某一样本值在所有样本总值中所占的比例时,可以使用饼图来表示。
在R语言中绘制饼图的函数为pie,其使用格式如下:
pie(x, labels = names(x), edges = 200, radius = 0.8, clockwise = FALSE, init.angle = if(clockwise) 90 else 0, density = NULL, angle = 45, col = NULL, border = NULL, lty = NULL, main = NULL, ...)
2024年09月12日
本函数主要用于计算otu丰度表的a多样性计算
#依赖包
library(vegan)
library(picante)
计算函数
alpha_diversity <- function(x, tree = NULL) {
observed_species <- estimateR(x)[1, ]
Chao1 <- estimateR(x)[2, ]
ACE <- estimateR(x)[4, ]
Shannon <- diversity(x, index = 'shannon',base = 2)
Simpson <- diversity(x, index = 'simpson') #注意,这里是Gini-Simpson 指数
goods_Coverage <- 1 - rowSums(x == 1) / rowSums(x)
#保留四位小数
Shannon <- sprintf("%0.4f", Shannon)
Simpson <- sprintf("%0.4f", Simpson)
goods_Coverage <- sprintf("%0.4f", goods_Coverage)
result <- data.frame(observed_species, ACE,Chao1, Shannon, Simpson, goods_Coverage)
if (!is.null(tree)) {
PD_whole_tree <- pd(x, tree, include.root = FALSE)[1]
names(PD_whole_tree) <- 'PD_whole_tree'
result <- cbind(result, PD_whole_tree)
result <- data.frame(observed_species, ACE,Chao1, Shannon, Simpson,
PD_whole_tree ,goods_Coverage)
}
result
}
2024年09月12日
在每节,先运行以下这几行程序。
library(ggplot2)
library(ggpubr)
library(ggtext) #用于个性化图表
library(dplyr) #用于数据处理
p_base <- ggplot(data = mtcars, aes(x = wt, y = mpg)) + geom_point()
2024年09月12日
基本上,几乎每一个初学者在刚接触C语言时,都会被告知C语言程序的默认入口是 main() 函数,程序总是从入口函数处开始运行。一般来说,main() 函数有两个常用的原型,它们的C语言代码是下面这样的:
int main(); int main(int argc, char *argv[]);
2024年09月12日
在每节,先运行以下这几行程序。
library(ggplot2)
library(ggpubr)
library(ggtext) #用于个性化图表
library(dplyr) #用于数据处理
p_base <- ggplot(data = mtcars, aes(x = wt, y = mpg)) + geom_point()
2024年09月12日
面向对象编程(OOP)是一种程序设计范式,它将数据和操作数据的方法组织成对象,以模拟现实世界中的实体和交互。在面向对象编程中,核心概念包括类和对象。
类是一种模板或蓝图,用于描述对象的属性和行为。它定义了对象的结构和行为特征,其中包括数据(属性)和方法(操作)。类可以看作是对一类对象共同特征和行为的抽象描述。例如,可以定义一个名为“汽车”的类,其中包含颜色、品牌、型号等属性,以及启动、加速、刹车等方法。
2024年09月12日
R语言中ifelse函数可以完成类似的if...else的分支功能,可以认为是紧凑的if...else结构。但在简单的分支情况下,其比if...else结构还要灵活。其基本语法格式如下:
if(con, statement1, statement2)
con是逻辑条件,当逻辑条件的值为TRUE时,则输出statement1的值,否则输出statement2的值。
第一个例子:
x<-3
y<-ifelse(x>0, 2*x+1, 2*x-1)
2024年09月12日
在R语言中,可以使用scan()函数从键盘中获取数据。
输入数据时,可以每次输完一个数据后换行,也可以以空格作为分隔符输入数据。
(1)每行一个数据
scan()
1: 11
2: 12
3: 13
4:
Read 3 items
[1] 11 12 13