四时宝库

程序员的知识宝库

用R语言做数据分析——回归分析常用符号和函数

R语言表达式常用的符号

  • '~':分割符号,左边是响应变量,右边是解释变量.例如,要通过x、z和w预测y,代码为y~x+z+w;

  • '+':分割预测变量;

  • ':':表示预测变量的交互项,例如、要通过x、z及x与z的交互项预测y,代码为y~x+z+x:z;

  • '*':表示所有可能交互项的简洁方式。代码为y~x*z*w可展开为y~x+z+w+x:z+x:w+z:w+x:z:w;

  • '^':表示交互项达到某个次数。代码y~(x+z+w)^2可展开为y~x+z+w+x:z+x:w+z:w;

  • '.':表示包含因变量外的所有变量。例如、若一个数据包包含变量x、y、z和w,代码y~.可展开为y~x+z+w;

  • '-':减号,表示从等式中溢出某个变量。例如、y~(x+z+w)^2-x:w可展开为y~x+z+w+x:z+z:w;

  • '-1':表示删除截距项。例如、表达式y~x-1拟合y在x上的回归,并强制直线通过原点;

  • 'I()':从算术的角度来解释括号的元素,例如、y~x+(z+w)^2展开为y~x+z+w+z:w。相反,代码y~x+I((z+w)^2)将展开为y~x+h,h是z和w的平方和创建的新变量;

  • 其他:可以在表达式中使用数学函数,例如、log(y)~x+z+w表示通过x、z和w来预测log(y)

拟合线性模型常用的函数

  • summary():展示拟合模型的详细结果;

  • coefficients():列出拟合模型的模型参数(截距项和斜率);

  • confint():提供模型参数的置信区间(默认95%);

  • fitted():列出拟合模型的预测值;

  • residuals():列出拟合模型的残差值;

  • anova():生成一个拟合模型的方差分析表,或者比较两个及以上拟合模型的方差分析表;

  • vcov():列出模型参数的协方差矩阵;

  • AIC():输出赤池信息统计量;

  • plot():生成评价拟合模型的诊断图;

  • predict():用拟合模型对新的数据集预测响应变量值。

发表评论:

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言
    友情链接