Excel数据分析篇:线性回归
展开全文
一、什么是回归分析(Regression)
1、定义
确定两种或两种以上变量间相关关系的一种统计分析方法。通过数据间相关性分析的研究,进一步建立自变量(i=1,2,3,…)与因变量Y之间的回归函数关系,即回归分析模型,从而预测数据的发展趋势。
2、分类
按照涉及的变量的多少,分为一元回归和多元回归分析;
按照因变量的多少,可分为简单回归分析和多重回归分析;
按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
二、线性回归
1、简单线性回归
简单线性回归又叫一元线性回归,即回归模型中只有一个自变量和一个因变量,其回
归方程可以表示为:
Y=a+bx+
其中,Y表示因变量,x表示自变量,a是 常数,b是斜率,是随机误差。
2、最小二乘法:
如何确定参数a和b,则要用最小二乘法来实现。通过最小化误差的平方和寻找数据的最佳函数匹配,即使得观测点和估计点的距离的平方和最小。
3、线性回归分析的步骤:
确定自变量和因变量
绘制散点图,确定回归模型类型
估计模型参数,建立回归模型:最小二乘法进行模型参数估计
对回归模型进行检验
利用回归模型进行预测
4、多重线性回归
定义:一个因变量与多个自变量的线性回归问题,是一元线性回归的推广。其回归方
程可以写为:
多重线性回归方程中回归系数的估计也是用到最小二乘法
三、用Excel做回归分析
我们再来展示一下数据集中的真实数据——前11条数据。
EXCEL设置
在默认的EXCEL程序中,是没有“数据分析”这一选项的。因此,需要进入“选项”启用“数据分析”功能。
在初始界面点击“文件”面板,选择“选项”。
在弹出的界面下,选择“加载项”,然后右面会出现“分析工具库”,点击之,再点击“转到”。
在后面跳出的对话框中,把“分析工具库”勾中,点击确定。在“数据”面板中就会出现“数据分析”按钮。
线性回归步骤
为了使用“数据分析”工具箱,需要跳转至“数据”面板。
点击“数据分析”按钮,就会跳出下图所示的“数据分析工具箱”。里面有很多统计分析方法。本文中,只使用“回归”功能。
选择“回归”,并且点击“确定”。
随后根据需求,设定回归的参数。“Y值输入区域”就是MEDV列;“X值输入区域”就是前面的13列。注意,如果把第一行的标志行也选中的话,需要将“标志框”勾上,否则会报错。
上图就是回归的结果。左侧是回归的数据,右侧堆叠起来放置的是各种图像。在上一个对话框中可以选择是不是进行绘制。
结果解读
第一个表格计算了相关系数、R2 、修正R值、标准误差和观测值。
第二张表就有些难以解释了,但是可以用下表表示。
最后一张表记录了线性回归的系数、每个变量的标准误差、置信区间等等。
至于其它表格中的计算结果,是关于每个数据点的偏离程度分析。