统计学复习资料下
第9章 相关与回归分析
9.1 相关与回归分析的基本概念 9.1.1 函数关系与相关关系
一. 函数关系:
1) 是一一对应的确定关系
2) 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y
依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量
3) 各观测点落在一条线上 4) 函数关系的例子
① 某种商品的销售额(y)与销售量(x)之间的关系可表示为 y = px (p 为单价) ② 圆的面积(S)与半径之间的关系可表示为S=R2
③ 企业的原材料消耗额(y)与产量(x1) 、单位产量消耗(x2) 、原材料价格(x3)之间的关系可表示为y = x1 x2 x3
二. 相关关系(correlation): 1) 变量间关系不能用函数关系精确表达 2) 一个变量的取值不能由另一个变量唯一确定 3) 当变量 x 取某个值时,变量 y 的取值可能有几个 4) 各观测点分布在直线周围 5) 相关关系的例子
① 父亲身高(y)与子女身高(x)之间的关系 ② 收入水平(y)与受教育程度(x)之间的关系
③ 粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系 ④ 商品的消费量(y)与居民收入(x)之间的关系 ⑤ 商品销售额(y)与广告费支出(x)之间的关系
三. 区别与联系
函数关系 变量之间关系 相关关系 互为因果关系 共变关系 确定性依存关系 因果关系 不确定(随机性)依存关系 1) 区别: ① 函数关系中的变量之间的关系是完全确定的,而相关关系中的变量之间的关系是不完全确定的。 ② 函数关系可以用数学表达式精确表示出来,而相关关系只能通过研究变量间的统计规律才能得到. 2) 联系:由于存在着测量误差等因素的影响,函数关系在实践中往往通过相关关系表现出来;在研究相关
关系时,常常通过确定性的函数关系部分来研究变量之间的依赖关系。
9.1.2 相关关系的种类
1
统计学复习资料
相关关系的种类 按相关程度划按相关方向划按相关形式划按变量多少划按相关性质划完全相关 正相关 线性相关 非线性相单相关 真实相关 不完全相负相关 复相关 虚假相关 不相关 偏相关
9.1.3 相关分析与回归分析
一. 相关分析:用一个指标来表明现象间相互关系的密切程度
二. 回归分析:根据相关关系的具体形态,选择一个合适的数学模型来近似地表达变量间的平均变化关系 三. 区别:相关分析研究的都是随机变量,并且不分自变量与因变量;回归分析研究的变量要定出自变量与
因变量,并且自变量是确定的普通变量,因变量是随机变量。 四. 联系: 均为研究现象之间相关关系的两种不可分割的基本
9.1.4 相关关系的描述与测度
一. 相关表:是一种统计表,它是直接根据现象之间的原始资料,将一变量的若干变量值按从小到大的顺序
排列,并将另一变量的值与之对应排列形成的统计表.
二. 相关图:又称散点图(scatter diagram),用直角坐标系的x轴代表一个变量,y轴代表另一变量,将两
个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。
图1 完全相关 图2 不完全相关
图3 不相关
三. 相关系数
1) 对变量之间关系密切程度的度量
2) 对两个变量之间线性相关程度的度量称为简单相关系数
3) 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 4) 若是根据样本数据计算的,则称为样本相关系数,记为 r 5) 样本相关系数的计算公式
或简化为 6) 取值及其意义
① r 的取值范围是 [—1,1]
2
统计学复习资料
② |r|=1,为完全相关 a. r =1,为完全正相关 b. r =-1,为完全负正相关
③ r = 0,不存在线性相关关系相关 ④ -1r<0,为负相关 ⑤ 0〈r1,为正相关
⑥ |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 a. 当|r| ≥0。8时,高度相关 b. 当0。5 |r| <0.8时,中度相关 c. 当0.3 |r| 〈0。5时,低度相关
d. 当|r|〈0.3时,相关程度极弱,可视为不相关 7) 用Excel计算相关系数 ① 插入-—函数——correl ② 工具——数据分析—-相关系数
9.1.5 相关系数的显著性检验
一. r 的抽样分布
1) r 的抽样分布随总体相关系数和样本容量的大小而变化
2) 当样本数据来自正态总体时,随着n的增大,r 的抽样分布趋于正态分布,尤其是在总体相关系数
很小或接近0时,趋于正态分布的趋势非常明显.而当远离0时,除非n非常大,否则r的抽样分布呈现一定的偏态。
3) 当为较大的正值时,r 呈现左偏分布;当为较大的负值时,r 呈现右偏分布。只有当接近于0,
而样本容量n很大时,才能认为r是接近于正态分布的随机变量 二. 检验的步骤
1) 检验两个变量之间是否存在线性相关关系 2) 等价于对回归系数 b1的检验 3) 采用R.A.Fisher提出的 t 检验 4) 检验的步骤为
① 提出假设:H0: ;H1: 0 ② 计算检验的统计量:
③ 确定显著性水平,并作出决策 ④ 若|t|〉t,拒绝H0 ⑤ 若t|〈t,不拒绝H0 三. 例题分析
【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力.为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据
各项贷款余额(亿本年累计应收贷贷款项目个本年固定资产投资
分行编号
1 2 3
不良贷款(亿元) 元)
0。9 1.1 4。8
67。3 111。3 173.0
款(亿元)
6.8 19.8 7.7
数(个)
5 16 17
额(亿元)
51.9 90。9 73.7
3
统计学复习资料
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
3.2 7.8 2。7 1.6 12.5 1.0 2.6 0。3 4。0 0。8 3.5 10.2 3.0 0。2 0.4 1。0 6.8 11.6 1。6 1.2 7.2 3。2
80。8 199。7 16.2 107.4 185。4 96。1 72.8 64。2 132。2 58.6 174.6 263。5 79。3 14.8 73。5 24。7 139。4 368。2 95。7 109。6 196。2 102.2
7。2 16.5 2。2 10。7 27.1 1。7 9。1 2.1 11。2 6.0 12。7 15.6 8.9 0.6 5。9 5。0 7。2 16。8 3。8 10.3 15。8 12。0
10 19 1 17 18 10 14 11 23 14 26 34 15 2 11 4 28 32 10 14 16 10
14.5 63。2 2.2 20.2 43.8 55.9 64.3 42。7 76.7 22。8 117。1 146。7 29.9 42.1 25.3 13。4 64.3 163。9 44。5 67。9 39。7 97。1
1) 解:用excel计算的相关矩阵如下表:
对不良贷款与贷款余额之间的相关系数r=0。8436进行显著性检(0.05) ① 提出假设:H0: ;H1: 0 ② 计算检验的统计量
③ 根据显著性水平=0。05,查t分布表得t(n—2)=2。0687
④ 由于t|=7。5344〉t(25—2)=2.0687,拒绝H0,不良贷款与贷款余额之间存在着显著的正线性相
关关系
2) 各相关系数检验的统计量
9.2 一元线性回归分析
涉及一个自变量的回归
因变量y与自变量x之间为线性关系
被预测或被解释的变量称为因变量(dependent variable),用y表示
用来预测或用来解释因变量的一个或多个变量称为自变量(independent variable),用x表示 因变量与自变量之间的关系用一条线性方程来表示
9.2.1 一元线性回归模型
一. 描述因变量 y 如何依赖于自变量 x 和误差项 的方程称为回归模型 二. 一元线性回归模型可表示为 yx 1) y 是 x 的线性函数(部分)加上误差项
2) 线性部分反映了由于 x 的变化而引起的 y 的变化 3) 误差项 是随机变量
4
统计学复习资料
① 反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响 ② 是不能由 x 和 y 之间的线性关系所解释的变异性 4) 0 和 1 称为模型的参数 三. 基本假定
1) 误差项ε是一个期望值为0的随机变量,即E(ε)=0。对于一个给定的 x 值,y 的期望值为E ( y )
= 0+ 1 x
2) 对于所有的 x 值,ε的方差σ2 都相同
3) 误差项ε是一个服从正态分布的随机变量,且相互独立。即ε~N( 0 ,σ2 ) ① 独立性意味着对于一个特定的 x 值,它所对应的ε与其他 x 值所对应的ε不相关 ② 对于一个特定的 x 值,它所对应的 y 值与其他 x 所对应的 y 值也不相关 四. 回归方程(regression equation)
1) 描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程 2) 一元线性回归方程的形式如下 E( y ) = 0+ 1 x ① 方程的图示是一条直线,也称为直线回归方程
② 0是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值
③ 1是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值 五. 估计的回归方程(estimated regression equation) 1) 总体回归参数和是未知的,必需利用样本数据去估计
2) 用样本统计量和代替回归方程中的未知参数和 ,就得到了估计的回归方程 3) 一元线性回归中估计的回归方程为
4) 其中:是估计的回归直线在 y 轴上的截距;是直线的斜率,它表示对于一个给定的 x 的值,是 y 的
估计值,也表示 x 每变动一个单位时, y 的平均变动值
9.2.2 参数的最小二乘估计
一. 原理
1) 使因变量的观察值与估计值之间的离差平方和达到最小来求得和 的方法.即
2) 用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小 二. 和 的计算公式: 三. 例题分析
【例】求不良贷款对贷款余额的回归方程
解: 回归方程为:y = —0.8295 + 0.037895 x 回归系数=0。037895 表示,贷款余额每增加1亿元,不良贷款平均增加0。037895亿元 四. 用Excel进行回归分析
第1步:选择“工具”下拉菜单 第2步:选择“数据分析”选项
第3步:在分析工具中选择“回归”,然后选择“确定” 第4步:当对话框出现时
在“Y值输入区域”方框内键入Y的数据区域 在“X值输入区域\"方框内键入X的数据区域 在“置信度”选项中给出所需的数值 在“输出选项\"中选择输出区域 在“残差”分析选项中选择所需的选项
5
统计学复习资料
9.2.3 回归直线的拟合优度评价
一. 变差
1) 因变量 y 的取值是不同的,y 取值的这种波动称为变差.变差来源于两个方面 ① 由于自变量 x 的取值不同造成的
② 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响
2) 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差来表示 二. 离差平方和的分解(三个平方和的关系)
1) 总平方和(SST)=回归平方和(SSR)+残差平方和(SSE) 三. 三个平方和的意义
1) 总平方和(SST):反映因变量的 n 个观察值与其均值的总离差
2) 回归平方和(SSR):反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间
的线性关系引起的 y 的取值变化,也称为可解释的平方和
3) 残差平方和(SSE):反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余
平方和
四. 判定系数r2 (coefficient of determination) 1) 回归平方和占总离差平方和的比例 2) 反映回归直线的拟合程度 3) 取值范围在 [ 0 , 1 ] 之间
4) r2 1,说明回归方程拟合的越好;r2 0,说明回归方程拟合的越差 5) 判定系数等于相关系数的平方 五. 例题分析
1) 【例】计算不良贷款对贷款余额回归的判定系数,并解释其意义 2) 解:
判定系数的实际意义是:在不良贷款取值的变差中,有71.16%可以由不良贷款与贷款余额之间的线性关系来解释,或者说,在不良贷款取值的变动中,有71.16%是由贷款余额所决定的。也就是说,不良贷款取值的差异有2/3以上是由贷款余额决定的。可见不良贷款与贷款余额之间有较强的线性关系 六. 估计标准误差(standard error of estimate) 1) 实际观察值与回归估计值离差平方和的均方根 2) 反映实际观察值在回归直线周围的分散状况
3) 对误差项的标准差的估计,是在排除了x对y的线性影响后,y随机波动大小的一个估计量 4) 反映用估计的回归方程预测y时预测误差的大小 5) 计算公式为
9.2.4 残差分析
一. 残差(residual)
1) 因变量的观测值与根据估计的回归方程求出的预测值之差,用e表示 2) 反映了用估计的回归方程去预测而引起的误差 3) 确定有关误差项的假定是否成立 4) 检测有影响的观测值 二. 用残差证实模型的假定 1) 残差图(residual plot)
① 表示残差的图形 (关于x的残差图 关于y的残差图 标准化残差图) ② 用于判断误差的假定是否成立
6
统计学复习资料
③ 检测有影响的观测值 ④ 形态及判别
⑤ 标准化残差(standardized residual) a. 残差除以它的标准差后得到的数值.计算公式为 b. ei是第i个残差的标准差,其计算公式为 ⑥ 杠杆率点(leverage point)
a. 如果自变量存在一个极端值,该观测值则称为高杠杆率点(high leverage point) b. 在一元回归中,第i个观测值的杠杆率用hi表示,其计算公式为 c. 如果一个观测值的杠杆率,就可以将该观测值识别为有高杠杆率的点
d. 一个有高杠杆率的观测值未必是一个有影响的观测值,它可能对回归直线的斜率没有什么影响 ⑦ 标准化残差图:用以直观地判断误差项服从正态分布这一假定是否成立 a. 若假定成立,标准化残差的分布也应服从正态分布
b. 在标准化残差图中,大约有95%的标准化残差在-2到+2之间 三. 用残差检测异常值和有影响的观测值 1) 异常值(outlier)
① 如果某一个点与其他点所呈现的趋势不相吻合,这个点就有可能是异常点,或称为野点 a. 如果异常值是一个错误的数据,比如记录错误造成的,应该修正该数据,以便改善回归的效果 b. 如果是由于模型的假定不合理,使得标准化残差偏大,应该考虑采用其他形式的模型,比如非线性模
型
c. 如果完全是由于随机因素而造成的异常值,则应该保留该数据
② 在处理异常值时,若一个异常值是一个有效的观测值,不应轻易地将其从数据集中予以剔出 ③ 识别
a. 异常值也可以通过标准化残差来识别
b. 如果某一个观测值所对应的标准化残差较大,就可以识别为异常值
c. 一般情况下,当一个观测值所对应的标准化残差小于-2或大于+2时,就可以将其视为异常值 2) 有影响的观测值
① 如果某一个或某一些观测值对回归的结果有强烈的影响,那么该观测值或这些观测值就是有影响的
观测值
② 一个有影响的观测值可能是
a. 一个异常值,即有一个的值远远偏离了散点图中的趋势线 b. 对应一个远离自变量平均值的观测值 c. 或者是这二者组合而形成的观测值
不存在影响值的趋势 存在影响值的趋势 有影响的观测值
7
统计学复习资料
9.2.5 显著性检验
一. 线性关系的检验
1) 检验自变量与因变量之间的线性关系是否显著
2) 将回归均方(MSR)同残差均方(MSE)加以比较,应用F检验来分析二者之间的差别是否显著 3) 回归均方:回归平方和SSR除以相应的自由度(自变量的个数p) 4) 残差均方:残差平方和SSE除以相应的自由度(n-p—1) 5) 检验的步骤
① 提出假设H0:0 (线性关系不显著);H1:1 0 ② 计算检验统计量F: ③ 确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F ④ 作出决策:若F〉F ,拒绝H0;若F ① 提出假设。 H0: 1=0 不良贷款与贷款余额之间的线性关系不显著 ② 计算检验统计量F: ③ 确定显著性水平=0.05,并根据分子自由度1和分母自由度25-2找出临界值F =4。28 ④ 作出决策:F〉F ,拒绝H0,线性关系显著 二. 回归系数的检验 1) 检验 x 与 y 之间是否具有线性关系,或者说,检验自变量 x 对因变量 y 的影响是否显著 2) 理论基础是回归系数的抽样分布 3) 在一元线性回归中,等价于线性关系的显著性检验 4) 样本统计量的分布 ① 是根据最小二乘法求出的样本统计量,它有自己的分布 ② 的分布具有如下性质 ③ 分布形式:正态分布 ④ 数学期望: ⑤ 标准差: ⑥ 由于未知,需用其估计量sy来代替得到 的估计的标准差 5) 检验步骤 ① 提出假设 H0: = 0 (没有线性关系) H1: 0 (有线性关系) ② 计算检验的统计量 ③ 确定显著性水平,并进行决策 ④ t>t,拒绝H0; t〈t,不拒绝H0 6) 例题分析 ① 对例题的回归系数进行显著性检验(=0.05) ② 解:提出假设H0:b1 = 0 H1:b1 0 计算检验的统计量 t=7。533515〉t=2。201,拒绝H0,表明不良贷款与贷款余额之间的线性关系是显著的 9.2.6 利用回归方程进行估计和预测 根据自变量 x 的取值估计或预测因变量 y的取值 估计或预测的类型 (一)点估计 y 的平均值的点估计 y 的个别值的点估计 8 统计学复习资料 (二)区间估计 y 的平均值的置信区间估计 y 的个别值的预测区间估计 一. 点估计 1) 对于自变量 x 的一个给定值x0 ,根据回归方程得到因变量 y 的一个估计值 2) 点估计值有 ① y 的平均值的点估计 a. 利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的一个估计值 E(y0) ,就是平均值的点估计 b. 在前面的例子中,假如我们要估计贷款余额为100亿元时,所有分行不良贷款的平均值,就是平均值 的点估计。根据估计的回归方程得 ② y 的个别值的点估计 a. 利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个个别值的估计值,就 是个别值的点估计 b. 比如,如果我们只是想知道贷款余额为72。8亿元的那个分行(这里是编号为10的那个分行)的不良 贷款是多少,则属于个别值的点估计。根据估计的回归方程得 3) 在点估计条件下,平均值的点估计和个别值的的点估计是一样的,但在区间估计中则不同 二. 区间估计 1) 点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计 2) 对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 的一个估计区间 3) 区间估计有两种类型 ① 置信区间估计(confidence interval estimate) a. 利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的估计区间 ,这 一估计区间称为置信区间(confidence interval) b. E(y0) 在1-置信水平下的置信区间为,式中:sy为估计标准误差 【例】求出贷款余额为100亿元时,不良贷款95%的置信区间 解:根据前面的计算结果,已知n=25,sy=1。9799,t(25-2)=2。0687 置信区间为 当贷款余额为100亿元时,不良贷款的平均值在2.1141亿元到3。8059亿元之间 ② 预测区间估计(prediction interval estimate) a. 利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个个别值的估计区间, 这一区间称为预测区间(prediction interval) b. y0在1-置信水平下的预测区间为 【例】求出贷款余额为72.8亿元时,不良贷款 95% 的置信区间 解:根据前面的计算结果,已知n=25,sy=1.9799,t(25—2)=2.0687 置信区间为 贷款余额为72。8亿元的那个分行,其不良贷款的预测区间在-2。2766亿元到6。1366亿元之间. 4) 影响区间宽度的因素 ① 置信水平 (1 — ) 区间宽度随置信水平的增大而增大 ② 数据的离散程度 (s) 区间宽度随离散程度的增大而增大 ③ 样本容量 区间宽度随样本容量的增大而减小 ④ 用于预测的 xp与x的差异程度 区间宽度随 xp与x 的差异程度的增大而增大 9.3 多元线性回归分析 9.3.1 多元回归模型(multiple regression model) 9 统计学复习资料 一. 一个因变量与两个及两个以上自变量的回归 二. 描述因变量 y 如何依赖于自变量 x1 , x2 ,…, xp 和误差项 的方程,称为多元回归模型 三. 涉及 p 个自变量的多元回归模型可表示为 1) b0 ,b1,b2 ,,bp是参数 2) 是被称为误差项的随机变量 3) y 是x1,,x2 , ,xp 的线性函数加上误差项 4) 包含在y里面但不能被p个自变量的线性关系所解释的变异性 四. 基本假定 1) 误差项ε是一个期望值为0的随机变量,即E()=0 2) 对于自变量x1,x2,…,xp的所有值,的方差2都相同 3) 误差项ε是一个服从正态分布的随机变量,即ε~N(0,2),且相互独立 五. 多元回归方程 (multiple regression equation) 1) 描述因变量 y 的平均值或期望值如何依赖于自变量 x1, x2 ,…,xp的方程 2) 多元线性回归方程的形式为E( y ) = 0+ 1x1 + 2x2 +…+ pxp ① b1,b2,,bp称为偏回归系数 ② bi 表示假定其他变量不变,当 xi 每变动一个单位时,y 的平均变动值 六. 估计的多元回归的方程(estimated multiple regression equation) 1) 用样本统计量估计回归方程中的参数时得到的方程 2) 由最小二乘法求得 3) 一般形式为 ① 是的估计值 ② 是 y 的估计值 9.3.2 多元线性回归模型评估 一. 模型的整体检验 1) 检验因变量与所有自变量之间的线性关系是否显著,被称为模型的整体检验 2) 检验方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用 F 检验来分析二者之 间的差别是否显著 3) 如果是显著的,因变量与自变量之间存在线性关系 4) 如果不显著,因变量与自变量之间不存在线性关系 5) 模型的整体检验步骤 ① 提出假设 H0:12p=0 线性关系不显著 H1:1,2,,p至少有一个不等于0 ② 计算检验统计量F: ③ 确定显著性水平和分子自由度p、分母自由度n—p—1找出临界值F ④ 作出决策:若F〉F ,拒绝H0 二. 回归系数的显著性检验 1) 线性关系检验通过后,对各个回归系数有选择地进行一次或多次检验 2) 究竟要对哪几个回归系数进行检验,通常需要在建立模型之前作出决定 3) 对回归系数检验的个数进行限制,以避免犯过多的第一类错误(弃真错误) 4) 对每一个自变量都要单独进行检验 5) 应用 t 检验统计量 10 统计学复习资料 6) 步骤 ① 提出假设 H0: bi = 0 (自变量 xi 与 因变量 y 没有线性关系) H1: bi 0 (自变量 xi 与 因变量 y有线性关系) ② 计算检验的统计量 t: ③ 确定显著性水平,并进行决策: t〉t,拒绝H0; t 1) 加归模型的残差是Y的真实值与预测值间的差异,用e表示。残差分析可以评价模型的拟合优度,方 法与一元线性回归相同. 2) SSE是残差平方和,它的主要作用是计算其他更有用的统计量,如估计标准误差Se 3) 回归分析的假设前提包括:误差项大致为期望为0的正态分布,因此估计标准差Se是评价回归模型与 数据的拟合优度的重要指标 4) 估计标准误差 Sy ① 对误差项的标准差的一个估计值 ② 衡量多元回归方的程拟合优度 ③ 计算公式为 四. 多重判定系数 1) 回归平方和占总平方和的比例 2) 计算公式为 3) 因变量取值的变差中,能被估计的多元回归方程所解释的比例 4) 修正多重判定系数(adjusted multiple coefficient of determination) ① 用样本容量n和自变量的个数p去修正R2得到 ② 计算公式为 ③ 避免增加自变量而高估 ④ 意义与类似 ⑤ 数值小于 9.4 非线性回归分析 9.4.1 常用非线性函数 一. 抛物线函数 二. 双曲线函数 三. 幂函数 四. 指数函数 五. 对数函数 六. S形曲线函数 七. 多项式方程; 9.4.2 非线性回归模型的估计 一. 倒数变换 二. 半对数变换 11 统计学复习资料 三. 双对数变换 对 两边求对数: 令 有: 四. 多项式变换 第10章 时间序列分析 10.1 预测概述 10.1.1 预测的三种方法 大类 具体方法 德尔菲法 定性分析法 远景方案论述法 直观法 销售人员预测法 移动平均法 指数平滑法 时间序列法 趋势推测法 自回归模型 季节回归模型 回归模型 计量经济学模型 因果法 优势指标法 相关模型 输入输出模型 假设被预测变量和解释变被预测变量和被子认为影量间存在某种关系 响它的变量的历史数据都存在 只利用被预测变量的历史当被预测变量的历史数据数据找出运动模式 显示出某种运动模式时 解释 据 条件 本不存在时 利用来自信息源的主观数当相关历史数据很少或根10.1.2 时间序列分析的概述 一. 概念:把反映某种事物在时间上变化的统计数据,按照时间顺序排列起来而形成的数据序列称为时间序 列。 二. 两个基本要素 1) 现象所属的时间 2)反映现象发展水平的指标数值 三. 时间数列的种类 12 统计学复习资料 1) 按数列中排列指标的性质不同分为: ① 绝对数时间数列 ②相对数时间数列 ③平均数时间数列 2) 按数列所反映时间状态不同可分: ①时期数列 ②时点数列 四. 编制时间数列的基本原则 保证数列中各期指标数值的可比性 1) 各期指标数值所属时间可比 2) 各期指标数值总体范围可比 3) 各期指标数值计算口径可比 4) 各期指标数值经济内容可比 五. 时间数列常用分析方法 1) 指标分析法:通过时间数列的分析指标来揭示现象的发展变化状况和发展变化程度 2) 构成因素分析法:通过对影响时间数列的构成因素进行分解分析,揭示现象随时间变化而演变的规律 10.2 时间序列的描述性分析 10.2.1 图形描述 在对时间序列进行分析时,最好是先作一个图形(散点图或折线图),然后通过图形观察数据随时间的变化趋势,它对于进一步分析会有很大帮助。 10.2.2 水平分析 一. 发展水平 指时间数列中每一项指标数值 二. 平均发展水平 1) 又叫序时平均数,是把时间数列中各期指标数值加以平均而求得的平均数 2) 一般平均数与序时平均数的区别 ① 计算的依据不同:前者是根据变量数列计算的,后者则是根据时间数列计算的; ② 说明的内容不同:前者表明总体内部各单位的一般水平,后者则表明整个总体在不同时期内的一般 水平. 3) 序时平均数的计算方法计算,绝对数时间数列的序时平均数 ① 由时期数列计算,采用简单算术平均法 【例】1994—1998年中国能源生产总量 年份 1994 1995 1996 1997 1998 ② 由时点数列计算: a. 由连续时点数列计算:间隔相等时,采用简单算术平均法 b. 由连续时点数列计算:间隔不相等时,采用加权算术平均法 c. 由间断时点数列计算:间隔相等时,采用简单序时平均法 d. 由间断时点数列计算:间隔不相等时,采用加权序时平均法 4) 序时平均数的计算方法计算,① 基本公式 ② a、b均为时期数列时 13 能源生产总量(万吨标准煤) 118729 129034 132616 132410 124000 计算相对数时间数列的序时平均数 统计学复习资料 ③ a、b均为时点数列时 ④ a为时期数列、b为时点数列时 【例】已知某企业的下列资料: 月 份 工业增加值(万元) 月末全员人数(人) 要求计算: ①该企业第二季度各月的劳动生产率; ②该企业第二季度的月平均劳动生产率; ③ 企业第二季度的劳动生产率。 解:第二季度各月的劳动生产率: 2000 2000 2200 2200 2300 三 11。0 四 12.6 五 14.6 六 16。3 七 18。0 四月份: 五月份: 六月份: 该企业第二季度的月平均劳动生产率: 该企业第二季度的劳动生产率: 三. 增长量 1) 指报告期水平与基期水平之差 2) 设时间数列中各期发展水平为: ① 逐期增长量 ② 累计增长量 3) 年距增长量:本期发展水平与去年同期水平之差,目的是消除季节变动的影响 4) 平均增长量:逐期增长量的序时平均数 10.2.3 速度分析 一. 发展速度 1) 指报告期水平与基期水平的比值,说明现象的变动程度 2) 设时间数列中各期发展水平为: 3) 环比发展速度(年速度) 4) 定基发展速度(总速度) 5) 环比发展速度与定基发展速度的关系: 6) 年距发展速度 二. 增长速度 1) 指增长量与基期水平的比值,说明报告期水平较基期水平增长的程度 ① 环比增长速度 14 统计学复习资料 ② 定基增长速度 ③ 年距增长速度 三. 平均发展速度和平均增长速度 1) 平均发展速度:各环比发展速度的平均数,说明现象每期变动的平均程度 2) 平均增长速度:说明现象逐期增长的平均程度 3) 平均发展速度的计算 ① 几何平均法(水平法) a. 基本要求:从最初水平a0出发,每期按一定的平均发展速度 发展,经过n个时期后,达到最末 水平an,有 b. 有关指标的推算: a) 推算最末水平an : b) 预测达到一定水平所需要的时间n : c) 计算翻番速度 : ② 方程式法(累计法) a. 基本要求:从最初水平a0出发,每期按一定的平均发展速度 发展,经过n个时期后,达到各 期实际水平之和等于各期推算水平之和 ③ 两种方法的比较: a. 几何平均法研究的侧重点是最末水平; b. 方程法研究的侧重点是各年发展水平的累计总和. 4) 应用平均发展速度应注意的问题 ① 平均发展速度要和各环比发展速度结合分析; ② 总平均发展速度要和分段平均发展速度结合分析; ③ 总平均发展速度要联系基期水平进行分析。 10.3 时间序列的模型构建及分解分析 10.3.1 时间序列的构成模型 一. 影响时间序列变动的因素 1) 长期趋势(secular trend):在一段相当长时期呈现出某种持续向上或持续下降的状态或规律 2) 季节变动(seasonality):也称季节变动(Seasonal fluctuation),时间序列以一定时期为周期的有 规则的重复变动 3) 循环变动(cyclity) :也称循环波动(Cyclical fluctuation),围绕长期趋势的一种波浪形或振荡 式变动 4) 随机性(random) :也称不规则波动(Irregular variations),除去趋势、周期性和季节性之后的 偶然性波动 二. 三. 加法模型:Y=T+S+C+I 乘法模型:Y=T·S·C·I 10.3.2 趋势变动分析 一. 测定长期趋势的意义: 1) 把握现象随时间演变的趋势和规律; 2) 对事物的未来发展趋势作出预测; 3) 便于更好地分解研究其他因素。 二. 测定长期趋势的基本方法: 15 统计学复习资料 1) 移动平均法:移动平均法的基本思想是对原数列中的指标值按一定时间跨度移动,计算出一系列新的 序时平均数,形成时间数列,以消除偶然因素和季节变动的影响,显示出长期趋势。 ① 移动平均的项数越大,对数列的平滑修匀作用越大 ② 平均项数为奇数,只需一次平均;平均项数为偶数,需进行二次平均 ③ 数列中包含有周期变动,平均项数必须与周期长度相同 ④ 移动平均后,新数列项数比原数列项数少 奇数平均,首尾各少 (n—1)/2项 偶数平均,首尾各少 n/2 项 ⑤ 由于首尾都损失若干信息量, 只可用于观察趋势,但不利于直接向外进行延伸预测。 2) 趋势线拟合法: ① 线性趋势(linear trend) a. 现象随着时间的推移而呈现出稳定增长或下降的线性变化规律 b. 由影响时间序列的基本因素作用形成 c. 测定方法主要有:移动平均法、指数平滑法、线性模型法等 d. 时间序列的主要构成要素 e. 线性方程的形式为 a) 趋势方程中的两个未知常数 a 和 b 按最小二乘法(Least—square Method)求得 b) 根据回归分析中的最小二乘法原理 c) 使各实际观察值与趋势值的离差平方和为最小 d) 最小二乘法既可以配合趋势直线,也可用于配合趋势曲线 e) 根据趋势线计算出各个时期的趋势值 f) 预测误差可用估计标准误差来衡量,m为趋势方程中未知常数的个数 ② 非线性趋势分析和预测 a. 二次曲线(second degree curve) : a) 现象的发展趋势为抛物线形态 b) 一般形式为 c) 根据最小二乘法求得 a、b、c标准方程 b. 指数曲线(exponential curve) a) 用于描述以几何级数递增或递减的现象 b) 一般形式为 i. ii. iii. iv. i. ii. iii. a、b为未知常数 若b〉1,增长率随着时间t的增加而增加 若b<1,增长率随着时间t的增加而降低 若a>0,b〈1,趋势值逐渐降低到以0为极限 采取“线性化”手段将其化为对数直线形式 根据最小二乘法,得到求解 lga、lgb 的标准方程为 求出lga和lgb后,再取其反对数,即得算术形式的a和b c) a、b 的求解方法 ③ 趋势线的选择 a. 观察散点图 b. 根据观察数据本身,按以下标准选择趋势线 c. 一次差大体相同,配合直线 16 统计学复习资料 d. 二次差大体相同,配合二次曲线 e. 对数的一次差大体相同,配合指数曲线 f. 比较估计标准误差 10.3.3 季节变动分析 一. 指客观现象因受自然或社会因素影响,而形成的有规律的周期性变动. 二. 不仅仅是指随一年中四季而变动,而是泛指有规律的、按一定周期(年、季、月、日)重复出现的变化 三. 目的: 1) 分析过去,为当前决策提供依据 2) 为未来季节变动作出预测,以便提前作出合理安排 3) 了解季节以外因素对数列的影响 四. 季节指数(seasonal index) 1) 刻画序列在一个年度内各月或季的典型季节特征 2) 以其平均数等于100%为条件而构成 3) 反映某一月份或季度的数值占全年平均数值的大小 4) 如果现象的发展没有季节变动,则各期的季节指数应等于100% 5) 季节变动的程度是根据各季节指数与其平均数(100%)的偏差程度来测定 ① 如果某一月份或季度有明显的季节变化,则各期的季节指数应大于或小于100% 五. 季节指数计算步骤 1) 计算移动平均值(季度数据采用4项移动平均,月份数据采用12项移动平均),并将其结果进行“中 心化”处理 ① 将移动平均的结果再进行一次二项的移动平均,即得出“中心化移动平均值”(CMA) 2) 计算移动平均的比值,也成为季节比率 ① 即将序列的各观察值除以相应的中心化移动平均值,然后再计算出各比值的季度(或月份)平均值, 即季节指数 3) 季节指数调整 ① 各季节指数的平均数应等于1或100%,若根据第二步计算的季节比率的平均值不等于1时,则需要 进行调整 a. 具体方法是:将第二步计算的每个季节比率的平均值除以它们的总平均值 10.3.4 循环变动分析 一. 循环变动 1) 近乎规律性的从低至高再从高至低的周而复始的变动 2) 不同于趋势变动,它不是朝着单一方向的持续运动,而是涨落相间的交替波动 3) 不同于季节变动,其变化无固定规律,变动周期多在一年以上,且周期长短不一 4) 时间长短和波动大小不一,且常与不规则波动交织在一起,很难单独加以描述和分析 二. 分析方法:剩余法 1) 先消去季节变动,求得无季节性资料 2) 再将结果除以由分离季节性因素后的数据计算得到的趋势值,求得含有周期性及随机波动的序列 3) 将结果进行移动平均(MA) ,以消除不规则波动,即得循环波动值 C = MA ( C × I ) 三. 步骤 1) 第一步:分离季节因素 ① 将季节性因素从时间序列中分离出去,以便观察和分析时间序列的其他特征 ② 方法是将原时间序列除以相应的季节指数 17 统计学复习资料 ③ 结果即为季节因素分离后的序列,它反映了在没有季节因素影响的情况下时间序列的变化形态 2) 第二步:进行趋势分析,消除趋势部分 ① 根据分离季节性因素的序列确定线性趋势方程 ② 根据趋势方程计算各期趋势值 ③ 根据趋势方程进行预测 a. 该预测值不含季节性因素,即在没有季节因素影响情况下的预测值 b. 如果要求出含有季节性因素的销售量的预测值,则需要将上面的预测值乘以相应的季节指数 第11章 统计指数 11.1 指数的概念与分类 一. 指数(index number) 1) 指数最早起源于测量物价的变动 2) 广义上,是指任何两个数值对比形成的相对数 3) 狭义上,是指用于测定多个项目在不同场合下综合变动的一种特殊相对数 4) 实际应用中使用的主要是狭义的指数 二. 分类 指数的分按内容分 数量指数 质量指数 按考察范围按计算形式按编制方式综合指数 平均指数 个体指数 总指数 简单指数 加权指数 1) 数量指数(quantitative index number) 反映物量变动水平 如产品产量指数、商品销售量指数等 2) 质量指数(qualitative index number) 反映事物内含数量的变动水平 如价格指数、产品成本指数等 3) 个体指数(individual index number) 反映个别项目的数量对比关系 如一种商品的价格或销售量的变动 4) 总指数(total index number) 反映总体现象的数量对比关系 如多种商品的价格或销售量的综合变动 5) 简单指数(simple index number) 计入指数的各个项目的重要性视为相同 6) 加权指数(weighted index number) 计入指数的项目依据重要程度赋予不同的权数 7) 综合指数(aggregative index number) 采用“先综合,后对比”的方式来编制的总指数 8) 平均指数(average index number) 采用“先对比,后平均\"的方式来编制的总指数 11.2 加权总指数的编制方法 18 统计学复习资料 11.2.1 权数的确定 一. 根据现象之间的联系确定权数 1) 计算数量指数时,应以相应的质量为权数 2)计算质量指数时,应以相应的物量为权数 二. 确定权数的所属时期 1) 可以都是基期,也可以都是报告期 2)使用不同时期的权数,计算结果和意义不同 2) 取决于计算指数的预期目的 三. 确定权数的具体形式 1) 可以是总量形式,也可以采取比重形式 2)取决于所依据的数据形式和计算方法 11.2.2 加权综合指数 一. 通过加权来测定一组项目的综合变动 二. 有加权数量指数和加权质量指数 1) 数量指数 测定一组项目的数量变动 如产品产量指数,商品销售量指数等 2) 质量指数 测定一组项目的质量变动 如价格指数、产品成本指数等 三. 因权数不同,有不同的计算公式 1) 拉氏指数(Laspeyres index) ① 计算指数时,将权数的各变量值固定在基期 ② 计算公式为: a. 质量指数: b. 数量指数: 【例】设某粮油零售市场2001年和2002年三种商品的零售价格和销售量资料如下表.试分别以基期销售量和零售价格为权数,计算三种商品的价格综合指数和销售量综合指数 某粮油零售市场三种商品的价格和销售量 商品名称 粳米 标准粉 花生油 计量单位 吨 吨 公斤 销售量 2001 120 150 1500 2002 150 200 1600 单价(元) 2001 2600 2300 9.8 2002 3000 2100 10.5 价格综合指数为 销售量综合指数为 结论∶与2001年相比,三种商品的零售价格平均上涨了2.84%,销售量平均上涨了8.88% ③ 特点: a. 以基期变量值为权数,可以消除权数变动对指数的影响,从而使不同时期的指数具有可比性 b. 拉氏指数也存在一定的缺陷 c. 比如物价指数,是在假定销售量不变的情况下报告期价格的变动水平,不能反映出消费量的变化 d. 从实际生活角度看,人们更关心在报告期销售量条件下,由于价格变动对实际生活的影响 e. 拉氏价格指数实际中应用得很少。而拉氏数量指数实际中应用得较多 2) 帕氏指数(Paasche index) ① 计指数时,把作为权数的变量值固定在报告期 ② 计算公式为 a. 质量指数: b.数量指数: 19 统计学复习资料 【例】设某粮油零售市场2001年和2002年三种商品的零售价格和销售量资料如下表。试分别以基期销售量和零售价格为权数,计算三种商品的价格综合指数和销售量综合指数 某粮油零售市场三种商品的价格和销售量 商品名计量 销售量 称 粳米 单位 2001 吨 120 150 2002 150 200 1600 单价(元) 2001 2600 2300 9.8 2002 3000 2100 10.5 标准粉 吨 价格综合指数为 花生油 公斤 1500 销售量综合指数为 结论∶与2001年相比,三种商品的零售价格平均上涨了2.44%,销售量平均上涨了28。38%。 11.2.3 加权平均指数(weighted average index number) 一. 以某一时期的总量为权数对个体指数加权平均 1) 权数通常是两个变量的乘积 二. 可以是价值总量 1) 如商品销售额(销售价格与销售量的乘积)、工业总产值(出厂价格与生产量的乘积) 三. 可以是其他总量 1) 如农产品总产量(单位面积产量与收获面积的乘积) 四. 因权数所属时期的不同,有不同的计算形式 1) 加权算术平均指数 ① 以基期总量为权数对个体指数加权平均 ② 计算形式上采用算术平均形式 ③ 计算公式为 质量指数: 数量指数: 【例】设某企业生产三种产品的有关资料如下表。试计算三种产品的单位成本总指数和产量总指数 某企业生产三种产品的有关数据 商品名计量 称 甲 乙 丙 单位 件 台 箱 总成本(万元) 基期 200 50 120 报告期 220 50 150 个体成本个体产量指数 1.14 1。05 1。20 指数 1。03 0.98 1.10 (p0q0) (p1q1) (p1/p0) (q1/q0) 单位成本指数为 产量总指数为 结论∶报告期与基期相比,三种产品的单位成本平均提高了14。73%,产量平均提高了4.59% 2) 加权调和平均指数 ① 以报告期总量为权数对个体指数加权平均 ② 计算形式上采用调和平均形式 ③ 计算公式为 a. 质量指数: b. 数量指数: 20 统计学复习资料 【例】根据前例中的有关数据,用报告期总成本为权数计算三种产品的单位成本总指数和产量总指数. 单位成本指数产量总指数为 结论∶报告期与单位成本平均提均提高了 某企业生产三种产品的有关数据 商品名计量 称 甲 乙 丙 总成本(万元) 基期 个体成本个体产量为 11.3 几种常用的价格11.3.1 零售价格指数 一. 反映城乡商品零售 种经济指数 基期相比,三种产品的指数 报告期 指数 单位 (q1/q0) 高了14.88%,产量平(p0q0) (p1q1) (p1/p0) 4.74% 。 件 200 220 1。14 1.03 指数 台 50 50 1。05 0.98 (retail price index) 箱 120 150 1。20 1。10 价格变动趋势的一 二. 它的变动直接影响到城乡居民的生活支出和国家财政收入,影响居民购买力和市场供需平衡以及消费和 积累的比例 三. 是观察和分析经济活动的重要工具之一 四. 零售价格指数资料是采用分层抽样的方法取得 1) 即在全国选择不同经济区域和分布合理的地区、以及有代表性的商品作为样本,对市场价格进行经常 性的调查,以样本推断总体 2) 目前,国家一级抽选出的调查市、县226个 五. 调查地区和调查点的选择 1) 调查地区按经济区域和地区分布合理等原则 2) 选出具有代表性的大、中、小城市和县作为国家的调查地区 3) 选择经营规模大、商品种类多的上场(包括集市) 作为调查点 六. 编制过程 1) 代表商品和代表规格品的选择 ① 代表商品和选择那些消费量大、价格变动有代表性的商品 ② 代表规格品的确定是根据商品零售资料和3。6万户城市居民、6.7万户农村居民的消费支出记帐资 料,按有关规定筛选的 a. 筛选原则是:(1)与社会生产和和人民生活密切相关;(2)销售数量(金额)大;(3)市场供应保持稳 定;(4)价格变动趋势有代表性;(5)所选的代表规格品之间差异大 2) 价格调查方式 ① 采用派员直接到调查点登记调查 ② 同时全国聘请近万名辅助调查员协助登记调查 3) 权数的确定 ① 是根据社会商品零售额统计确定的 11.3.2 消费价格指数(consumer price index) 一. 世界各国普遍编制的一种指数 1) 我国称之为居民消费价格指数 二. 反映一定时期内城乡居民所购买的生活消费品价格和服务项目价格的变动趋势和程度 三. 可就城乡分别编制 1) 编制过程与零售价格指数类似,不同的是它包括消费品价格和服务项目价格两个部分 2) 其权数的确定是根据9万多户城乡居民家庭消费支出构成确定的 四. 作用 1) 反映通货膨胀状况 21 统计学复习资料 2) 反映货币购买力变动 3) 反映对职工实际工资的影响 4) 用于缩减经济序列 11.3.3 生产价格指数(producer price index) 一. 测量在初级市场上出售的货物(即在非零售市场上首次购买某种商品时) 的价格变动的一种价格指数 二. 它是根据每种商品在非零售市场上首次交易时的价格计算的 1) 其计入的产品覆盖了原始的、经过制造的和在各个加工阶段上加工的货物,也包括制造业、农业、林 业、渔业以及公用事业等的各类产出。生产价格指数通常用于反映消费价格和生活费用未来的趋势 三. 生产价格指数的上涨反映了生产者价格的提高 四. 通常是按月公布 五. 我国的生产者价格指数正在编制过程中,目前尚未公布 11.3.4 股票价格指数(stock price index) 一. 反映某一股票市场上多种股票价格变动趋势的一种相对数,简称股价指数 二. 其单位一般用“点”(point)表示,即将基期指数作为100,每上升或下降一个单位称为“1点” 三. 计算时一般以发行量为权数进行加权综合。其公式为 四. 世界主要证券交易所的股票价格指数 1) 美国的道·琼斯指数和标准普尔指数;伦敦金融时报FTSE指数;法兰克福DAX指数;巴黎CAC指数; 瑞士的苏黎士SMI指数;日本的日京指数;香港的恒生指数 2) 我国上海和深圳两个证券交易所 3) 上交所的综合指数和180指数 4) 深交所的成分股指数和综合指数 11.4 多指标综合评价指数 一. 在经济管理中,需要从检查计划、考核评分、验收定级等等多个不同的侧面进行全面的综合判断属于“综 合评价\". 二. 常规的综合评价方法有两种: 1) “简易计分法\",如体操比赛或歌唱竞赛中,裁判或评委给运动员或歌手评分时,采用“掐头去尾”的 处理(即去掉个别的最高分和最低分),然后计算平均分。 2) “参数指标法\",即首先选定几个主要方面的指标,然后以特定的方式将其结合起来,构成一个新的 评价指标. 三. 在编制综合评价指数的实践中,目前比较成熟、可行的方法主要有两种,即“标准比值法”和“功效系 数法”. 11.4.1 多指标综合评价指数的构建 一. 标准比值法 1) 构建标准比值综合评价指数的具体方法如下: ① 建立综合评价指标体系。 ② 确定评价公式。 ③ 确定各项指标的评价标准和权数. ④ 计算企业的个体指数和综合评价指数。 2) 例:已知下表,计算企业的个体指数和综合评价指数 企业经济效益表 参评指标 产品销售率 单位 % 标准值 97.48 实际值 98.50 权数 15 22 统计学复习资料 资金利税率 成本利润率 增加值率 劳动生产率 资金周转率 解:第一步:建立综合评价指标体系 % % % 元/人 次/年 13.55 8.41 29。00 6205 1.83 14.20 7。40 26.03 6852 1。95 30 15 10 10 20 我国采用的“工业经济效益综合指数”中规定了六项指标: 工业产品销售率、增加值率、 资金利税率、成本利润率、 全员劳动生产率(人均增加值)和资金周转率(流动资金周转次数)等。 第二步:确定评价公式 第三步:确定各项指标评价标准和权数 表1 我国工业经济效益综合指数的标准值和权数 参评指标 产品销售率 资金利税率 成本利润率 增加值率 劳动生产率 资金周转率 的权数. 第四步:计算企业的个体指数和综合评价指数。 表 2 企业经济效益综合指数计算表 参评指标 产品销售率 资金利税率 成本利润率 增加值率 劳动生产率 资金周转率 合 计 单位 % % % % 元/人 次/年 — 标准值 97.48 13。55 8.41 29.00 6205 1。83 — 实际值 个体指数(%) 权数 98.50 14。20 7.40 26。03 6852 1。95 - 101。05 104。80 87。99 89。76 110。43 106.56 - 15 30 15 10 10 20 - 指数×权数 15.1575 31。4400 13。1985 8.9760 11.0430 21.3120 101.1270 计量单位 % % % % 元/人 次/年 全国标准值 97.48 13。55 8.41 29.00 6205 1.83 权数 15 30 15 10 10 20 可以简单地用各项指标的中等水平作为单一“标准值”,并依据各项评价指标的重要性程度赋予相应 计算结果表明,企业经济效益综合评价指数为101。13。 二. 功效系数综合评价指数 1) 采用“功效系数法”编制综合评价指数的主要特点是:用满意值(xh)和不允许值(xs)来确定个体 指标的功效系数,通过加权平均法得到综合评指数.其基本公式如下: 式中,d为功效系数(个体指数),其计算方法为:,其中,Xi表示实际值,将计算值乘40加60的目的是使功效系数尽可能落在60~100之间。 23 统计学复习资料 2) 例:企业经济效益综合指数计算表 指标 满意值 不允许值 权数W 企业 85.2 10.3 6.8 25.5 5500 1.5 - 15 30 15 10 10 20 100 d lgd 2 lgdW/100 0.6 产品销售率 99.5 资金利税率 14.2 成本利润率 增加值率 资金周转率 综合指数 9.4 30 2 - 98.5 97.2 1.9877 0.2982 14.2 100 7.3 67.7 1.8305 0.2746 28 82.2 1.9150 0.1915 7020 95.8 1.9812 0.1981 1.4 52.0 1.7160 0.3432 - - - 1.905601 劳动生产率 7200 计算结果表明,企业经济效益综合评价指数为10的1。9056次方,即为80。35。 11.4.2 几种常用的综合评价指数 一. 物质生活质量指数(Physical Quality of Life Index) 1) 1975年在M·D·莫里斯的指导下,由美国海外开发委员会提出的,该指数正式公布于1977年 2) 测度一个国家人们基本需要的满足状况,进而从一个侧面反映社会的综合发展状况 3) PQLI由三个指标组成:婴儿死亡率、一岁的预期寿命和识字率 二. 社会进步指数(Index of Social Progress) 1) 美国的理查德·J·埃斯特思于1984年首次提出,1988年又提出加权社会进步指数 2) 指数中包括36项社会经济指标,内容涉及教育、健康、妇女地位、国防、经济、人口、地理、政治 参与、文化、福利成就等十个领域 三. 人的发展指数(Human Development Index) 1) 又称人文发展指数 2) 由联合国开发计划署在其《1990年人的发展报告》中提出的评价社会发展的方法 3) 分别选择预期寿命、成人识字率、按购买力平价(PPP)计算的实际人均GDP三个指标 24 因篇幅问题不能全部显示,请点此查看更多更全内容