选择指标的方法
2.选择指标的方法
指标的选择是综合评价科学性的关键,这里主要介绍系统聚类分析法。
系统聚类分析是通过判断指标之间的亲疏程度来筛选指标的一种方法。其基本思想是:如果有两个指标的作用完全相同,那么,以统计分析中采用这两个指标与只用其中一个指标是没有太大区别的,因此,在指标体系容量有限的条件下,应该尽是减少相似程度较大的指标。
具体做法为:如果有n个指标,首先将每个指标看作一类,并根据指标亲疏程度进行归类。
描述指标间亲疏程度的指标有两种:一种为相关系数,我们可以计算每两个指标的相关系数,用以测度指标之间的相似程度,将相关系数最大的两个指标(两类)合并为一类;另一种是距离,将距离较近的指标合并为一类。
一般在利用相关系数表示类间相似程度时,要将其变换为距离d,以便维持距离越小则关系越密切的含义,可以取

在完成第一轮类(指标)合并之后,要重新计算类与类之间的距离,并椐以进行第二轮类(指标)的合并。
重复这一过程,直到将所有指标合并成一类为止,形成由小到大的分类系统。
整个聚类过程可以画成一张聚类图,用以反映各指标间的亲疏关系。我们可以根据这种关系确定指标体系包含指标的个数(类数)。
聚类结束后,每一类中选择哪个指标为代表呢?一种方法是,根据专业知识通过考察哪个指标更有代表性,哪个指标更容易测得来决定;另一种方法是,计算每一类中各指标之间的判别系数
的均值
,选择
值最大的指标作为代表指标,
为该类的指标个数。
以下通过具体算例来说明如何通过系统聚类分析法来筛选指标。
【系统聚类法例示】
表2-12的资料取自2002年《中国统计年鉴》中的表13-3,它用七个指标描述我国各地区全部国有及规模以上非国有工业企业的主要经济效益。这七个指标之间存在一定的相关关系,我们深度将相关性强的指标归并到一起,对指标进行聚类。
表2-12 各地区全部国有及规模以上非国有工业企业主要经济效益指标(2001年)
|
地 区 |
工 业 增加值率 (%) |
总资产贡献率 (%) |
资产负债率 (%) |
流动资产 周转次数 (次/年) |
工业成本 费用利润率 (%) |
全员劳动 生产率 (元/人.年) |
产品销售率 (%) |
|
北 京 |
25.82 |
7.28 |
55.29 |
1.48 |
4.63 |
69539 |
98.17 |
|
天 津 |
24.76 |
8.01 |
58.28 |
1.68 |
6.59 |
58984 |
98.02 |
|
河 北 |
33.03 |
8.85 |
63.25 |
1.79 |
5.26 |
45576 |
98.05 |
|
山 西 |
35.78 |
5.56 |
63.79 |
1.07 |
3.04 |
27988 |
97.06 |
|
内蒙古 |
37.05 |
5.79 |
58.44 |
1.33 |
2.44 |
37770 |
97.93 |
|
辽 宁 |
28.03 |
6.13 |
58.69 |
1.4 |
3.26 |
48170 |
97.33 |
|
吉 林 |
31.39 |
7.83 |
62.63 |
1.38 |
4.98 |
47306 |
96.94 |
|
黑龙江 |
51.06 |
18.34 |
59.02 |
1.49 |
26.69 |
68104 |
97.61 |
|
上 海 |
28.39 |
8.83 |
46.46 |
1.56 |
6.61 |
95393 |
98.83 |
|
江 苏 |
25.06 |
9.42 |
60.03 |
1.99 |
3.88 |
57177 |
97.06 |
|
浙 江 |
23.78 |
12.07 |
55.31 |
2.06 |
6.28 |
51127 |
96.97 |
|
安 徽 |
31.63 |
8.17 |
61.41 |
1.53 |
3.73 |
38548 |
98.16 |
|
福 建 |
29.72 |
8.52 |
56.76 |
1.91 |
4.47 |
54060 |
96.99 |
|
江 西 |
30.34 |
6.25 |
66.37 |
1.31 |
1.42 |
30623 |
97.6 |
|
山 东 |
30.93 |
11.45 |
60.28 |
2.12 |
6.61 |
55455 |
97.77 |
|
河 南 |
32.52 |
8.13 |
65.68 |
1.6 |
4.08 |
37225 |
97.89 |
|
湖 北 |
33.12 |
8.18 |
60.72 |
1.6 |
4.63 |
49138 |
97.6 |
|
湖 南 |
33.49 |
9.3 |
66.55 |
1.47 |
3.25 |
39081 |
98.72 |
|
广 东 |
26.63 |
8.7 |
56.01 |
1.89 |
4.49 |
64571 |
97.62 |
|
广 西 |
32.35 |
7.22 |
61.18 |
1.46 |
3.78 |
38564 |
97.18 |
|
海 南 |
29.75 |
7.12 |
59.93 |
1.31 |
3.86 |
55433 |
95.31 |
|
重 庆 |
28.73 |
6.63 |
62.72 |
1.21 |
2.28 |
36606 |
97.91 |
|
四 川 |
34.3 |
6.94 |
62.81 |
1.27 |
3.89 |
40330 |
98.01 |
|
贵 州 |
33.96 |
6.9 |
62.8 |
0.94 |
3.08 |
35649 |
95.73 |
|
云 南 |
50.3 |
14.74 |
54.14 |
1.24 |
8.99 |
82038 |
98.61 |
|
西 藏 |
53.08 |
5.22 |
23.82 |
0.74 |
18.88 |
32500 |
89.32 |
|
陕 西 |
34.35 |
7.1 |
66.01 |
1.16 |
5.19 |
39813 |
97.17 |
|
甘 肃 |
31.17 |
5.09 |
64.81 |
1.13 |
0.97 |
34485 |
96.99 |
|
青 海 |
37 |
4.62 |
69.76 |
0.86 |
2.73 |
50950 |
93.32 |
|
宁 夏 |
30.85 |
5.26 |
57.53 |
1.19 |
1.63 |
37661 |
96.78 |
|
新 疆 |
41.66 |
10.35 |
60.18 |
1.46 |
12.42 |
86193 |
99.08 |
资料来源:《中国统计年鉴》2002,表13-8。
首先依据表2-12中每个指标的所有取值,计算每两个指标(类)的相关系数,并建立相关矩阵(见表2-13),用以测度各指标(类)之间的相似程度。在相关矩阵的基础上依据
可得距离矩阵(见表2-14):
表2-13 相关矩阵
|
指标序号 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
1 2 3 4 5 6 7 |
1.000 0.332 -0.360 -0.504 0.711 0.075 -0.359 |
0.332 1.000 -0.049 0.484 0.645 0.577 0.374 |
-0.360 -0.049 1.000 0.096 -0.518 -0.235 0.520 |
-0.504 0.484 0.096 1.000 -0.027 0.358 0.517 |
0.711 0.645 -0.518 -0.027 1.000 0.381 -0.246 |
0.075 0.577 -0.235 0.358 0.381 1.000 0.339 |
-0.359 0.374 0.520 0.517 -0.246 0.339 1.000 |
表2-14 距离矩阵
|
指标序号 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
1 2 3 4 5 6 7 |
0 0.668 0.64 0.496 0.289 0.925 0.641 |
0.668 0 0.951 0.516 0.355 0.423 0.626 |
0.64 0.951 0 0.904 0.482 0.765 0.48 |
0.496 0.516 0.904 0 0.973 0.642 0.483 |
0.289 0.355 0.482 0.973 0 0.619 0.754 |
0.925 0.423 0.765 0.642 0.619 0 0.661 |
0.641 0.626 0.48 0.483 0.754 0.661 0 |
在表2-13中,类1(指标1)与类5(指标5)相关系数最大,在表2-14中,相比这下,类1(指标1)与类5(5指标)的距离最近,因此,首先将这两个指标合并为一个新类,称之为类8。
而后,重新计算类2、类3、类4、类6、类7、类8之间的相关系数与距离,再将此相关系数最大、距离最近的两个指标(两类)合并为一类。
重复这一过程,直至将所有指标合并成一类为止,形成由小到大的分类系统。
聚类过程如图2-2所示,图2-2反映出各指标间的亲疏关系。
图2-2 指标聚类图
我们可以根据图2-2所反映的各指标间的亲疏关系,确定指标体系包含指标的个数(类数),并根据指标的代表性与测定程度选择每一类中的代表指标。
如拟包含两个指标,那么,可以在1指标和5指标中选择出一个代表指标,在指标3、7、2、6、4中选择出一个代表的指标;
如拟包含三个指标,那么,可以在指标1和指标5中选择出一个代表指标,在指标3和指标7中选择出一个代表指标,在指标2、6、4中选择出一个代表指标;
如拟包含四个指标,那么,可以在指标1 和指标5中选择出一个代表指标,在指标3和指标7中选择出一个代表指标,在指标2和指标6中出一个代表的指标;并将指标4确定为第四个指标。
相关内容
编辑推荐
(责任编辑:)
近期直播
免费章节课
课程推荐
统计师
[协议护航-退费班]
12大模块 准题库资料 协议退费校方服务
统计师
[协议护航-畅学班]
12大模块 准题库资料 协议续学校方支持
统计师
[丰羽计划-畅学班]
4大模块 题库练习 精品课程