当前位置:

2012年初级统计师考试统计基础理论知识辅导(七)

发表时间:2012/3/1 15:09:31 来源:互联网 点击关注微信:关注中大网校微信
关注公众号

为了帮助考生系统的复习2012年统计师考试课程全面的了解统计师考试教材的相关重点,小编特编辑汇总了2012统计师考试辅导资料,希望对您参加本次考试有所帮助!

统计数据的整理

数据搜集来之后,要对其进行加工整理,以使之系统化、条理化,符合统计分析的要求。数据整理通常包括数据的预处理、分组或分类、汇总等,其中,编制频数分布是统计整理的重要内容。

一、数据的预处理

数据的预处理是在分组或分类之前对数据所做的审核、筛选和排序等。

(一)数据的审核与筛选

来自不同渠道的统计数据和不同类型的统计数据,在审核的内容和方法上也有差别。对于由直接调查取得的原始数据,要从完整性和准确性两方面去审核。完整性审核就是检查应调查的单位或个体有否遗漏,调查项目填写是否齐全等。准确性审核,一是看数据是否真实,与实际有无出入;二是看数据的登录、计算等是否有误。逻辑检查和计算检查是审核数据准确性的两种方法。逻辑检查就是从定性角度去看数据是否有悖逻辑,相互矛盾之嫌,故多用于审核名类数据和顺序数据。比如,中学文化程度的人所填的职业是大学教师,这就不符合逻辑了。计算检查是审核调查表中的各项数据在计算结果和计算方法上有无错误,故多用于对区间数据和比数据的审核。例如,检查各分项数字之和是否等于相应的合计数,各组频数之和是否等于1或100%,出现在不同表格上的同一指标数值是否相同等。

对于通过其他渠道取得的第二手数据,除了审核其完整性和准确性之外,还应审核其适用性和时效性。第二手数据可以来自多种渠道,有些数据可能是为特定目的,通过专门调查而取得的,或者是已经按特定目的的需要做了加工整理。对于这种数据,使用者首先应弄清数据的来源、口径以及有关背景材料,不能盲目生搬硬套。而且,有些时效性较强的问题,若取得的数据过于滞后,就失去了研究的意义,一般来说,应尽可能使用最新的统计数据。

对审核中发现的错误应尽可能予以纠正。如果对发现的错误无法纠正,或者有些数据不符合调查的要求而又无法弥补时,就要对数据进行筛选。数据筛选有两方面内容:一是将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,不符合特定条件的数据予以剔除。

(二)数据的排序

数据排序就是按一定顺序将数据排列,其目的是为了便于研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。排序还有助于对数据检查、纠错,为重新分组或归类提供依据。在某些场合,排序本身就是分析的目的之一,例如,美国的《财富》杂志每年都要排出世界500强企业,通过这一信息,经营者不仅能知道本企业所处的地位和差距,还可以了解到竞争对手的状况,从而有效地制定本企业的发展规划和战略目标。

名类数据,如果是字母型数据,排序有升序与降序之分,升序更常见些,因为升序跟字母的自然排列相同;如果是汉字型数据,排列方式很多,比如按汉字的首位拼音字母排列,这与字母型数据的排序完全一样,也可按笔画顺序,其中也有笔画多少的升序与降序之分。交替运用不同方式排序,在汉字型数据的检查、纠错中十分有用。区间数据和比数据的排序只有两种,即递增和递减。设一组数据为 ,递增排序后可表示为: ;递减排序后可表示为: 。排序后的数据亦称为顺序统计量(Order statistics)。无论是定性数据还是定量数据,其排序均可借助计算机完成。

二、统计分组

数据经过预处理后,可进一步做分组整理。统计分组是数据整理中的一项重要工作,统计分组的好坏直接影响着统计分析的质量

(一)统计分组的概念和原则

统计分组就是根据统计研究的目的和客观信息的特点,按某个标志(或几个标志)把被研究的总体划分为若干个既有区别,又有联系的组成部分。统计分组的对象是总体。统计分组所依据的标志可能是品质标志,也可能是数量标志。品质标志包括名类尺度和顺序尺度;数量标志则有区间尺度和比尺度。

统计分组兼有分和合双重含义。对总体而言是“分”,即把总体分为性质相异的若干部分;而对单位而言又是“合”,即把性质相同的许多单位连接在一起。对于分组标志来说是“分”,即把其各种各样的标志表现分为若干个组;而对于其他标志来说则是“合”,即在一个组内的各个单位即使其他标志表现不相同也要结合在一起。由此可见,选择一种分组方法,突出了一种差异,但同时也会掩盖其他差异。不同的分组方法,可能得出不同的结论。缺乏科学根据的分组,不但不能显示事物的根本特征,甚至会把不同性质的事物混淆在一起,歪曲事物的内在联系。因此,统计分组必须先对所研究现象的本质作全面深刻的分析,确定所研究现象类型的属性及其内部差别,而后才能选择反映事物本质的正确的分组标志。

统计分组必须遵循两个原则,即穷尽原则和互斥原则。所谓穷尽原则,就是使总体中的每一个单位都有组可归,或者说,各分组的空间足以容纳总体所有的单位。举例说,如果将从业人员按文化程度分组,分为小学毕业、中学毕业(含中专)和大学毕业三组,那么,那些文盲或识字不多的以及大学以上的学历者则无组可归。但若将分组调整为文盲及识字不多、小学毕业、中学毕业、大学及大学以上毕业等这样几组,就可以涵盖全部从业人员中各种层次的文化程度,这就符合了分组的穷尽原则。

所谓互斥原则,就是在特定的分组标志下,总体中的任何一个单位只能归属在某一组,而不能同时归属于几个组。例如,某商场若把服装分为女装、男装和童装三类,就不符合互斥原则,因为童装也有男、女之分。如果先把服装分为成年与儿童两类,然后每类再分为男、女两组,这就符合互斥原则了。

(二)统计分组的种类

1、按分组标志的多少,可分为简单分组和复合分组。简单分组是对总体按一个标志分组,它只能从某一方面反映总体的分布状况或内部结构。许多简单分组从不同侧面说明同一总体,就构成一个平行分组体系有时,要同时使用两个或两个以上标志依序层叠起来对总体进行分组,这种分组就是复合分组;复合分组本身就构成一个复合分组体系。

2、按分组标志的性质不同,分为品质分组(亦称属性分组)和数量分组(亦称变量分组)。品质分组就是按品质标志进行分组;对名类数据和顺序数据采用品质分组。数量分组就是按数量标志进行分组;对区间数据和比数据采用数量分组。品质分组所形成的统计数列称为品质数列;数量分组所形成的统计数列称为变量数列。

3、按分组的作用和任务不同,分为类型分组、结构分组和分析分组。把复杂的现象总体分为若干个不同属性的部分,就是类型分组。社会经济统计经常采用这种分组。例如,我国全社会消费品零售额分为国有及国有控股商业零售额、集体商业零售额、私营及个体商业零售额和其他类型商业零售额。

在对总体分组的基础上,计算出各组数值对总体的比重,藉此研究总体内部的构成,就是结构分组。类型分组与结构分组往往紧密地联系在一起。

为研究现象之间依存关系而进行的统计分组,就是分析分组。分析分组的分组标志称为原因标志,与原因标志相对应的标志称为结果标志。找到原因标志表现与结果标志表现之间的数量联系,是统计分析经常要做的工作。例如,经常用分组分析法来研究职工技术熟练程度与劳动生产率、商业企业规模与商品流通费用率之间的依存关系。

相关文章:

2012年初级统计师考试统计基础理论知识辅导汇总

2012年统计师考试《统计工作实务》辅导讲义

关注:初级统计师报考科目   初级统计考试题   统计师考试网   最新考试动态  考试培训

(责任编辑:xll)

2页,当前第1页  第一页  前一页  下一页
最近更新 考试动态 更多>

近期直播

免费章节课

课程推荐

      • 统计师

        [协议护航-退费班]

        12大模块 准题库资料 协议退费校方服务

        4800起

        初级 中级

        761人正在学习

      • 统计师

        [协议护航-畅学班]

        12大模块 准题库资料 协议续学校方支持

        2980起

        初级 中级

        545人正在学习

      • 统计师

        [丰羽计划-畅学班]

        4大模块 题库练习 精品课程

        1680起

        初级 中级

        445人正在学习

      各地资讯