2013年统计师考试时间为10月13日,为了帮助考生系统的学习统计师考试课程,全面了解统计师考试的教材重点,小编特编辑了2013年统计师考试统计基础理论及相关知识辅导资料,希望对您参加本次考试有所帮助!
统计数据的搜集
统计数据的搜集,涉及数据的计量尺度与类型、数据调查的组织方式与数据搜集的具体方法、调查方案的设计以及对数据的质量要求等内容。
一、统计数据的计量与类型
统计数据计量(Measurement,亦称测量)的质量,影响甚至决定统计描述和分析的质量。数据计量的准确程度,视所观察的客体及其标志的性质和测量工具而定。自然科学以物理、化学或力学的某些特征为观察现象,自然界的客体也比较稳定,而且大多有较精确的仪器作为测量工具。故自然科学的计量在精度上领先于社会科学。社会科学以人类行为、社会关系、价值观念等为研究对象,甚至涉及被研究者的隐私(Privacy),而不易得到研究对象的合作;即使有时研究对象给予合作,由于计量的原因,也很难取得准确的数据。所以,改进并确切运用测量工具,始终是社会工作者的一项重要工作。要改进并确切运用测量工具,获取令人满意的统计数据,首先就要考虑数据的计量尺度与类型。
(一)数据的计量尺度
在计量学的一般分类方法中,依据对事物计量的精确程度,可将所采用的计量尺度由低级到高级、由粗略到精确分为四个层次,即名类尺度、顺序尺度、区间尺度和比尺度。
1、名类尺度
名类尺度(Nominal scale,亦称分类尺度、列名尺度等)是这样一种品质标志,按照它可对研究客体进行平行的分类或分组,使同类同质,异类异质。例如,按照性别将人口分为男、女两类;按照经济性质将企业分为国有、集体、私营、混合制企业等。这里的“性别”和“经济性质”就是两种名类尺度。名类尺度是最粗略、计量层次最低的计量尺度,利用它只可测度事物之间的类别差,而不能了解各类之间的其他差别。名类尺度计量的结果表现为某种类别;但为了便于统计处理,例如为了计算和识别,也可用不同数字或编码表示不同类别。比如用1表示男,0表示女;用1表示国有企业,2表示集体企业,3表示私营企业,等等。这些数字只是不同类别的代码,决不意味着它区分了大小,更不能进行任何数学运算。名类尺度能对事物做最基本的测度,是其他计量尺度的基础。
2、顺序尺度
顺序尺度(Ordinal scale,亦称序数尺度、顺位尺度等)是这样一种品质标志,利用它不仅能将事物分成不同的类别,还可确定这些类别的等级差别或序列差别。例如“产品等级”就是一种测度产品质量好坏的顺序尺度,它可将产品分为一等品、二等品、三等品、次品等;“考试成绩”也是一种顺序尺度,它可将成绩分为优、良、中、及格、不及格等;“对某一事物的态度”作为一种顺序尺度,可将人们的态度分为非常同意、同意、保持中立、不同意、非常不同意,等等。显然,顺序尺度对事物的计量要比名类尺度精确些,但它至多测度了类别之间的顺序,而未测量出类别之间的准确差值。因此,顺序尺度的计量结果只能比较大小,不能进行加、减、乘、除等数学运算。
3、区间尺度
区间尺度(Interval scale,亦称间隔尺度、等距尺度、定距尺度等)是能测度事物类别或次序之间间距的数量标志,更具体些说,区间尺度是可将事物区分为不同类别,对这些类别进行排序,并较准确度量类别之间数量差距的一种计量尺度。该尺度通常使用自然或物理单位作为度量单位,如收入用人民币“元”度量,考试成绩用“百分制”度量,温度用摄氏或华氏的“度”来度量,重量用“克”度量,长度用“米”度量等。区间尺度的计量结果表现为数值。区间尺度的数值可做加、减法运算,例如,考试成绩80分与90分之间相差10分,一个地区的温度20°C与另一个地区的25°C相差5°C,等等。但不能做乘、除法运算。而且,区间尺度没有绝对零点。
4、比尺度
比尺度(Ratio scale,亦称为比率尺度)的计量结果也表示为数值,跟区间尺度属同一层次,有时对两者可不作区分。比尺度这种数量标志不仅能测度各类别的大小和多少,还有一个绝对零点(Absolute zero)作为起点。这个绝对零点是它跟区间尺度的明显差别,就是说,区间尺度中没有绝对零点,即使其计量值为“0”,这个“0”也是有客观内容的数值,即“0”水平,而不表示“没有”或“不存在”。例如,某个学生统计学的考试成绩为“0”分,这个“0”分是他的统计学的客观成绩,并不表示他没有考试成绩或没有任何统计学知识;一个地区的温度为0°C,这表示一种温度的水平,并不是说没有温度。而比尺度中绝对零点的“0”,表示“没有”或“不存在”。例如,一个人的身高为“0”米,表示这个人不存在;一个人的收入为“0”,表示这个人没有收入;一个产品的产量为“0”,表示没有这种产品;等等。现实中,大多数场合人们使用的都是比尺度。
比尺度与上述三种计量尺度相比还有一个特性,就是可以计算数值之间的比值。例如,一个人的月工资收入为600元,另一个人的为300元,可以得出一个人的收入是另一个的两倍。但区间尺度由于不存在绝对零点,就只能比较数值差,而不能计算比值。比如,可以说30°C与15°C之差为15°C,而不能说30°C比15°C热一倍。可见,比尺度可以做加、减、乘、除法运算。
上述四种计量尺度对事物的计量层次是由低级到高级、由粗略到精确,逐步递进的。高层次的计量尺度可以计量低层次计量尺度能够计量的事物,但不能反过来。显然,可以很容易地将高层次计量尺度的计量结果转化为低层次计量尺度的计量结果;将考试成绩的百分制转化为五等级分制就是一例。
(二)数据的类型
在第一章中,我们曾把统计标志分为品质标志和数量标志,这两种统计标志的标志表现在广义上都可叫做统计数据。更确切些说,在计量学的意义上,统计数据是采用某些计量尺度对事物进行计量的结果,但采用不同的计量尺度会得到不同类型的统计数据。就上述四种计量尺度计量的结果来看,我们可以大体上将统计数据分为两种类型:定性的数据和定量的数据。定性数据(Qualitative data,亦称品质数据)是说明事物的品质特征表现的具体类别,不能用数值表示;因这类数据由名类尺度和顺序尺度计量形成,故又可细分为名类数据和顺序数据。定量数据(Quantitative data,亦称数量数据)是说明现象数量特征表现的,能够甚至必须用数值来表现;因这类数据由区间尺度和比尺度计量形成,故又可细分为区间数据和比数据。对不同类型的数据,可采用不同的统计方法来处理和分析,比如,对定性数据一般只采用分组法计算,分析各组的频数或频率,而对定量数据则可用更多的统计方法去处理,计算、分析更多的统计指标或统计量。
在统计中,一般把表示现象某种特征的概念称为变量(Variable)。这样,统计标志和指标都可以称为变量。变量的具体表现称为变量值(Variate-value);统计标志的标志表现和指标数值都是变量值。如果一个变量的变量值由品质数据来记录,该变量就是品质变量(Qualitative variable),如“性别”就是个品质变量,其变量值是“男”或“女”;“产品等级”也是个品质变量,它可以表现为“一等品”、“二等品”、“三等品”、“次品”等。如果一个变量的数值由数量数据来记录,该变量就是数量变量或称数字变量(Quantitative variable),如“产品产量”、“商品销售额”、“零件尺寸”、“年龄”、“时间”等都是数量变量,它们可以表现为不同的数值。数量变量还可以细分为离散变量和连续变量。离散变量(Discrete variable)的取值是有限的,所有取值都以整位数断开,且可一一列举,如“企业数”、“产品数量”等就是离散变量。而连续变量(Continuous variable)的取值是无穷的,连续不断的,不能一一列举,如“年龄”、“温度”、“零件尺寸”等都是连续变量。另外,应该注意,多数情况下我们所说的变量是指数量变量,统计标志中的数量标志和所有的统计指标就是这种变量,大多数统计方法所处理的也都是数量变量,因此有时把数量变量就简称为变量。本书以后各章多沿用这种做法。
二、统计数据的调查方式和搜集方法
在本源上,统计数据都来自直接的调查或试验,这种来源的数据也被称为第一手或直接的统计数据。有时,别人调查或试验的数据也是使用者搜集统计数据的一个来源,当然,这种数据属第二手或间接的统计数据。但任何一种统计数据的获取都要进行适当的组织和运用具体的搜集方法。这里,我们着重讨论取得社会经济统计数据的主要调查组织方式和具体搜集方法。
(一)统计调查的组织方式
实际中常用的统计调查组织方式主要有普查、抽样调查、统计报表、重点调查和典型调查等。
1、普查。普查(Census)是为某一特定目的而专门组织的一次性全面调查方式,如人口普查、工业普查、农业普查等。世界各国一般都定期进行各种普查。普查适用于特定目的、特定对象,旨在搜集有关国情国力的基本统计数据,为国家制定有关政策或措施提供依据。它主要用于搜集处于某一时点状态上的社会经济现象的数量。普查作为一种特殊的调查组织方式有以下几个特点:
(1)普查通常是一次性或周期性的。普查涉及面广,调查单位多,要耗费大量的人力、物力和财力,所以间隔较长时间,如10年才进行一次。我国的人口普查从1953年到1990年共进行过4次。今后,我国的普查将规范化、制度化,每逢末尾为“0”的年份进行人口普查,末尾为“3”的年份进行第三产业普查,末尾为“5”的年份进行工业普查,末尾为“7”的年份进行农业普查,末尾为“1”或“6”的年份进行统计基本单位普查。
(2)普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。我国前四次人口普查的标准时间定为普查年份的7月1日0时,第五次人口普查为2000年11月1日0时。农业普查的标准时间定为普查年份的1月1日0时。标准时间一般定为调查对象比较集中、相对稳定的时期。
(3)普查的数据一般比较准确,规范化程度也高,因此可作为抽样调查和其他调查的依据。
(4)普查的使用范围较窄,只能调查一些最基本或特定的现象。
2、抽样调查。抽样调查(Sampling survey)是按照一定的概率从总体中抽取一部分单位构成样本,并根据样本信息推断总体数量特征的一种非全面调查。这是一种应用最为广泛的调查组织方式。抽样调查的内容将在后面设专章讨论。
3、统计报表。统计报表(Statistical report forms)是按照国家有关法规规定,自上而下统一布置,自下而上逐级填报的一种调查组织方式。这种调查组织方式在我国政府统计工作中,经过几十年的改进和完善,已形成了一套比较完备的统计报告制度,它要求以原始数据为基础,按照统一的表式、指标、报送时间和报送程序填报,已成为国家和地方政府部门获取统计数据的主要统计调查组织方式。
统计报表类型多样。统计报表按调查范围可分为全面报表和非全面报表;按报送时间可分为日报、月报、季报和年报等;按报送受体可分为国家、部门、地方统计报表。
4、重点调查。重点调查(Key-point investigation)是这样一种调查组织方式,它只从全部总体单位中选择少数重点单位进行调查,这些重点单位尽管在全部总体单位中出现的频数极少,但其某一数量标志却在所要研究的数量标志值总量中占有很大的比重。例如,要了解全国的钢铁生产总量,只要对产量很大的少数几个钢铁企业,如鞍钢、宝钢、首钢等进行调查,就可对全国的钢铁生产总量有个大致的认识。这几个产量很大的企业,构成了这次全国钢产量调查的重点单位,因为它们的钢铁产量,在全国的钢铁生产总量中占有很大比重。
5、典型调查。典型调查(Model survey)是从全部总体单位中选择一个或几个有代表性的单位进行深入细致调查的一种调查组织方式。典型调查的目的是通过典型单位来描述或揭示事物的本质或规律,因此所选择的典型单位应能反映所研究问题的本质属性或特征。例如,要研究工业企业的经济效益问题,可以在同行业中选择一个或几个经济效益突出的单位做深入细致的调查,从中找出经济效益好的原因和经验。典型调查主要用于定性研究,调查结果一般不能推断总体。
统计师考试报名时间 2012年统计师考试证书领取 报考条件 考试培训
(责任编辑:xll)
近期直播
免费章节课
课程推荐
统计师
[协议护航-退费班]
12大模块 准题库资料 协议退费校方服务
统计师
[协议护航-畅学班]
12大模块 准题库资料 协议续学校方支持
统计师
[丰羽计划-畅学班]
4大模块 题库练习 精品课程