为了帮助考生系统的复习2012年统计师考试课程全面的了解统计师考试教材的相关重点,小编特编辑汇总了2012统计师考试辅导资料,希望对您参加本次考试有所帮助!
统计数据的搜集、整理与显示
统计活动是从搜集个体统计数据(Data)开始的。这些数据可能是定量的,也可能是定性的,它们都是统计分析的素材。在做统计分析之前,还应对其进行加工整理和显示。
统计数据的搜集
统计数据的搜集,涉及数据的计量尺度与类型、数据调查的组织方式与数据搜集的具体方法、调查方案的设计以及对数据的质量要求等内容。
一、统计数据的计量与类型
统计数据计量(Measurement,亦称测量)的质量,影响甚至决定统计描述和分析的质量。数据计量的准确程度,视所观察的客体及其标志的性质和测量工具而定。自然科学以物理、化学或力学的某些特征为观察现象,自然界的客体也比较稳定,而且大多有较精确的仪器作为测量工具。故自然科学的计量在精度上领先于社会科学。社会科学以人类行为、社会关系、价值观念等为研究对象,甚至涉及被研究者的隐私(Privacy),而不易得到研究对象的合作;即使有时研究对象给予合作,由于计量的原因,也很难取得准确的数据。所以,改进并确切运用测量工具,始终是社会工作者的一项重要工作。要改进并确切运用测量工具,获取令人满意的统计数据,首先就要考虑数据的计量尺度与类型。
(一)数据的计量尺度
在计量学的一般分类方法中,依据对事物计量的精确程度,可将所采用的计量尺度由低级到高级、由粗略到精确分为四个层次,即名类尺度、顺序尺度、区间尺度和比尺度。
1、名类尺度
名类尺度(Nominal scale,亦称分类尺度、列名尺度等)是这样一种品质标志,按照它可对研究客体进行平行的分类或分组,使同类同质,异类异质。例如,按照性别将人口分为男、女两类;按照经济性质将企业分为国有、集体、私营、混合制企业等。这里的“性别”和“经济性质”就是两种名类尺度。名类尺度是最粗略、计量层次最低的计量尺度,利用它只可测度事物之间的类别差,而不能了解各类之间的其他差别。名类尺度计量的结果表现为某种类别;但为了便于统计处理,例如为了计算和识别,也可用不同数字或编码表示不同类别。比如用1表示男,0表示女;用1表示国有企业,2表示集体企业,3表示私营企业,等等。这些数字只是不同类别的代码,决不意味着它区分了大小,更不能进行任何数学运算。名类尺度能对事物做最基本的测度,是其他计量尺度的基础。
2、顺序尺度
顺序尺度(Ordinal scale,亦称序数尺度、顺位尺度等)是这样一种品质标志,利用它不仅能将事物分成不同的类别,还可确定这些类别的等级差别或序列差别。例如“产品等级”就是一种测度产品质量好坏的顺序尺度,它可将产品分为一等品、二等品、三等品、次品等;“考试成绩”也是一种顺序尺度,它可将成绩分为优、良、中、及格、不及格等;“对某一事物的态度”作为一种顺序尺度,可将人们的态度分为非常同意、同意、保持中立、不同意、非常不同意,等等。显然,顺序尺度对事物的计量要比名类尺度精确些,但它至多测度了类别之间的顺序,而未测量出类别之间的准确差值。因此,顺序尺度的计量结果只能比较大小,不能进行加、减、乘、除等数学运算。
3、区间尺度
区间尺度(Interval scale,亦称间隔尺度、等距尺度、定距尺度等)是能测度事物类别或次序之间间距的数量标志,更具体些说,区间尺度是可将事物区分为不同类别,对这些类别进行排序,并较准确度量类别之间数量差距的一种计量尺度。该尺度通常使用自然或物理单位作为度量单位,如收入用人民币“元”度量,考试成绩用“百分制”度量,温度用摄氏或华氏的“度”来度量,重量用“克”度量,长度用“米”度量等。区间尺度的计量结果表现为数值。区间尺度的数值可做加、减法运算,例如,考试成绩80分与90分之间相差10分,一个地区的温度20°C与另一个地区的25°C相差5°C,等等。但不能做乘、除法运算。而且,区间尺度没有绝对零点。
4、比尺度
比尺度(Ratio scale,亦称为比率尺度)的计量结果也表示为数值,跟区间尺度属同一层次,有时对两者可不作区分。比尺度这种数量标志不仅能测度各类别的大小和多少,还有一个绝对零点(Absolute zero)作为起点。这个绝对零点是它跟区间尺度的明显差别,就是说,区间尺度中没有绝对零点,即使其计量值为“0”,这个“0”也是有客观内容的数值,即“0”水平,而不表示“没有”或“不存在”。例如,某个学生统计学的考试成绩为“0”分,这个“0”分是他的统计学的客观成绩,并不表示他没有考试成绩或没有任何统计学知识;一个地区的温度为0°C,这表示一种温度的水平,并不是说没有温度。而比尺度中绝对零点的“0”,表示“没有”或“不存在”。例如,一个人的身高为“0”米,表示这个人不存在;一个人的收入为“0”,表示这个人没有收入;一个产品的产量为“0”,表示没有这种产品;等等。现实中,大多数场合人们使用的都是比尺度。
比尺度与上述三种计量尺度相比还有一个特性,就是可以计算数值之间的比值。例如,一个人的月工资收入为600元,另一个人的为300元,可以得出一个人的收入是另一个的两倍。但区间尺度由于不存在绝对零点,就只能比较数值差,而不能计算比值。比如,可以说30°C与15°C之差为15°C,而不能说30°C比15°C热一倍。可见,比尺度可以做加、减、乘、除法运算。
上述四种计量尺度对事物的计量层次是由低级到高级、由粗略到精确,逐步递进的。高层次的计量尺度可以计量低层次计量尺度能够计量的事物,但不能反过来。显然,可以很容易地将高层次计量尺度的计量结果转化为低层次计量尺度的计量结果;将考试成绩的百分制转化为五等级分制就是一例。
(二)数据的类型
在第一章中,我们曾把统计标志分为品质标志和数量标志,这两种统计标志的标志表现在广义上都可叫做统计数据。更确切些说,在计量学的意义上,统计数据是采用某些计量尺度对事物进行计量的结果,但采用不同的计量尺度会得到不同类型的统计数据。就上述四种计量尺度计量的结果来看,我们可以大体上将统计数据分为两种类型:定性的数据和定量的数据。定性数据(Qualitative data,亦称品质数据)是说明事物的品质特征表现的具体类别,不能用数值表示;因这类数据由名类尺度和顺序尺度计量形成,故又可细分为名类数据和顺序数据。定量数据(Quantitative data,亦称数量数据)是说明现象数量特征表现的,能够甚至必须用数值来表现;因这类数据由区间尺度和比尺度计量形成,故又可细分为区间数据和比数据。对不同类型的数据,可采用不同的统计方法来处理和分析,比如,对定性数据一般只采用分组法计算,分析各组的频数或频率,而对定量数据则可用更多的统计方法去处理,计算、分析更多的统计指标或统计量。
在统计中,一般把表示现象某种特征的概念称为变量(Variable)。这样,统计标志和指标都可以称为变量。变量的具体表现称为变量值(Variate-value);统计标志的标志表现和指标数值都是变量值。如果一个变量的变量值由品质数据来记录,该变量就是品质变量(Qualitative variable),如“性别”就是个品质变量,其变量值是“男”或“女”;“产品等级”也是个品质变量,它可以表现为“一等品”、“二等品”、“三等品”、“次品”等。如果一个变量的数值由数量数据来记录,该变量就是数量变量或称数字变量(Quantitative variable),如“产品产量”、“商品销售额”、“零件尺寸”、“年龄”、“时间”等都是数量变量,它们可以表现为不同的数值。数量变量还可以细分为离散变量和连续变量。离散变量(Discrete variable)的取值是有限的,所有取值都以整位数断开,且可一一列举,如“企业数”、“产品数量”等就是离散变量。而连续变量(Continuous variable)的取值是无穷的,连续不断的,不能一一列举,如“年龄”、“温度”、“零件尺寸”等都是连续变量。另外,应该注意,多数情况下我们所说的变量是指数量变量,统计标志中的数量标志和所有的统计指标就是这种变量,大多数统计方法所处理的也都是数量变量,因此有时把数量变量就简称为变量。本书以后各章多沿用这种做法
二、统计数据的调查方式和搜集方法
在本源上,统计数据都来自直接的调查或试验,这种来源的数据也被称为第一手或直接的统计数据。有时,别人调查或试验的数据也是使用者搜集统计数据的一个来源,当然,这种数据属第二手或间接的统计数据。但任何一种统计数据的获取都要进行适当的组织和运用具体的搜集
(责任编辑:xll)
近期直播
免费章节课
课程推荐
统计师
[协议护航-退费班]
12大模块 准题库资料 协议退费校方服务
统计师
[协议护航-畅学班]
12大模块 准题库资料 协议续学校方支持
统计师
[丰羽计划-畅学班]
4大模块 题库练习 精品课程