数值型数据的整理与显示
(一)数据的分组
数据分组就是根据统计研究的需要,将数据按照某种标准划分成不同的组别。分组后再计算出各组中出现的次数或频数,形成一张频数分布表。分组的方法有单变量值分组和组距分组两种。单变量值分组是把每一个变量值作为一组,这种分组方法通常只适合于离散变量且变量较少的情况。
组距分组是将全部的变量值,划分为若干个不同的区间。
采用组距分组需要经过以下几个步骤:
确定组限时应注意:第一,第一组的下限值应比最小的观察值小一点,最后一组的上限值应比最大的观察值大一点。第二,特别需要或不得已的情况除外,最好不要使用开口组。第三,组限应取得美观些,按数字编好,组限值应能被5除尽,且一般要用整数表示。
第六步,确定各组观察值出现的频数。
为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的观察值不算在本组内,而计算在下一组内。

(二)数值型数据的图示
1.直方图
直方图是用矩形的宽度和高度来表示频数分布的图形。在平面直角坐标中,我们用横轴表示数据分组,纵轴表示频数或频率。
对于等距分组的数据,我们可以用矩形的高度直接表示频数的分布。如果是不等距分组数据,用矩形的高度来表示各组频数的分布就不再适用。直方图下的总面积等于1。
直方图与条形图不同,条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别是)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,因此其高度与宽度均有意义。此外,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
2.折线图(频数多边形图)
折线图也称频数多边形图,它是在直方图的基础上,把直方图顶部的中点用直线连接起来,再把原来的直方图抹掉就是折线图。
上面介绍的品质数据的整理与图示方法,也都适用于数值型数据的整理与显示。但数值型数据还有一些特定的整理和图示方法,并不适用于品质数据。
相关推荐:
(责任编辑:)