Skip to Content

统计

统计研究数据的收集、整理、描述和分析。高二统计的关键,不是只会算平均数和方差,而是要知道“数据能说明什么,不能说明什么”。很多题真正考的是判断力。

学习目标

  • 理解抽样、频率、平均数、方差、相关关系等概念。
  • 会读频率分布表、直方图和散点图。
  • 会用统计量描述数据集中趋势和离散程度。
  • 能区分相关关系和因果关系。

核心概念

1. 统计先看数据来源

做统计题时,要先问:

  • 样本是怎么抽的?
  • 样本是否有代表性?
  • 样本量够不够?

如果抽样本身有偏差,后面算得再精确,结论也可能站不住。

2. 平均数和方差分别说明什么

  • 平均数反映数据的集中位置;
  • 方差反映数据的波动大小。

只看平均数,不看方差,容易得出片面结论。

知识点详解

数据分析的一般流程

收集数据整理图表计算统计量解释趋势作出判断\text{收集数据} \rightarrow \text{整理图表} \rightarrow \text{计算统计量} \rightarrow \text{解释趋势} \rightarrow \text{作出判断}

频率分布

频率是频数与总数的比值:

频率=频数总数\text{频率}=\frac{\text{频数}}{\text{总数}}

频率分布表和直方图常用来观察数据大致集中在哪些范围、分布是否均匀、是否存在明显偏态。

相关关系与回归

若散点图中的点大致沿某种趋势分布,可认为两个变量有相关关系。

但要注意:

相关因果\text{相关} \neq \text{因果}

回归模型只是描述趋势,不自动说明一个变量一定导致另一个变量变化。

典型例题

例题 1:求平均数

求数据

2,4,6,82,4,6,8

的平均数。

解析:

先求和:

2+4+6+8=202+4+6+8=20

共有 4 个数据,所以平均数为

204=5\frac{20}{4}=5

答案:

55

例题 2:比较方差大小的意义

若两组数据平均数相同,但甲组方差更大,说明什么?

解析:

平均数相同说明中心位置接近,但方差更大说明数据离平均数更分散,波动更明显。

答案:

说明甲组数据更不稳定、波动更大。

例题 3:根据散点图判断趋势

若散点图中的点大致沿一条上升直线分布,说明什么?

解析:

说明两个变量大致存在正向线性相关趋势。一个增大时,另一个也倾向于增大。

但这并不自动推出因果关系。

答案:

说明二者可能具有正向线性相关趋势。

易错点

易错点为什么错正确理解
样本不具代表性却直接推广总体忽略抽样偏差统计结论依赖样本质量
只看平均数没看波动情况还要结合方差或数据分布
把相关说成因果只看趋势不看机制统计通常先说明“有关联”,不轻易说“导致”
图表读数粗糙不会从图中提取信息先看横轴、纵轴、组距、频率含义

规则总结

平均数=数据总和数据个数\text{平均数}=\frac{\text{数据总和}}{\text{数据个数}} 频率=频数总数\text{频率}=\frac{\text{频数}}{\text{总数}} 方差越大,数据波动越大\text{方差越大,数据波动越大} 相关不等于因果\text{相关不等于因果}

练习题

  1. 求数据
1,3,5,7,91,3,5,7,9

的平均数。 2. 说明“方差较大”通常意味着什么。 3. 若两组数据平均数相同,但一组方差明显更小,哪一组更稳定? 4. 说明为什么问卷只调查一个班级,往往不能直接代表全年级。 5. 散点图中的点若大致沿下降趋势分布,可以说明什么?

参考答案

1+3+5+7+95=5\frac{1+3+5+7+9}{5}=5
  1. 说明数据更分散、波动更明显。
  2. 方差更小的一组更稳定。
  3. 因为样本范围太小,可能不具有代表性,容易产生抽样偏差。
  4. 可以说明两个变量可能存在负相关趋势,但不能直接推出因果关系。

关联知识

统计与 概率 一起构成高二的数据分析基础,也经常出现在实际情境题和建模类题目中。