统计图形

统计图形,又称为统计图统计学图形图解方法图解技术图解分析方法图解分析技术,是指统计学领域当中用于可视化定量数据信息图形。有时,人们也把统计图形与各种统计学表格统称为统计图表统计学图表

概述

 
安德森鸢尾花卉数据集双标图

统计学数据分析过程可大致分为两个组成部分:定量分析方法(Quantitative techniques)和图解分析方法(graphical techniques)。定量分析方法是指那套产生数值型或表格型输出的统计学操作程序;比如,包括假设检验方差分析点估计信賴區間以及最小二乘法回归分析。这些手段以及与此类似的其他技术方法全都颇具价值,属于是经典分析方面的主流[1]

另一方面,还有一大套我们一般称之为图解分析方法的统计学工具。这些工具包括散点图直方图概率图英语probability plot残差图英语residual plotresidual plot)、箱形图块图英语block plot以及双标图探索性数据分析Exploratory data analysis,EDA)就密切地依赖于这些手段以及与此类似的其他技术方法。图解分析操作程序不仅仅是在EDA背景下才使用的工具;在检验假设、模型选择统计模型验证英语统计模型验证、估计量(estimator)选择、关系确定、因素效应判定以及离群值英语outlier检出方面,此类图解分析工具还可以作为最佳捷径,用来深入认识数据集。此外,优质的统计图形还可以作为一种令人信服的沟通手段,用来向他人传达存在于数据之中的基本讯息[1]

图解式统计学方法具有四个方面的目标[2]:⑴ 探究数据集的内容;⑵ 用于发现数据之中的结构;⑶ 检查统计学模型之中的假设;⑷ 沟通传达分析结果。

如果不采用统计图形,也就会丧失深入认识数据基础结构之一个或多个方面的机会。

历史

 
三维饼图示例:欧盟各国拥有欧盟农田的百分比

统计图形的起源可以追溯到人们最早试图分析数据的活动,而如今这种技术方法已经成为科学发展的关键手段之一。早在十八世纪,人们就采用了许多为我们当前所熟悉的统计制图手段和形式,如二维地图英语Bivariate map示意地图条图以及坐标纸。人们对于下列四个问题的关注推动了统计图形技术方法的发展[3]

  • 十七世纪和十八世纪期间的空间组织问题
  • 十八世纪期间和十九世纪早期的离散比较问题
  • 十九世纪期间的连续分布问题
  • 十九世纪和二十世纪期间的多变量分布与相关问题

自1970年代以来,随着计算机图形学及其相关技术方法的复兴,统计图形目前已经东山再起,再度成为一种重要的分析工具。

示例

 
法国工程师查尔斯·约瑟夫·密纳德于1861年绘制的关于拿破仑入侵俄国信息图形

下列人物是一些著名统计图形的设计者:

参见

 
美国华盛顿州20号州道英语Washington State Route 20首次开放/最终关闭日期的概率图英语Probability plot[4]

参考文献

  1. ^ 1.0 1.1 (英文) 原文引自属于美国政府机构的国家标准与技术研究院公有领域出版物。
  2. ^ (英文)William G. Jacoby (1997). Statistical Graphics for Univariate and Bivariate Data: Statistical Graphics pp.2–4
  3. ^ (英文)James R. Beniger and Dorothy L. Robyn (1978). "Quantitative graphics in statistics: A brief history". In: The American Statistician. 32: pp. 1–11.
  4. ^ (英文)SR 20 - North Cascades Highway - Opening and Closing History. North Cascades Passes. Washington State Department of Transportation. 2009年10月 [2009-02-08]. (原始内容存档于2009-02-18). 

延伸阅读

外部链接