概率质量函数

PMF，統計學名詞

在机率论和统计学中，机率质量函数（probability mass function，简写作pmf）是离散随机变数在各特定取值上的机率^[1]。有时它也被称为离散密度函数。机率密度函数通常是定义离散机率分布的主要方法，并且此类函数存在于其定义域是离散的标量变数或多元随机变数（英语：Multivariate random variable）。

一个机率密度函数的图像。函数的所有值必须非负，且总和为1。

机率质量函数和机率密度函数的一个不同之处在于：机率质量函数是对离散随机变数定义的，本身代表该值的机率；机率密度函数本身不是机率，只有对连续随机变数的机率密度函数必须在某一个区间内被积分后才能产生出机率^[2]。

具有最大机率密度的随机变数的值称为众数。

数学定义

假设X是一个定义在可数样本空间S上的离散随机变数 S ⊆ R，则其机率质量函数 f_X(x) 为

f_{X}(x)={\begin{cases}\Pr(X=x),&x\in S,\\0,&x\in \mathbb {R} \backslash S.\end{cases}}

注意这在所有实数上，包括那些X不可能等于的实数值上，都定义了 f_X(x)。在那些X不可能等于的实数值上， f_X(x)取值为0 ( x ∈ R\S，取Pr(X = x) 为0)。

离散随机变数机率质量函数的不连续性决定了其累积分布函数也不连续。

例子

机率质量函数可以定义在任何离散随机变数上，包括常数分布, 二项分布（包括伯努利(Bernoulli)分布）, 负二项分布, 泊松(Poisson)分布, 几何分布以及超几何分布随机变数上.

有限

存在三个相关的主要分布，伯努利分布、二项式分布、和几何分布。

伯努利分布

伯努利分布：ber(p) ，用于对只有两种可能结果的实验进行建模。这两个结果通常编码为1和0。

$p_{X}(x)={\begin{cases}p,&{\text{if }}x{\text{ is 1}}\\1-p,&{\text{if }}x{\text{ is 0}}\end{cases}}$

一个伯努利分布的例子是抛硬币。假设X是抛硬币的结果，反面取值为0，正面取值为1。则在状态空间{0, 1}(这是一个伯努利(Bernoulli)随机变量)中，X = x的机率是0.5，所以机率质量函数是

$p_{X}(x)={\begin{cases}{\frac {1}{2}},&x\in \{0,1\},\\0,&x\notin \{0,1\}.\end{cases}}$

无限

以下呈指数下降的分布是具有无限数量可能结果的分布示例——所有正整数：

${\text{Pr}}(X=i)={\frac {1}{2^{i}}}\qquad {\text{for }}i=1,2,3,\dots$

尽管可能的结果有无限多，但总机率密度为 1/2 + 1/4 + 1/8 +⋯ = 1，满足机率分布的单位总机率要求。

多变量情况

两个或多个离散随机变量具有联合机率密度函数，它给出了随机变量的每个可能的实现组合的机率。

参见

参考文献

^ Stewart, William J. Probability, Markov Chains, Queues, and Simulation: The Mathematical Basis of Performance Modeling. Princeton University Press. 2011: 105 [2022-04-18]. ISBN 978-1-4008-3281-1. （原始内容存档于2022-04-18）.
^ A modern introduction to probability and statistics : understanding why and how. Dekking, Michel, 1946-. London: Springer. 2005. ISBN 978-1-85233-896-1. OCLC 262680588.

Template:机率分布理论

检索自“https://zh.wikipedia.org/w/index.php?title=概率质量函数&oldid=84718889”