概率

數學基本概念

概率(香港作机率,台湾作机率,旧称几率,又称机会率或然率),是对随机事件发生之可能性的度量[1],为数学概率论的基本概念;概率的值是一个在0到1之间的实数,也常以百分数来表示。

“概率”的各地常用名称
中国大陆概率
台湾机率
港澳机率
概率
日本、韩国汉字確率

概率常用来量化对于某些不确定命题的想法[2],命题一般会是以下的形式:“某个特定事件会发生吗?”,对应的想法则是:“我们可以多确定这个事件会发生?”。确定的程度可以用0到1之间的数值来表示,这个数值就是概率[3]。因此若事件发生的概率越高,表示我们越认为这个事件可能发生。像抛硬币就是一个简单的例子,正面朝上及背面朝上的两种结果看来概率相同,每个的概率都是1/2,也就是正面朝上及背面朝上的概率各有50%。

这些概念可以形成概率论中的数学公理(参考概率公理),在像数学统计学金融博弈论科学(特别是物理)、人工智能/机器学习计算机科学哲学学科中都会用到。概率论也可以描述复杂系统中的内在机制及规律性[4]

应用到具体问题,“概率”常常被用来视作是对某一事件是否发生(过)的“推测”。这种涵义下,在宏观世界(非量子力学情况)中,概率来源于信息的缺失,有效信息越多,对某一事件发生的把握度(概率)就越大,直至“必然发生”——例如理论上知道抛一枚硬币时的位置、受力情况,便可以计算出落下时正面还是反面,所知参数越精确,算得概率就能越接近1。但“混沌效应”仍然会制约收入概率的大小。

历史

第一个系统地推算概率的人是16世纪的卡尔达诺[5]。记载在他的著作Liber de Ludo Aleae中。书中关于概率的内容是由Gould从拉丁文翻译出来的。

Cardano的数学著作中有很多给赌徒的建议。这些建议都写成短文。例如:《谁,在什么时候,应该赌博?》、《为什么亚里士多德谴责赌博?》、《那些教别人赌博的人是否也擅长赌博呢?》等。

然而,首次提出系统研究概率的是在帕斯卡费马来往的一系列信件中。这些通信最初是由帕斯卡提出的,他想找费马请教几个关于由Chevalier de Méré提出的问题。Chevalier de Méré是一知名作家,路易十四宫廷的显要,也是一名狂热的赌徒。问题主要是两个:掷骰问题和比赛奖金应分配问题。

 
印度各地天灾风险概率

概念

在日常生活中,我们常常会遇到一些涉及可能性或发生机会等概念的事件(event)。一个事件的可能性或一个事件的发生机会是与数学有关的。例如:

“从一班40名学生中随意选出一人,这人是男生吗?”

事实上,人们问“……可能会发生吗?”时,他们是在关注这个事件发生的机会。在数学上,事件发生的机会可用一个数来表示。称该数为概率(Probability)。

我们日常所见所闻的事件大致可分为两种:

一种是确定性事件。确定性事件包含必然事件和不可能事件。 如太阳从东方升起,或者在标准大气压下,水在100℃时会沸腾。我们称这些事件为必然事件。 如掷一个点数只有1到6的骰子,向上一面的数字是7。我们称这些事件为不可能事件。

此外,有大量事件在一定条件下是否发生,是无法确定的。如明天的气温比今天低、掷一枚硬币得正面向上,又或者在下一年度的NBA比赛中,芝加哥公牛队会夺得全年总冠军。像以上可能发生也可能不会发生的事件称为随机事件。

理论

概率论是一种用正式的用语表达概率概念的方式,这些词语可以用数学及逻辑的规则处理,结果再变换到和原来问题有关的领域。

至少有两种成功的将概率公式化的理论,分别是柯尔莫哥洛夫公式化以及考克斯英语Cox公式化。在柯尔莫哥洛夫公式化(参考概率空间)中,用集合代表事件,概率则是对集合的测度。在考克斯定理英语Cox's theorem中,概率是不能再进一步分析的基元,强调在概率值及命题之间建立一致性的关系。在二种公式化方法中,概率公理都相同,只有一些技术细节不同。

有其他量度不确定性的方式,例如Dempster-Shafer理论英语Dempster–Shafer theory或是可能性理论英语possibility theory,但两者都有本质上的不同,无法和一般了解的概率论相容。

应用

概率的概念常常应用在生活中,例如风险评估及以金融市场的交易等。政府也在环境法中应用概率,称为路径分析(pathway analysis)。例如中东冲突可能会对油价有某程度的影响,而油价对世界经济可能会有涟漪效应的影响。某个油品交易商认为中东冲突会使油价上升或下降,并将他的意见提供给其他交易商。因此概率不是各自独立的进行评估,评估的过程也不一定合理。行为经济学就是描述团体迷思对定价、政策甚至和平或冲突的影响[6]

有关概率评估及组合的严谨方式也改变了社会。对大部分的社会大众而言,重要的是了解概率评估的方式以及概率和决策之间的关系。

概率理论另一个明显的应用是可靠度理论英语Reliability theory。像汽车及消费性产品会在产品开发时应用可靠度理论来减少产品失效的概率。失效概率会影响厂商在产品保用证上的决策[7]

自然语言处理中用的快取语言模型英语cache language model及其他语言模型等也属于是概率理论的应用。

数学处理

事件A的概率一般会写成P(A)、p(A)或Pr(A)[8]。概率的数学概念可延伸到无限的样本空间甚至不可数的样本空间,但需要用上概率测度的概念。

概率的公理化定义将概率的相关范畴从具体问题中抽象出来,从而可以在数学意义下考察概率的相关概念和由之引出的问题。以下给出概率的公理化定义:

设随机事件的样本空间为Ω,Ω的一个子集称为事件。对于Ω中的每一个事件A,都有实函数P(A),满足:

  1. 非负性: 
  2. 规范性: 
  3. 可数可加性:对可数个两两互斥事件{Ai}i∈N有: 

任意一个满足上述条件的函数P都可以作为样本空间Ω的概率函数,称函数值P(A)为Ω中事件A的概率。

表示概率

一个事件的概率值通常以一个介于0到1的实数表示。一个不可能事件其概率值为0,而确定事件其概率值则为1。 但反推并不一定成立,也就是说概率值为0的事件不表示它就是一个不可能事件,同理,概率值为1的事件不表示它就一定发生。例如,在一个正方形内作一条线段,由于这条线段的面积是0,所以一个此正方形内的点落在这条线段上的概率就是0,但它并不是不可能事件。

实际上大多数的概率值都是介于0与1之间的数,这个数示代表事件在'不可能发生'与'确定发生'之间的相对位置。事件的概率值越接近1,事件发生的机会就越高。

举例来说,假设两个事件有相同的发生概率,就像被抛掷而落地的铜板不是正面向上就是反面向上一样,但是我们不能说:每2次抛掷会出现1次,只能说事件发生的概率是平均每2次出现一次,或说是 "50%" 或 "1/2"。

分布

概率分布函数是一个把概率分配给事件或者命题的函数。对于任何一个事件或者命题,总有很多分配概率的方法,所以选择不同的分布等同于对一个问题中的事件或者命题作出不同的假设。

分布还可分为“离散”和“连续”的。

概率计算总结

概率计算总结
事件 概率
A  
非A  
A或B  
A和B  
B的情况下A的概率  

和随机的关系

牛顿力学的概念中,决定论的世界中,若所有条件都是已知,都没有任何概率性的成分在内(拉普拉斯的恶魔),不过有可能一些系统对初始条件敏感,敏感程度甚至到超过可能量测的范围。以俄罗斯轮盘为例,若手的施力,出力的时间等信息已知,轮盘最后停止的位置是可以计算而得的,不过此时需要知道轮盘的惯量及摩擦系数,球的质量、光滑度及圆度,出力过程中手速度的变化等。此时,相较于用牛顿力学的方式分析,概率性的描述可能更适合描述重复玩数次俄罗斯轮盘的结果。科学家发现在气体动力论中也有类似的情形,系统理论上是确定的,但因为气体分子个数约和阿伏伽德罗常数(≈6.022×1023 mol−1)量级相当,因此也只能用概率性的描述。

在描述量子理论时一定会用到概率论[9]。二十世纪初期,物理学界有一个革命性发现,所有次原子层级的物理过程有随机性,依循量子力学。物理的波函数是确定的,是数个状态的叠加,但根据哥本哈根诠释,观察会带来波函数塌缩,因此只能观察到其中一个状态。不过这种缺乏决定论的观点未受到所有人的同意。爱因斯坦在给马克斯·玻恩的信上提到“我相信上帝不会玩骰子。”[10]。而发现波函数的埃尔温·薛定谔认为量子力学只是内部决定论状态的统计近似[11]。在近代的诠释中,量子退相干有相当的概率性质。

译名

概率论在19世纪30年代就已传入中国,长期以来,其译名并无统一,曾用译名有“决疑”、“可遇率”、“或是率”、“或然率”、“适遇率”、“公算”、“几率”、“机率”、“或然率”、“概率”等,也有借用日本汉字词作“确率”的。[12]1935年国立编译馆将译名范围缩小到“概率”和“几率”两个。[12]其中“几率”的“几”表示“接近”,和“几乎”的“几”类似。[13]1964年中国科学院编写的《数学名词补编》确定使用“概率”作为正式译名。[12]大陆的物理学界在一段时间内仍然沿用“几率”,但于1988年的《物理学名词》中采用了与数学界一致的“概率”,“最可几的”相应地改称“最概然的”。[14]而现代台湾则选用了“机率”作为标准译名。一说“机率”的由来是因为“几率”的“几”含义被误认为是“机会”(英语为opportunity)的意思,进而误写成“机率”,但实际上“机率”也是早期译名之一,例如“万有文库”收录的《统计学原理》(Elements of Statistics鲍莱英语Arthur Lyon Bowley著,李植泉译)就使用了“机率”的译法。

参考文献

引用

  1. ^ "Probability" 互联网档案馆存档,存档日期2015-04-28.. Webster's Revised Unabridged Dictionary. G & C Merriam, 1913
  2. ^ "Kendall's Advanced Theory of Statistics, Volume 1: Distribution Theory", Alan Stuart and Keith Ord, 6th Ed, (2009), ISBN 978-0-534-24312-8
  3. ^ William Feller, "An Introduction to Probability Theory and Its Applications", (Vol 1), 3rd Ed, (1968),Wiley ,ISBN 978-0-471-25708-0
  4. ^ Probability Theory页面存档备份,存于互联网档案馆) The Britannica website
  5. ^ 機率空間 (1)機率論的誕生. 国科会高瞻自然科学教学资源平台. 2011-06-07 [2014-10-21]. (原始内容存档于2021-02-09) (中文). 
  6. ^ Singh, Laurie (2010) "Whither Efficient Markets? Efficient Market Theory and Behavioral Finance". The Finance Professionals' Post, 2010.
  7. ^ Gorman, Michael (2011) "Management Insights". Management Science [需要完整来源]
  8. ^ Olofsson (2005) Page 8.
  9. ^ Burgi, Mark (2010) "Interpretations of Negative Probabilities", p. 1.
  10. ^ Jedenfalls bin ich überzeugt, daß der Alte nicht würfelt. Letter to Max Born, 4 December 1926, in: Einstein/Born Briefwechsel 1916-1955页面存档备份,存于互联网档案馆).
  11. ^ Moore, W.J. Schrödinger: Life and Thought. Cambridge University Press. 1992: 479. ISBN 0-521-43767-9. 
  12. ^ 12.0 12.1 12.2 赖景耀. “概率”译名的演变. 数学教学研究. 1985, (01): 16 [2022-09-21]. (原始内容存档于2022-09-21). 
  13. ^ 梁北夕. “几率”“概率”“机率”,到底哪个对?. 咬文嚼字. 2020, (6): 9–10. 
  14. ^ 喀兴林. 国家审定的《物理学名词》简介. 大学物理. 1989, (10): 1–4. doi:10.16854/j.cnki.1000-0712.1989.10.001. 

书目

  • Olofsson, Peter (2005). Probability, Statistics, and Stochastic Processes, Wiley-Interscience. p. 504. ISBN 978-0-471-67969-1

外部链接

参见