Glicko評分系統
Glicko評分系統(英文:Glicko rating system)及Glicko-2評分系統(英文:Glicko-2 rating system)是評估選手在比賽中(如國際象棋及圍棋)的技術能力方法之一。此方法由馬克·格利克曼發明,原為國際象棋評分系統打造,後作為等級分評分系統的改進版本廣泛應用。格里克曼在此算法中的主要貢獻是「評分可靠性」(Ratings Reliability,簡稱RD),即評分標準差(Ratings Deviation)。
Glicko與Glicko-2評分系統被發表至公有領域。諸多在線遊戲伺服器(如《Pokémon Showdown》、《Lichess》、《自由互聯網國際象棋伺服器》、《Chess.com》、《在線圍棋伺服器 (頁面存檔備份,存於互聯網檔案館)》[1]、《絕對武力:全球攻勢》、《絕地要塞2》、《刀塔霸業》、《激戰2》、《Splatoon 2》及《皇輿爭霸》)和多個競技性編程比賽都採用此種評分方法。[2]Glicko所使用的算法可在其網站上找到。
算法中,評分可靠性用於測量選手的評分,一評分可靠性(評分標準差)相當於一標準差。舉個例子,一名評分為1500分的選手,其評分可靠性為50,表示有95%的可能性這名選手的真實實力約在1400至1600分(1500分的兩個標準差)之間。選手的實力區間需增加並減去評分中的兩個評分標準差來計算。在比賽結束後,選手的實力評分的波動根據評分標準差來計算:當選手的評分標準差較低(選手的評分已較為準確)或其對手的評分標準差較高時(對手的真實實力無法確定)時,選手的評分波動也較小。評分標準差將在比賽後減小,但將在一段時間不活躍後漸漸增大。
Glicko-2是Glicko評分系統的改進版本,引進了評分揮發度σ(Rating Volatility)的概念。澳大利亞國際象棋聯盟採用稍加修改版的Glicko-2評分系統。[3]
測量
下列評分流程僅適用於Glicko評分系統,不適用於Glicko-2。
若選手沒有評分,則其評分通常被設為1500,評分標準差為350。
測算標準差
新的評分標準差( )可使用舊的評分標準差( )計算:
為自上次比賽至現在的時間長度(評分期),350則是新選手的評分標準差。若選手在一個評分期間內進行了多場比賽,此算法會將進行的比賽作為一場看待。評分期根據選手進行比賽的頻繁程度,可能長至七個月,短至幾分鐘。常數 根據選手在特定時間段內的技術不確定性計算而來,計算方法可能通過數據分析,或是估算選手的評分標準差將在什麼時候達到未評分選手的評分標準差得來。若一名選手的評分標準差將在100個評分期間內達到350的不確定度,則評分標準差為50的玩家的常數 可通過解 的方式計算而來。[4]
或
測算新評分
在經過m場比賽後,選手的新評分可通過下列等式計算:
其中:
表示選手個人的評分;
表示每場比賽後的結果。勝利為1,平局為 ,失敗為0。
測算新評分標準差
原先用於計算評分標準差的函數應增大標準差值,進而反應模型中一定非觀察時間內,玩家的技術不確定性的增長。隨後,評分標準差將在幾場遊戲後更新:
另請參閱
參考文獻
外部連結
- 格里克曼教授的 Glicko 網站 (頁面存檔備份,存於互聯網檔案館)
- 微軟借鑑Glicko中的多個理念開發出的TrueSkill [1](頁面存檔備份,存於互聯網檔案館)評分系統
- forwardloop/glicko2s (頁面存檔備份,存於互聯網檔案館) Glicko-2的JVM實現
- RobKohr/glicko(頁面存檔備份,存於互聯網檔案館) Glicko-2的JavaScript實現
- mmai/glicko2js (頁面存檔備份,存於互聯網檔案館) Glicko-2的客戶端JavaScript及Node.js實現
- deepy/glicko2 (頁面存檔備份,存於互聯網檔案館) Glicko-2的Python實現
- sublee/glicko2 (頁面存檔備份,存於互聯網檔案館) Glicko-2的Python實現
- PlayerRatings (頁面存檔備份,存於互聯網檔案館) Glicko的R語言實現,由亞歷克·斯蒂芬森(Alec Stephenson)及傑夫·索納斯(Jeff Sonas)撰寫
- scala-glicko2(頁面存檔備份,存於互聯網檔案館) Glicko-2的Scala實現