數據可視化

与视觉传达含义相同的现代概念

數據可視化(英語:Data visualization)被許多學科視為與視覺傳達含義相同的現代概念。它涉及到數據可視化表示的創建和研究。[1]

為了清晰有效地傳遞信息,數據可視化使用統計圖形圖表信息圖表和其他工具。可以使用點、線或條對數字數據進行編碼,以便在視覺上傳達定量信息。[2] 有效的可視化可以幫助用戶分析和推理數據和證據。它使複雜的數據更容易理解和使用。用戶可能有特定的分析任務(如進行比較或理解因果關係),以及該任務要遵循的圖形設計原則。表格通常用於用戶查找特定的度量,而各種類型的圖表用於顯示一個或多個變量的數據中的模式或關係。

數據可視化既是一門藝術也是一門科學。[3] 有些人認為它是描述統計學的一個分支,但也有些人認為它是一個紮根理論開發工具。互聯網活動產生的數據量的增加和環境中傳感器數量的增加被稱為"大數據"或物聯網。處理、分析和交流這些數據對數據可視化來說是道德和分析方面的挑戰。[4] 數據科學領域和被稱為數據科學家的從業人員可以幫助應對這一挑戰。[5]

概述

數據可視化主要旨在藉助於圖形化手段,清晰有效地傳達與溝通信息。但是,這並不就意味着,數據可視化就一定因為要實現其功能用途而令人感到枯燥乏味,或者是為了看上去絢麗多彩而顯得極端複雜。為了有效地傳達思想概念,美學形式與功能需要齊頭並進,通過直觀地傳達關鍵的方面與特徵,從而實現對於相當稀疏而又複雜的數據集的深入洞察。然而,設計人員往往並不能很好地把握設計與功能之間的平衡,從而創造出華而不實的數據可視化形式,無法達到其主要目的,也就是傳達與溝通信息[6]

數據可視化與信息圖形信息可視化科學可視化以及統計圖形密切相關。當前,在研究、教學和開發領域,數據可視化乃是一個極為活躍而又關鍵的方面。「數據可視化」這條術語實現了成熟的科學可視化領域與較年輕的信息可視化領域的統一[7]

歷史

 
法國工程師查爾斯·約瑟夫·密納德於1861年繪製的關於拿破崙帝國入侵俄羅斯的信息圖

數據可視化領域的起源可以追溯到1950年代初的。當時,人們利用計算機創建出了首批圖形圖表。1987年,由布魯斯·麥考梅克英語Bruce H. McCormick湯姆斯·蒂凡提英語Thomas A. DeFanti瑪克辛·布朗英語Maxine D. Brown所編寫的美國國家科學基金會報告《Visualization in Scientific Computing》(意為「科學計算之中的可視化」)[8],對於這一領域產生了大幅度的促進和刺激。這份報告之中強調了新的基於計算機的可視化技術方法的必要性。隨着計算機運算能力的迅速提升,人們建立了規模越來越大,複雜程度越來越高的數值模型,從而造就了形形色色體積龐大的數值型數據集。同時,人們不但利用醫學掃描儀和顯微鏡之類的數據採集設備產生大型的數據集,而且還利用可以保存文本、數值和多媒體信息的大型數據庫來收集數據。因而,就需要高級的計算機圖形學技術與方法來處理和可視化這些規模龐大的數據集[7]

短語「Visualization in Scientific Computing」(意為「科學計算之中的可視化」)後來變成了「Scientific Visualization」(即「科學可視化」),而前者最初指的是作為科學計算之組成部分的可視化:也就是科學與工程實踐當中對於計算機建模模擬的運用。更近一些的時候,可視化也日益尤為關注數據,包括那些來自商業財務行政管理數字媒體等方面的大型異質性數據集合。1990年代初,人們發起了一個新的,稱為「信息可視化」的研究領域,旨在為許多應用領域之中對於抽象的異質性數據集的分析工作提供支持。因此,目前人們正在逐漸接受這個同時涵蓋科學可視化信息可視化領域的新生術語「數據可視化」[7]

自那時起,數據可視化就是一個處於不斷演變之中的概念,其邊界在不斷地擴大;因而,最好是對其加以寬泛的定義。數據可視化指的是技術上較為高級的技術方法,而這些技術方法允許利用圖形、圖像處理計算機視覺以及用戶界面,通過表達、建模以及對立體、表面、屬性以及動畫的顯示,對數據加以可視化解釋。與立體建模之類的特殊技術方法相比,數據可視化所涵蓋的技術方法要廣泛得多[9]

數據可視化的適用範圍

 
北京地鐵2015年規劃圖
 
手繪心智圖

關於數據可視化的適用範圍,目前存在着不同的劃分方法。一個常見的關注焦點就是信息的呈現。例如,邁克爾·弗蘭德利(2008)提出了數據可視化的兩個主要的組成部分:統計圖形主題圖[1]。另外,《Data Visualization: Modern Approaches》(意為「數據可視化:現代方法」,2007)一文則概括闡述了數據可視化的下列主題[10]

所有這些主題全都與圖形設計和信息表達密切相關。


另一方面,Frits H. Post(2002)則從計算機科學的視角,將這一領域劃分為如下多個子領域[7]

  • 可視化算法與技術方法
  • 立體可視化
  • 信息可視化
  • 多分辨率方法
  • 建模技術方法
  • 交互技術方法與體系架構

數據可視化的成功應歸於其背後基本思想的完備性:依據數據及其內在模式和關係,利用計算機生成的圖像來獲得深入認識和知識。其第二個前提就是利用人類感覺系統的廣闊帶寬來操縱和解釋錯綜複雜的過程、涉及不同學科領域的數據集以及來源多樣的大型抽象數據集合的模擬。這些思想和概念極其重要,對於計算科學與工程方法學以及管理活動都有着精深而又廣泛的影響。《Data Visualization: The State of the Art》(意為「數據可視化:尖端技術水平」)一書當中重點強調了各種應用領域與它們各自所特有的問題求解可視化技術方法之間的相互作用[7]

相關領域

 
核醫學成像:心臟SPECT英語SPECT圖像(短軸視圖)與心臟三維模型的融合
 
利用2004年來自哈伯太空望遠鏡的照片以及地基圖像所編制合成的螺旋星雲可見光圖像。
 
全球氣溫分布圖

數據採集

數據採集(有時縮寫為DAQDAS),又稱為「數據獲取」或「數據收集」,是指對現實世界進行採樣,以便產生可供計算機處理的數據的過程。通常,數據採集過程之中包括為了獲得所需信息,對於信號波形進行採集並對它們加以處理的步驟。數據採集系統的組成元件當中包括用於將測量參數轉換成為電信號傳感器,而這些電信號則是由數據採集硬件來負責獲取的。

數據分析

數據分析是指為了提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。數據分析與數據挖掘密切相關,但數據挖掘往往傾向於關注較大型的數據集,較少側重於推理,且常常採用的是最初為另外一種不同目的而採集的數據。在統計學領域,有些人將數據分析劃分為描述性統計分析探索性數據分析以及驗證性數據分析;其中,探索性數據分析側重於在數據之中發現新的特徵,而驗證性數據分析則側重於已有假設的證實或證偽。

數據分析的類型包括:

  • 探索性數據分析:是指為了形成值得假設的檢驗而對數據進行分析的一種方法,是對傳統統計學假設檢驗手段的補充。該方法由美國著名統計學家約翰·圖基命名。
  • 定性數據分析:又稱為「定性資料分析」、「定性研究」或者「質性研究資料分析」,是指對諸如詞語、照片、觀察結果之類的非數值型數據(或者說資料)的分析。

數據治理

數據治理涵蓋為特定組織機構之數據創建協調一致的企業級視圖(enterprise view)所需的人員、過程和技術;數據治理旨在:

  • 增強決策制定過程中的一致性與信心
  • 降低遭受監管罰款的風險
  • 改善數據的安全性
  • 最大限度地提高數據的創收潛力
  • 指定信息品質責任

數據管理

數據管理,又稱為「數據資源管理」,包括所有與管理作為有價值資源的數據相關的學科領域。對於數據管理,DAMA所提出的正式定義是:「數據資源管理是指用於正確管理企業或機構整個數據生命周期需求的體系架構、政策、規範和操作程序的制定和執行過程」。這項定義相當寬泛,涵蓋了許多可能在技術上並不直接接觸低層數據管理工作(如關係數據庫管理)的職業

數據挖掘

數據挖掘是指對大量數據加以分類整理並挑選出相關信息的過程。數據挖掘通常為商業智能組織和金融分析師所採用;不過,在科學領域,數據挖掘也越來越多地用於從現代實驗與觀察方法所產生的龐大數據集之中提取信息。

數據挖掘被描述為「從數據之中提取隱含的,先前未知的,潛在有用信息的非凡過程」[11],以及「從大型數據集或數據庫之中提取有用信息的科學」[12]。與企業資源規劃相關的數據挖掘是指對大型交易數據集進行統計分析和邏輯分析,從中尋找可能有助於決策制定工作的模式的過程[13]

參考文獻

  1. ^ 1.0 1.1 Michael Friendly (2008). "Milestones in the history of thematic cartography, statistical graphics, and data visualization"頁面存檔備份,存於網際網路檔案館).
  2. ^ Stephen Few-Perceptual Edge-Selecting the Right Graph for Your Message-2004 (PDF). [2019-04-28]. (原始內容存檔 (PDF)於2014-10-05). 
  3. ^ Manuela Aparicio and Carlos J. Costa. Data visualization. Communication Design Quarterly Review. November 2014, 3 (1): 7–11. doi:10.1145/2721882.2721883. 
  4. ^ Nikos Bikaks (2018) "Big Data Visualization Tools" Encyclopedia of Big Data Technologies, Springer 2018.
  5. ^ Press, Gil. A Very Short History Of Data Science. [2019-04-28]. (原始內容存檔於2017-09-11). 
  6. ^ (英文) "Data Visualization and Infographics"頁面存檔備份,存於網際網路檔案館) in: Graphics, Monday Inspiration, January 14th, 2008.
  7. ^ 7.0 7.1 7.2 7.3 7.4 (英文) Frits H. Post, Gregory M. Nielson and Georges-Pierre Bonneau (2002). Data Visualization: The State of the Art 網際網路檔案館存檔,存檔日期2009-10-07..
  8. ^ (英文) Bruce H. McCormick英語Bruce H. McCormick, Thomas A. DeFanti英語Thomas A. DeFanti and Maxine D. Brown英語Maxine D. Brown (eds.) (1987). Visualization in Scientific Computing. ACM Press
  9. ^ (英文)Paul Reilly, S. P. Q. Rahtz (eds.) 1992. Archaeology and the Information Age: A Global Perspective. p.92.
  10. ^ (英文)"Data Visualization: Modern Approaches"頁面存檔備份,存於網際網路檔案館). in: Graphics, August 2nd, 2007
  11. ^ (英文)W. Frawley and G. Piatetsky-Shapiro and C. Matheus. Knowledge Discovery in Databases: An Overview. AI Magazine. Fall 1992: pp. 213–228. ISSN 0738-4602. 
  12. ^ (英文)D. Hand, H. Mannila, P. Smyth. Principles of Data Mining. MIT Press, Cambridge, MA. 2001. ISBN 0-262-08290-X. 
  13. ^ (英文)Ellen Monk, Bret Wagner. Concepts in Enterprise Resource Planning, Second Edition. Thomson Course Technology, Boston, MA. 2006. ISBN 0-619-21663-8. 

延伸閱讀

  • (英文)Chandrajit Bajaj, Bala Krishnamurthy (1999). 'Data Visualization Techniques.
  • (英文)William S. Cleveland (1993). Visualizing Data. Hobart Press.
  • (英文)William S. Cleveland (1994). The Elements of Graphing Data. Hobart Press.
  • (英文)Alexander N. Gorban, Balázs Kégl and Andrey Zinovyev (2007). Principal Manifolds for Data Visualization and Dimension Reduction.
  • (英文)John P. Lee and Georges G. Grinstein (eds.) (1994). Database Issues for Data Visualization: IEEE Visualization '93 Workshop, San Diego.
  • (英文)Peter R. Keller and Mary Keller (1993). Visual Cues: Practical Data Visualization.
  • (英文)Frits H. Post, Gregory M. Nielson and Georges-Pierre Bonneau (2002). Data Visualization: The State of the Art.

外部連結

參見

軟件程序/可視化用於程序/圖形學工具箱
組織機構