哈佛架構

哈佛架構(英語:Harvard architecture)是一種將程序指令與數據儲存分別存儲、分別使用數據總線的計算機架構[1]。這一架構經常拿來與馮諾伊曼架構做對比,後者的程序指令與數據共享存儲與總線。哈佛架構經常被用於實時處理及低功耗應用[2][3]

哈佛結構

「哈佛架構」一詞通常被描述為起源於Harvard I 型 繼電器式計算機[4],它在紙帶上存儲24位指令、在機電計數器上存儲數據。早期機型將數據存儲器整個包含在中央存儲器中,並且無法以數據的形式獲取指令存儲。程序需要由操作員載入,處理器也不能將自身初始化。然而,在唯一經由同行評議的相關論文——出版於IEEE計算史年鑑的《哈佛架構的迷思》[5]中,作者卻這樣闡釋:

「在微控制器設計領域,『哈佛架構』這一名詞在數十年後才被創造」且僅僅是「追加給哈佛計算機,隨後又將獨立緩存的RISC微處理器冠以此名」

「所謂的『哈佛』與『馮諾伊曼』架構經常被描繪為對立的;但許多冠以前者之名的設備上,與後者(馮諾伊曼架構)擁有的相似點遠多於這兩個架構的共通點」

「總而言之,它(哈佛架構)並不是一個架構,並且它並不誕生自哈佛大學的研究工作」

在Harvald I型工作時,中央處理器首先到程序指令儲存器中讀取程序指令內容,解碼後得到數據地址,再到相應的數據儲存器中讀取數據,並進行下一步的操作(通常是執行)。程序指令儲存和數據儲存分開,數據和指令的儲存可以同時進行,可以使指令和數據有不同的數據寬度,如Microchip公司的PIC16芯片的程序指令是14位寬度,而數據是8位寬度。程序需要由操作者加載;處理器無法自行初始化。

如今,大多數處理器由於性能原因實現了這種獨立信號通路的結構,但實際上大多是應用了改進的哈佛結構,所以它們可以支持從磁盤將一個程序作為數據加載並執行的任務。

哈佛架構的微處理器通常具有較高的執行效率。其程序指令和數據指令分開組織和儲存的,執行時可以預先讀取下一條指令。

目前使用哈佛架構的中央處理器微控制器有很多,除了上面提到的Microchip公司的PIC系列芯片,還有摩托羅拉公司的MC68系列、Zilog公司的Z8系列、Atmel公司的AVR系列和安謀公司的ARM9、ARM10和ARM11。

內存的詳細信息

在哈佛架構,兩個寄存器不需要有共同的特徵。特別是,字寬、定時、實現技術和內存地址都可以不同。在一些系統中,指令可以存儲在只讀存儲器(ROM)中,而數據存儲器一般需要讀寫存儲器(RAM等)。在一些系統中,指令存儲器比數據存儲器多,因此指令地址比數據地址更寬。

與馮紐曼架構的對比

純馮紐曼架構下的CPU可以讀取指令或讀/寫內存數據,它們都不能使指令和數據同時使用同一個的總線系統。使用哈佛結構的計算機中CPU,即使沒有緩存的情況下也可以在讀取指令的同時進行數據訪問。由於指令和數據訪問不使用同一個內存通道,因此哈佛結構的計算機可以在相同的電路複雜度下有更好的表現。

同時,哈佛架構機擁有不同的代碼和數據的地址空間:指令的零地址和數據的零地址是不同的。指令的零地址可能是二十四位的值,而數據的零地址可能是一個八位字節,而非二十四位值的一部分。

與改進的哈佛架構的對比

改進的哈佛架構機與原來的哈佛架構機並無兩樣,但它鬆綁了指令和數據之間嚴格分離的這一特徵,仍然允許CPU同時訪問兩個(或更多)內存總線。最常見的修改包括由公共地址空間支持的單獨指令和數據高速緩存。當它作為一個純粹的哈佛機時,CPU通過高速緩存來執行指令。當訪問外部存儲器時,它的作用就像一個馮·諾依曼機(代碼可以像數據一樣移動,像是一個功能強大的技能)。這一改良在現代處理器是普遍存在的,例如ARM體系結構、Power Architecture和x86處理器。它有時被稱為哈佛架構,忽略了它實際上被「修改」的事實。

另一種修改提供了指令存儲器(例如ROM或閃存)與CPU之間的通路,以允許來自指令存儲器的字被視為只讀數據。該技術用於某些微控制器,包括Atmel的AVR。這允許訪問諸如文本字符串或函數表之類的常量數據,而無需首先將其複製到數據存儲器中,從而為讀/寫變量保留稀缺(且耗電的)數據存儲器。特殊的機器語言指令提供了從指令存儲器中讀取數據的功能。(這是不同於指令本身嵌入常數的數據,雖然對於單個常量來說,兩種機制可以相互替代。)

速度

近年來,CPU的速度已經提速了許多次以同步主存儲器的存取速度。要注意減少內存訪問次數的數量以保持性能。例如,每一個指令在CPU運行需要訪問內存,增加計算機CPU沒有任何速度提升的問題叫做內存限制。可能使內存非常快,但由於內存成本,電源和信號路由的原因這類內存數目很少。解決的辦法是提供少量的快速存儲器稱為CPU緩存以存放最近訪問過的數據。CPU提取緩存中的數據速度要比緩存提取主要寄存器數據的速度更快。

內部與外部的設計

現代高性能CPU芯片在設計上包含了哈佛和馮紐曼結構的特點。特別是,「拆分緩存」這種改進型的哈佛架構版本是很常見的。 CPU的緩存分為指令緩存和數據緩存。CPU訪問緩存時使用哈佛體系結構。然而當高速緩存未命中時,數據從主存儲器中檢索,卻並不分為獨立的指令和數據部分,雖然它有獨立的內存控制器用於訪問RAM,ROM和(NOR)閃存。 因此,在一些情況下可以看到馮紐曼架構,比如當數據和代碼通過相同的內存控制器時,這種硬件通過哈佛架構在緩存訪問或至少主內存訪問方面提高了執行效率。 此外,在寫非緩存區之後,CPU經常擁有寫緩存使CPU可以繼續執行。當指令被CPU當作數據寫入,且軟件必須確保在試圖執行這些剛寫入的指令之前,高速緩存(指令和數據)和寫緩存是同步的,這時馮紐曼結構的內存特點就出現了。

哈佛結構的現代應用

純粹的哈佛架構同時訪問多個存儲系統的主要優點是由哈佛處理器利用現代CPU緩存系統。相對純的哈佛架構機主要用於在應用中的取捨,就像忽略緩存的成本和節省功率,大於編程在不同的代碼和數據的地址空間的不利。

  • 數字信號處理器(DSPs) 一般執行少,高度優化的音頻或視頻處理算法。他們避免緩存,因為他們的行為必須非常重現。應對多地址空間的困難,執行速度是次要的問題。因此,一些DSP功能在不同的地址空間的多個數據存儲器便於SIMD和VLIW處理。德克薩斯儀器TMS320 C55x處理器,具有多個並行數據總線(雙寫,三讀)和指令總線。
  • 單片機的特點是具有少量的程序(閃存)、數據存儲器(SRAM),沒有緩存,並利用哈佛架構的並行高速處理指令和數據的訪問。分開存儲的程序和數據存儲器可能具有不同的位寬,例如使用16位指令和8位寬的數據。這也意味着指令預取可以與其他活動同時進行。例子包括,AtmelAVR和Microchip的 PIC。

即使在這種情況下,它是為了訪問程序存儲器只讀表的數據使用特殊指令或重新編程;這些處理器是改進的哈佛架構的處理器。

參見

  1. ^ Noergaard, Tammy. Embedded Systems Architecture: A Comprehensive Guide for Engineers and Programmers. Newnes. 2005. ISBN 978-0-7506-7792-9 (英語). 
  2. ^ Kong, J. H.; Ang, L.-M.; Seng, K. P. Minimal Instruction Set AES Processor using Harvard Architecture. 2010 3rd International Conference on Computer Science and Information Technology (IEEE). 2010-07. doi:10.1109/iccsit.2010.5564522. 
  3. ^ Venkatesan, Chandran; Sulthana, M. Thabsera; Sumithra, M. G.; Suriya, M. Design of a 16-Bit Harvard Structure RISC Processor in Cadence 45nm Technology. IEEE. 2019-03. ISBN 978-1-5386-9531-9. doi:10.1109/ICACCS.2019.8728479. 
  4. ^ Furber, S. B. VLSI Risc Architecture and Organization. Routledge. 2017-09-19. ISBN 978-1-351-40537-9 (英語). 
  5. ^ Pawson, Richard. The Myth of the Harvard Architecture. IEEE Annals of the History of Computing. 2022-07-01, 44 (3). ISSN 1058-6180. doi:10.1109/MAHC.2022.3175612.