許多應(yīng)用程序擁有更為復雜的讀取模式(幾乎是隨機地,特別是當cachehit不可預測的時候),并且沒有有效地利用帶寬。典型的這類應(yīng)用程序就是業(yè)務(wù)處理軟件,即使擁有如亂序執(zhí)行(outoforderexecution)這樣的CPU特性,也會受內(nèi)存延遲的限制。這樣CPU必須得等到運算所需數(shù)據(jù)被除數(shù)裝載完成才能執(zhí)行指令(無論這些數(shù)據(jù)來自CPUcache還是主內(nèi)存系統(tǒng))。當前低段系統(tǒng)的內(nèi)存延遲大約是120-150ns,而CPU速度則達到了3GHz以上,一次單獨的內(nèi)存請求可能會浪費200-300次CPU循環(huán)。即使在緩存命中率(cachehitrate)達到99%的情況下,CPU也可能會花50%的時間來等待內(nèi)存請求的結(jié)束-比如因為內(nèi)存延遲的緣故。 你可以看到Opteron整合的內(nèi)存控制器,它的延遲,與芯片組支持雙通道DDR內(nèi)存控制器的延遲相比來說,是要低很多的。英特爾也按照計劃的那樣在處理器內(nèi)部整合內(nèi)存控制器,這樣導致北橋芯片將變得不那么重要。但改變了處理器訪問主存的方式,有助于提高帶寬、降低內(nèi)存和提升處理器性 制造工藝:現(xiàn)在CPU的制造工藝是45納米,今年1月10號上市最新的I5I可以達到32納米,在將來的CPU制造工藝可以達到24納米。