- 保護視力色:
CPU與GPU:誰將主導(dǎo)下一次計算革命?(上)
-
http://mamogu.com 發(fā)稿日期:2008-5-15
- 【搜索關(guān)鍵詞】:研究報告 投資分析 市場調(diào)研 CPU GPU 英特爾 NVIDIA
- 中研網(wǎng)訊:
-
2008-2009年中國IC卡行業(yè)研究咨詢報告 近幾年,中國IC卡行業(yè)步入產(chǎn)業(yè)分工合作、規(guī)模應(yīng)用起步、產(chǎn)品由低端向高端延伸發(fā)展的新階段,產(chǎn)品2008-2012年中國機械停車設(shè)備市場調(diào)查與發(fā)展前景 隨著我國城市尤其是大城市建設(shè)的快速發(fā)展,大量現(xiàn)代化高層建筑和住宅小區(qū)的出現(xiàn)使城市土地越發(fā)金貴2009-2010年中國激光加工設(shè)備市場調(diào)查與發(fā)展前景 我國激光加工產(chǎn)業(yè)規(guī)模從1990年的1200萬元,發(fā)展到2007年末的30億元,十幾年間增長了2009-2010年中國電機產(chǎn)業(yè)市場調(diào)查與發(fā)展前景分析 【出版日期】 2008年12月 【報告頁碼】 350頁 【圖表數(shù)量】 150面對CPU廠商染指GPU,NVIDIA也積極備戰(zhàn)。NVIDIA在2007年10月從經(jīng)營不善的處理器新興企業(yè)Stexar挖到多位“武林高手”?汕f別小瞧了Stexax,這家由原英特爾技術(shù)骨干創(chuàng)立的公司擁有多位奔騰Ⅱ、奔騰Ⅲ和奔騰Ⅳ設(shè)計團隊的骨干,甚至還有奔騰Ⅳ中Netburst架構(gòu)的首席設(shè)計師和超線程的設(shè)計者。
3月26日,本報記者獨家專訪了NVIDIA首席科學(xué)家DavidKirk。
GPU很強
記者:經(jīng)過英特爾多年“Intelinside”的市場攻勢,人們對CPU已經(jīng)很熟悉了,但對專注于圖形計算的GPU卻知之甚少。GPU與CPU有什么不同?
Kirk:長期以來,CPU一直都是單核的。CPU的設(shè)計思路是盡可能快地完成一件任務(wù);對于GPU來說,它的任務(wù)是在屏幕上合成可以高達數(shù)百萬像素的圖像——也就是說有幾百萬個任務(wù)需要并行處理。因此,GPU被設(shè)計成并行處理很多任務(wù),盡可能快地完成所有任務(wù)的總和,而不是像CPU那樣盡可能快地完成一件任務(wù)。設(shè)計GPU的體系架構(gòu)時首先考慮的是并行運算能力,之后再考慮整型運算和I/O吞吐能力。
多核的概念并沒有改變CPU的設(shè)計理念,也許是盡快地做兩件事或四件事,但不是并行處理很多很多任務(wù)。
記者:我看到過GPU的浮點性能數(shù)百倍于CPU的對比結(jié)果,卻不知兩者之間在整型計算上的比較結(jié)果。GPU只有增強其整型能力才能在通用計算中走得更遠,請問在整型計算上GPU有沒有補救措施呢?
Kirk:CPU的整數(shù)計算、分支、邏輯判斷和浮點運算分別由不同的運算單元執(zhí)行,此外還有一個浮點加速器。因此,CPU面對不同類型的計算任務(wù)會有不同的性能表現(xiàn)。而GPU是由同一個運算單元執(zhí)行整數(shù)和浮點計算,因此,GPU的整型計算能力與其浮點能力相似。
我想,如果你仔細觀察一個串行程序的運行結(jié)果,你就會發(fā)現(xiàn)與浮點計算能力相比,CPU的整數(shù)計算能力與GPU中流處理器的整型計算能力更接近,這是因為CPU的設(shè)計更側(cè)重于整數(shù)計算能力。
舉例來說,一個3GHz的雙核CPU每秒能完成60億條整數(shù)指令,比如說G-80GPU,有128個1.5GHz的流處理器,每個流處理器每個計算周期可以執(zhí)行兩條整數(shù)指令,把這些數(shù)據(jù)相乘的結(jié)果大約是每秒3500億~3750億條指令,這大概是CPU運算能力的50~100倍。
我再澄清一下,GPU在整型計算方面并沒有任何劣勢。
盡管不如在浮點計算方面優(yōu)勢那么大,但是GPU的整型計算能力幾乎是CPU的100倍。
記者:除了計算,CPU的另一大功能是控制。從現(xiàn)有的結(jié)構(gòu)看,GPU的控制性能要比其整型計算性能還要弱,而控制功能最終將決定GPU是否能在計算平臺上唱主角。請問GPU在增加和增強控制功能上有何設(shè)想?
Kirk:GPU同樣可以實現(xiàn)控制和分支功能。如果你有一個單線程的分支程序要運行,你可以在CPU上運行它。但是如果你有100萬個線程,每個線程都有分支,那么GPU的性能將遠遠好于CPU。我對CPU類型的計算任務(wù)并不感興趣。與其他人們想實現(xiàn)的功能相比,這項功能并不重要。與只有一個線程的計算任務(wù)相比,我認(rèn)為執(zhí)行與控制幾百萬個線程更為重要。當(dāng)然,CPU也能承擔(dān)這樣的任務(wù),只不過它要串行地、重復(fù)地來進行,性能上遠比不上GPU。
記者:能不能只用GPU,而不用CPU,或者說徹底拋棄CPU?
Kirk:你可以這么做,但這可能不是最佳選擇。GPU效率不高的地方在于處理單任務(wù)、單線程分支。如果你只有一項任務(wù),就不能充分利用GPU。因此,如果你的任務(wù)里包含各種類型的計算——任何問題都包含串行部分和并行部分——你可以在CPU上快速運行串行部分,在GPU上運行并行部分。我認(rèn)為這個問題的關(guān)鍵不在于競爭,而是任務(wù)的劃分。
我相信未來的計算模式是不同種類處理器的混合體。西方有一條諺語“樣樣都會,行行不精”。既然CPU擅長于一種類型的計算,而GPU擅長另外一種類型的計算,那么你把它們結(jié)合在一起,相互合作,就能完成更多類型的任務(wù)。
記者:在更遠的將來,有沒有可能制造沒有CPU的系統(tǒng)?
Kirk:我想這是可能的——現(xiàn)在就可能——只不過大家不想這么做。如果你想最大限度地發(fā)揮現(xiàn)有硬件的功能,你就需要各種專用處理器配合工作。我想這才是最好的解決方案。
直到有一天所有的處理器都足夠好了,你不再需要更好的計算機了,你可能選擇一個效率低一點但架構(gòu)更簡單的計算機。但是到目前為止,人們還是什么都想要,想要最好的串行處理器——CPU,最好的并行處理器——GPU。我想這種需求在未來很多年都不會發(fā)生改變。我認(rèn)為GPU的并行功能會越來越強大,而CPU也會想方設(shè)法改進其執(zhí)行串行指令的能力。我認(rèn)為這兩項功能未來不會融合。
GPU在設(shè)計上有否優(yōu)勢
記者:x86CPU屬于CISC指令集。顧名思義,CISC在工藝實現(xiàn)上也同樣復(fù)雜。而GPU由于大量并行的流處理器而在工藝實現(xiàn)上整齊劃一。隨著芯片上晶體管數(shù)量的劇增和功能的增加,GPU至少在測試上比CPU更省時,請問在制造過程中是否也具有優(yōu)勢?
Kirk:通常大家都說x86指令集有優(yōu)勢,但我認(rèn)為有些情況下它是個劣勢,因為它的兼容性是個龐大且復(fù)雜的問題。一旦你建立起x86系統(tǒng),你只能繼續(xù)建立x86系統(tǒng)。
而我們兼容舊系統(tǒng)的壓力要小得多——不是因為我們放棄了兼容性,而是我們沒有那么長的歷史需要兼容——這在效率上帶給我們一些優(yōu)勢。
除了你提到的測試,我認(rèn)為還有一種很重要的考察效率的指標(biāo),這就是每平方毫米硅片所貢獻的性能。因為GPU擁有更直截了當(dāng)?shù)闹噶罴,其設(shè)計更先進,GPU上每個晶體管的平均性能要比CPU的更高。
記者:5年前我獨家專訪過英特爾CTO基辛格。在談?wù)摚梗埃睿碇圃旃に嚂r,他告訴我,英特爾真正的核心競爭力是設(shè)計與制造這兩個階段的雙向優(yōu)化。如今,半導(dǎo)體制造工藝已經(jīng)進入45nm留給各自獨立的Fabless(無生產(chǎn)線芯片制造商)和Foundry(標(biāo)準(zhǔn)工藝制造商)之間的工藝冗余度越來越小。未來,你們與合作伙伴臺積電如何應(yīng)對這一挑戰(zhàn)?
Kirk:首先我得指出,每個處于帕特·基辛格先生位置的人當(dāng)然都會像他這么說。他總是把自己的公司說得很好。盡管我們和Foundry不是同一家企業(yè),但我們之間密切合作,彼此之間做了優(yōu)化。我不認(rèn)為在這一點上有任何區(qū)別。
記者:你們做同樣的事?
Kirk:是的,我們必須這么做,否則我們就沒有競爭力。
記者:你對未來GPU在制造上有何展望?
Kirk:我認(rèn)為前景很光明。每跨入新一代設(shè)計尺寸當(dāng)然意味著更復(fù)雜的設(shè)計和更大的精力投入,但這就是我們的工作,我們必須這么做,就像英特爾一樣。
CPU與GPU:融合還是集成
記者:回顧CPU的發(fā)展,由于集成了數(shù)學(xué)協(xié)處理器,Intel80486顯著提升了浮點計算的性能,后來由于集成了MMX等多媒體指令集,使得PentiumMMX的多媒體性能得以增強。NVIDIA也在2005年推出單芯片的芯片組+GPU產(chǎn)品C51。這些都是PC平臺上SOC趨勢的具體表現(xiàn)。請問你是如何評價CPU與GPU集成的?
Kirk:集成只是縮減成本的一種途徑,而非提高性能或增強功能的良方。所以,CPU和GPU的集成對于低端或內(nèi)嵌應(yīng)用來說比較合理,因為這些領(lǐng)域需要控制成本,便攜式設(shè)備、手機和筆記本電腦亦然。而對于高端應(yīng)用或條件要求苛刻的應(yīng)用來說,計算能力的不足意味著你無須集成,相反,你要做的是分解,通過更多的CPU和GPU來獲得更強的計算能力,而不是更小的CPU和GPU。
記者:但SOC是未來趨勢?
Kirk:我不這么認(rèn)為。我們距離最完美的圖形還有很長的距離。在準(zhǔn)備在高端應(yīng)用中進行圖形集成之前,我們還應(yīng)做得更好,要走的路還很長。
記者:NVIDIA從Stexar公司挖到了一批前英特爾奔騰4的骨干。在CPU廠商頻頻染指GPU時,你們不會讓這些CPU的頂尖高手改行從事GPU的設(shè)計吧?
Kirk:就我們是否會生產(chǎn)CPU這個問題,我并不想做什么預(yù)測,實際上,我并不認(rèn)為CPU有那么的重要。我深信,GPU距離完美還有很長的距離而CPU已接近完美。隨著時間的推移,CPU的大小已變得沒那么重要了。這樣看來,現(xiàn)在或許是CPU實現(xiàn)集成的最佳時機。我想問的是,既然我們實施了在北橋芯片中集成圖形功能的策略,又為何不集成CPU呢?這么小的東西集成起來會更方便。
- ■ 與【CPU與GPU:誰將主導(dǎo)下一次計算革命?(上)】相關(guān)新聞
- ■ 行業(yè)經(jīng)濟
- ■ 經(jīng)濟指標(biāo)
-