作者  dosa740612 (Dosa)                                     看板  dosa740612

 標題  Re: [難笑]

 時間  Fri Jul 31 10:14:37 2009

───────────────────────────────────────

 

 作者  sitos (麥子)                                           看板  Gossiping

 標題  Re: [問卦] 有沒有AMD的八卦

 時間  Fri Jul 31 02:19:33 2009

───────────────────────────────────────

 

※ 引述《SkyElder (不可有一絲惡念)》之銘言:

: AMD最近真的是被打假的 多核心同時脈效能都輸30%左右

: 應該不是說最近

: 應該說兩年有了

: 更久以前AMD的同時脈效能是領先INTEL的  也就是說如果同樣是跑2G

: AMD效能硬是比較快   所以他才出了一堆類似 型號是3500結果實際時脈只跑2.2G

: 玩這種把戲  就是宣稱自己的2.2G可以跑得跟INTEL的3.5G一樣快

: 事實上是沒有一樣快  可是也差不多了

 

intel 在 p2~p4 的時期,應該都還算是在衝 clock rate ,

要把 clock rate 衝上去的方法就是讓每一個 pipeline stage 更短,

當然相對地,做完一件事的時間需求一樣, pipeline 的深度就會變深。

透過這樣的方式,可以很漂亮地讓 clock rate 衝上去。

當時的市場看到 clock rate 就爽了,爽大家就買,效能進步其實未必很大。

 

pipeline 當然是增加 instruction level parallelism 的好方法,

至少課本都是這樣教的,適當地去切 pipeline 其實表現也都不錯。

不過 intel 把這個觀念玩到極致,或者說是有點過頭了。

一般課本會教的大概是 5~6 stage 的 pipeline ,

intel 切到後來大概切到 20~30 個 stage 。

 

如果程式的 instruction 之間真的都是 independent ,

那麼 20~30 stage 的 pipeline 效能應該會還滿不錯的。

但是因為一些 data/control dependency ,

導致前後的 instruction 其實要互等, pipeline 執行常常在 stall 。

切了一堆 stage ,但大家都在 idle ,對效能根本沒幫助。

 

更慘的是,這些在 idle 的 unit 還是很認真地在等工作,

所以繼續在耗電,這種爛方法搞到後來就是出現像 pentium D 這種,

又吃電又熱跑起來又不怎麼快的 cpu 。 intel 自己也知道這樣不行了,

因為這樣搞下去 power 都快要比 cpu 還要貴了。

所以才換個方向,走向 pipeline 比較不那麼深的設計方式。

 

早年 amd 用的策略就是跟 intel 不一樣,沒有強加 pipeline stage 。

所以才會有所謂「同時脈」比較快,但基本上同時脈沒什麼意義,

時脈本來就是看你在一個 cycle 要做多少事來決定的。

intel cpu 一個 cycle 做的事比較少,所以要用比較多的 cycle 才做完。

amd 則反過來。但基本上做完一件事所需要的時間差不了太多。

真正決勝的點還是每一個 function unit 本身的設計,

不過這些東西使用者是看不到的。

 

: CPU要快除了時脈以外  最重要的就是內部的構造與技術  時脈並不是關鍵

: 但近來INTEL出了新核心(從core 2技術開始)  用了新技術  把整個局勢扭轉過來了

: 也就是說 同時脈下  效能會贏AMD 30%左右

: 又 INTEL製程比較先進  比如INTEL 是45奈米但AMD只有65奈米

: 45奈米在相同時脈下   比65奈米省電1/3   當然溫度也低

: 速度也會增快(因為電路間隙縮短傳遞更快)

 

其實前陣子 core/core2 把 amd 搞得很慘的原因除了製程,

還有很重要的是 intel 有把兩個 die 放在同一個 package 裡面的能力。

也就是所謂的非原生雙核心/四核心。當出 amd 在廣告上面嗆 intel 不是原生四核。

不過就是因為不是原生四核,所以四核需要的是兩個小 die 不是一個大 die ,

die 的成本和面積平方成正比,拆開來作就便宜多了。

再加上非原生四核的缺點主要是差在 core-to-core 的溝通上面。

不過一來是實際使用平行程式的使用者不多,未必感受得到差異。

二來是,管理作得好一點,差別也沒有真的太多。

 

而可憐的 amd 因為沒有這種技術,所以硬要一次作四核,

在製造過程中要保證一整個大的 die 都是好的,成本就上去了。

賣得貴又跑得沒快多少,誰要跟你買。 XD

有人說 amd 搞三核心就是為了壓低售價,只壞掉一個核心的還是可以拿來賣。

不過我沒有去看過 spec ,不知道是不是真的這樣搞。

因為那麼產品連我的好奇心都沒挑起來。

 

: AMD最近完全是靠顯示卡在撐

: AMD(ATI)的顯示卡蠻威的

: 雖然我用INETL的四核  但我買AMD的顯示卡

: ATI的顯卡最近很威 具有高CP值與高畫質 把Geforce整個打趴了

 

事實上再過一陣子, amd 可能都還是得要靠 gpu 來撐。

依照目前 gpgpu (general purpose gpu)的發展來看,

獨佔鰲頭的應該是 nvidia 的 cuda 。

但是 cuda 架構有一個很大的缺陷,因為 cuda 在運算的時候,

資料和程式都必須要放在 gpu 的記憶體裡面,雖然 size 也是問題,

但不是最大的問題。最大的問題在於這些程式和資料,

必須要先從 main memory 搬到 gpu memory 上面。

而算完之後,還要從 gpu memory 再搬回 main memory 。

很多不是真的計算量很大的程式,搬的時間就比算的時間還久。

這種程式用 cuda 不會有加速的效果。

 

因此可能的方向應該是要讓 gpu 也可以存取 main memory 。

早先的 intel system 是把 memory controller 放在 north bridge 上面,

可行的作法是把 gpu 也放在 north bridge 上面。

以前內建顯卡有的就這樣做,然後扣掉一點 main memory 的大小。

如果這塊不是被「切出去」,而是共享。

那麼就可以讓 gpu 不用花額外的時間去「搬」資料。

 

但是 intel 不太可能讓 nvidia 染指自家的 north bridge ,

不管是專利或是介面, nvidia 作為 intel 主要對手之一,合作是要很小心的。

而現在這個可能性又更小了,因為從 core i7 之後,

memory controller 已經做在 cpu 裡面。

事實上先這樣做的是 amd ,但這只是設計的決策不同,

intel cpu 現在才有這個需求,所以現在才作這種整合。

那麼 intel cpu 更不可能跟 nvidia gpu 做在一起。

所以 intel 只能期待自己的 gpgpu 可以跟上 nvidia 跟 ati 。

那東西的名字是 larrabee ,但現在看起來跟一般的 cpu 還差得遠。

(詳細的資料可以查 wikipedia 或 google 一下,

 很有趣的是它是一個用 x86 instruction set 的 gpu)

 

而 amd 的好處是有了 ati 的技術,可以把 cpu/gpu 做在同一塊 die 上。

cpu 輸 intel 一點, gpu 跟 nvidia 不相上下或再好一點。

透過可以 share main memory ,省去資料搬移的時間,

會讓 gpgpu 的應用更有吸引力, overhead 變少, performance 就出來了。

相較於 nvidia 提出 cuda 的架構, amd/intel 之後應該會 follow OpenCL 的規範。

不過目前還不是很具體,但希望未來是有一個統一 cpu/gpu 的 programming model 。

也就是寫一份程式,自動會把工作分散到 cpu/gpu 讓它們協同工作,

以達到更好的效能。

 

至少在這一塊未來的發展上面, amd/ati 是很值得期待的,

現在就看看 intel 在 gpu/gpgpu 這一塊要拿出什麼來應對。

在 gpp (general purpose processor) 上面 intel 已經超強了,

amd 快要不足以被當作對手。不過在 gpu/gpgpu 上面還很嫩。

amd 這塊如果能加緊腳步應該還滿有機會的,不過目前看起來有點....

該怎麼說呢? 口號喊了一兩年,東西卻沒做出來半個,讓人滿擔心的。

(不過 intel 的 larrabee 也是喊了好一陣子,效能一直長不太出來。 XD

 

補一下好了,講錯就請糾正。這些東西在頭腦裡都揪成一沱了...

 

--

 

        活著的目的是為主活 然後為主死

 

        死亡的目的是為主死 然後為主活

 

 

--

※ 發信站: 批踢踢實業坊(ptt.cc)

◆ From: 60.248.178.71

→ gg123sf:計組計結魂!!                                            07/31 02:20

→ gg123sf:其實clock rate衝高系統反而容易掛 現在主戰場是分工合作   07/31 02:21

 

我不太確定你說的容易掛指的是哪個部份。如果單純是同一種架構,

clock rate 高的確可能會因為 technology variation 造成訊號錯誤的情況。

降頻一下,等訊號穩定再讀就沒問題了。 :)

 

分工合作的部份我猜你是說用特殊的指令集或 function unit 來加速。

這部份也是做得.... 我個人覺得有點過火了 XD

MMX/SSE/SSE2 之後來有一個什麼來著的... 忘了。

雖然都是 x86 ,但多出來的東西,舊的機器可是一概不支援的。

 

→ a0801284545:太專業 看無                                         07/31 02:22

推 sunsonsam:原來clock rate跟pipeline有關聯.....................   07/31 02:23

推 magecandy:半吊子鄉民:你幹嘛講話不用中文好好講  要夾一堆英文?    07/31 02:23

推 zoo3021515:專業推                                               07/31 02:24

→ cloud7515:8核心! INTEL:我多你八核心                          07/31 02:24

推 autoupdate:用中文講 五樓也是看不懂                              07/31 02:24

→ sidi:好我看懂一個 時脈 這樣可以了可以了吧                       07/31 02:24

推 ruemann:他用的英文還可以啦,只是北橋用英文會比較好?            07/31 02:24

 

抱歉,也許用北橋講就好了。 :)

 

推 dingyuchi:推一下 這篇應該要給M                                  07/31 02:24

→ feizizi:你會不會太猛了啊??? 連GPU你都能投頭是道  拜服啊         07/31 02:25

推 GTOKevin:專業推                                                 07/31 02:25

推 captdavince:推啊~接下來就是整合cpu和gpu在同一塊上了吧           07/31 02:26

推 pdaer:越跑越快越跑越吃電 以後玩遊戲耗電量跟煮火鍋一樣了         07/31 02:26

 

要記得買電扇...

 

推 ruemann:cpu整合gpu……有應用再說吧,m$不支援api的話,就沒用了   07/31 02:27

 

已經有應用了阿。可以到 nvidia 的網站上面找 CUDA 。

如果你有 8400 以上的板子就有支援,可以跑跑它的 demo 程式。

(當然要裝一些 nvidia 提供的軟體)

會比用 cpu 跑快非常非常多。

 

而且開發介面也可以跟 vs 整合在一起, m$ 沒道理去擋這東西,

對他們一點壞處也沒有。 :)

※ 編輯: sitos           來自: 60.248.178.71        (07/31 02:31)

推 sunsonsam:不太懂時脈跟管線深度有什麼關係  時脈不是震盪器給的嗎  07/31 02:27

 

時脈的極限是來自於一個邏輯電路的訊號多久穩定到可以被讀出來,

而訊號穩定取決於線路的長度還有一些設計相關的參數,

我不是做 EDA 的,所以細節不是非常清楚。

 

用一個過度簡化(不真實)的講法來講,假設你要做的事情有五件事,

每一件事要做一秒,你五件事永遠要一起做,你就是要花五秒才能做完一件事。

而且因為五件事都一定要一起做,所以同時也只能做其中的某一件。

 

如果你可以把五件事拆開給五個人做,每一個人做一件事,就只需要一秒。

第一個人做完,就把事情交接給第二個人,他又可以再去做另一件事。

而這時候,我們可以把交接想像成一個檢查點,也就是一個時脈週期。

 

所以,事情拆得越散,做完「一件」需要的時間就越短,時脈就可以越高。

大致上的概念是這樣子,實作上當然還有很多其它需要考量的問題。

 

英文用少一點會比較好嗎 :)

 

推 OpenGoodHate:底層達人出沒請小心                                 07/31 02:28

→ feizizi:八卦就是要有這種水準的文章才high啊~~~  XDDDDDDD         07/31 02:28

推 reallocust:4850的GPU已經夠拿來煮火鍋了...(X的,現在房間超熱的)   07/31 02:28

推 mike1990:看完了 還是看的懂耶 呵呵                               07/31 02:29

推 fin806:GPU->CPU山寨板 比CPU威 還可以煮火鍋                      07/31 02:29

→ OpenGoodHate:22台i7+GTX275 開下去冷氣會滴水                     07/31 02:30

→ kslman:下次整篇英文才不會被酸                                   07/31 02:30

推 allen7976:I 怎麼都 watch 不懂...                                07/31 02:30

推 AAAA:很多東西翻成中文反而會更不順                               07/31 02:30

推 eric93:                                                         07/31 02:30

推 HornyDragon:酸的人可以把這篇的英文都翻成中文試試看......        07/31 02:30

推 skciv:白算盤                                                    07/31 02:31

→ OpenGoodHate:GPU有自己的核心,記憶體跟板子,但是還不能宣佈獨立  07/31 02:31

※ 編輯: sitos           來自: 60.248.178.71        (07/31 02:35)

推 ikari512:推 autoupdate:用中文講 五樓也是看不懂                  07/31 02:32

推 asgard1991:只能推了 囧">                                        07/31 02:32

推 leopastiom:趕快推 不然人家以為你看不懂!!!!!!!!!!!!!!!!!!!!      07/31 02:32

→ ikari512:不然5F翻成中文來看看呀。                               07/31 02:33

推 tonyselina:前面兩段是計概必念的聖經白算盤第四版嗎? XDDDDDDDD    07/31 02:33

 

不知道。我只知道計結課本考試範圍考前我一個字一個字念過了。念完,就忘了。

 

推 sunsonsam:GPU搬MEM的部份  似乎把記憶體加大就可以解決?           07/31 02:33

 

加大不是很有用,基本上問題是出在,有些事 gpu 不能做(或說 cpu 做才快),

有些是 cpu 不能做(或說 gpu 做才快),為了要快,就要一直交接事情(搬資料)。

問題不在於資料放不下(如果是放不下加大就好了),問題是在於搬來搬去。

 

就像是你要跑公文,公文量可能不是很多,如果公文量太多,大不了用大一點的袋子。

但是你要把公文在各單位之間跑來跑去,就算公文只有一份,還是很花時間。

 

推 Atzivan:寬度一樣,長度改變的管子,流速會變快嗎?                07/31 02:34

推 ertyhnm:專業文推                                                07/31 02:34

推 VictorTom:推專業:)                                              07/31 02:34

推 ruemann:要搬移就要時間,不管是用dma還是什麼鬼方法都不會比share  07/31 02:34

→ ruemann:快吧                                                    07/31 02:34

→ tonyselina:這邊要幫糖糖說話,他是模擬半調子吧? XDD              07/31 02:34

推 SILee:to sunsonsam:因為要拉時脈就必須要縮短stage                07/31 02:34

推 kingofsdtw:看 八卦長知識                                        07/31 02:35

推 herman602:5專業                                                 07/31 02:35

→ sunsonsam:不會  但是水全部都在管子裡面就不用到外面去拿 = 變快   07/31 02:35

推 ikari512:糟糕 好像真的是反串 我酸錯人了XDrz                     07/31 02:35

→ SILee:問題是要做的事情還是一樣多,所以pipeline會變深            07/31 02:35

→ ikari512:5F有個分號 整句文意都變了 囧!!                       07/31 02:36

推 ogcxd:I服了YOU                                                  07/31 02:36

※ 編輯: sitos           來自: 60.248.178.71        (07/31 02:39)

推 ruemann:pipeline太深,如果碰到要清空pipeline時,代價也變高      07/31 02:36

→ sunsonsam:SILee 意思是stage過大而時脈過高容易出錯  是這樣嗎= =  07/31 02:36

推 choupi:y老師lab的強者出馬 當然要開本尊上來推一下!!              07/31 02:37

→ SILee:sunsonsam你是EE或CS相關科系出身的嗎?                     07/31 02:38

推 tonyselina:剛剛翻了一下,是白算盤第六章內容、、、               07/31 02:38

推 ikari512:sunsonsam:時脈高不代表容易出錯 而是出錯的話會很痛      07/31 02:39

推 tnav:是麥子大 ...                                               07/31 02:39

推 gg123sf:這種東西好像只有電機電子資工在學的樣子..                07/31 02:39

→ SILee:如果不是的話很難跟你解釋這個觀念 0rz 小弟不擅長教學       07/31 02:39

→ ikari512:sunsonsam應該不是 所以可以練習用白話文解釋看看XDD      07/31 02:39

→ ikari512:我要修正一下 是stage太多會很痛 跟時脈不直接相關orz     07/31 02:40

※ 編輯: sitos           來自: 60.248.178.71        (07/31 02:40)

推 ukimiu:推!!看得非常舒服,精闢好文!!值得M XD                     07/31 02:40

→ sunsonsam:我是EE  我知道clock太高會有東西跟不上就出錯           07/31 02:41

→ SILee:而且這要畫圖會比較好解釋,BBS很難畫圖                     07/31 02:41

→ sunsonsam:可是我不知道跟pipeline有什麼關聯= ="我知道我沒學好XD  07/31 02:41

→ SILee:是EE出身的話你該去重K白算盤啦 = ="                        07/31 02:42

推 Assyla:計組魂                                                   07/31 02:42

→ sunsonsam:XDDDDD  小的知錯                                      07/31 02:42

推 jeta890119:專業推                                               07/31 02:44

推 costbook:如果能把OS的設計一起分析就更好了             <---嘴砲  07/31 02:44

推 choupi:現在cuda的computing model和cell還蠻像的..                07/31 02:44

 

兩個都很難寫... 而且要最佳化也都有很多要注意的地方。

 

我個人覺得 CUDA 成功的機會比較大,

有顯卡的人應該會比願意把 ps3 裝 linux 的人多。

 

以 tool chain 來看 CUDA 還跟不上 cell ,不過用的人多,

活下去的話,應該會漸漸越來越齊全就是了。

 

這種 heterogeneous 的計算平台都很難寫。

希望 OpenCL 會解決這個問題。 :)

 

(不過還好其實我不用寫)

 

推 windward:白算盤看得很熟哦XD                                     07/31 02:44

推 LoLoLuan:寫的讓小學五年級看不懂 就是廢文了... Change有沒有看過  07/31 02:45

 

對不起... 才疏學淺,還沒辦法做到深入淺出的程度。 :)

 

※ kof2200:轉錄至看板 PC_Shopping                                  07/31 02:45

→ SILee:簡單講就是要拉時脈的話單一stage內部的delay要縮短          07/31 02:45

推 johnlinvc:pipeline方面 現在branch prediction的進步也是關鍵之一  07/31 02:45

→ LoLoLuan:要把眼光拉到五年及小學生一樣高啊..                     07/31 02:45

推 ruemann:這個能寫到讓小學五年級看得懂的話,那個長度會想讓人end   07/31 02:45

推 DieWalkure:AMD的K6-200不錯用阿,我還在用說,K5之前是很爛沒錯      07/31 02:46

→ SILee:所以一個stage所能做的事情就會變少                         07/31 02:46

推 jazzboy:電機學過也不見得記得 後來沒走系統組都忘光了             07/31 02:46

※ 編輯: sitos           來自: 60.248.178.71        (07/31 02:49)

→ DieWalkure:K7之後有度還超越Intel一下不是 !?                     07/31 02:46

→ SILee:但是對同一個instruction必須要完成動作還是那麼多           07/31 02:46

推 gg123sf:這個要寫到讓小學五年級懂得話 大概花40個小時講課..       07/31 02:47

推 costbook:要讓大家看得懂,就要從8051開始講起了    <---再次嘴砲   07/31 02:47

推 LoLoLuan:有沒有一言以蔽之的 解釋 XD                             07/31 02:47

→ SILee:所以就必須增加stage數                                     07/31 02:47

推 suzukihiro:不錯  像P4工程師有一些書 都有寫到這些東西            07/31 02:48

推 tonyselina:說實在這個轉電蝦幹嘛? PTT其他板比較適合、、、        07/31 02:48

推 stejiang:上過Y老師的課幫推一下 科科                             07/31 02:48

→ LoLoLuan:例如 intel好大喜功,壞壞  AMD偷吃步自以為,笨蛋        07/31 02:48

推 eterbless:把課本講pipeline的部分轉上來就行..就只怕不夠寬        07/31 02:49

推 previa:這篇作者對目前發展很了解喔  推一個!                      07/31 02:49

推 kony25:you 好厲害                                               07/31 02:49

推 jesil:看不懂                                                    07/31 02:50

推 costbook:可惜這篇在半夜,不然應該早就爆了                       07/31 02:50

→ LoLoLuan:看吧 還是很多人看不懂喔.... :Q                         07/31 02:50

推 threedices:專業的八卦版..要是所有文章1/5有這種等級就好了 XD     07/31 02:50

推 jazzboy:例如 intel好大喜功,壞壞  AMD偷吃步自以為,笨蛋  XD     07/31 02:51

推 kingofsdtw:Y老師是?!  矮矮丟香蕉那個@@?  那個滿nice的           07/31 02:51

推 ptyan:我竟然看得懂部份耶QQ                                      07/31 02:51

推 stejiang:文章只有有"馬"字就夠資格出現在八掛板啦 鄉民很愛        07/31 02:51

推 sunsonsam:問個問題  如果STAGE過大而時脈又過高  會怎樣?          07/31 02:51

 

在訊號到達之前讀資料,資料會是不穩定的,介於 0,1 之間的值會出錯。

你去超頻你的電腦,把時脈調到最高,發生的情況,大概就是你上面說的那樣。 XD

※ 編輯: sitos           來自: 60.248.178.71        (07/31 02:53)

推 gg123sf:那應該會導致錯誤資訊被傳遞 之後你電腦就等著升天了..     07/31 02:52

推 eterbless:浪費時間                                              07/31 02:52

推 costbook:N年前的電腦雜誌也會寫這類有深度的文章,現在.........   07/31 02:52

推 feizizi:請問一下die是什麼???                                    07/31 02:52

推 kof2200:PTT的真正的好文都麻在深夜過後出來~~                     07/31 02:53

→ SILee:時脈過高你的flip-flop就會存的錯誤的資料啊                 07/31 02:53

→ kingofsdtw:笨笨的問一下..不能直接跳過cpu..直接丟給gpu算嗎?      07/31 02:53

 

目前似乎還沒有聽到這方面的解法。也許是一個可以嘗試的方向,

只是對現在整體電腦產業而言,這樣的改變可能會相當痛苦,

一次要改的東西實在太多了。

 

→ jazzboy:因為白天都被政治新聞佔滿版面了...                       07/31 02:54

→ SILee:die就是從晶圓上面切下來的小電路                           07/31 02:54

推 eterbless:兩個的結構不一樣...                                   07/31 02:54

→ james0850:好在我有讀計組還算看的懂                              07/31 02:54

推 choupi:時脈太高應該會到達電子速度的極限 和過熱 @@               07/31 02:54

→ kof2200:die你拿一個CPU出來看他中心有個用鋁殼包裝的!!            07/31 02:54

→ kingofsdtw:我... 翹很多課= =|||                                 07/31 02:54

推 ruemann:die = 晶粒,就是晶圓做好後切下來的裸晶粒,封裝後就是IC  07/31 02:54

推 sunsonsam:所以就是會出錯嗎= =  STAGE縮短是減少錯誤機率還是?     07/31 02:54

→ feizizi: 晶圓切下來的小電路?? 有沒有更精確的說法??有中文翻譯嗎  07/31 02:54

→ SILee:你平常看到的CPU和各種IC就是die外面再加上塑膠封裝的保護    07/31 02:54

推 Gaogaigar:那些詞硬用中文的話可能鞭的人會變多吧?                 07/31 02:55

推 gg123sf:stage縮短是為了增加clock rate                           07/31 02:55

→ kof2200:政治狂魔因為早上要上班所以會提早入睡了!!                07/31 02:55

→ feizizi:OK~~ 了解了  謝謝                                       07/31 02:55

※ 編輯: sitos           來自: 60.248.178.71        (07/31 02:56)

推 zoo3021515:是晶粒 不是粒晶喔!!                                  07/31 02:55

→ choupi:gpu目前還沒辦法直接存取主記憶體 所以還要cpu去幫忙搬      07/31 02:55

→ SILee:我還真的不知道這些東西要怎麼翻成中文耶XD                  07/31 02:56

→ kof2200:午夜過後是真正的好文包含18禁XD                        07/31 02:56

推 johnlinvc:正確來說是cmos來不及充放電 因為有電容                 07/31 02:56

推 lwei781: Ring oscillator delay 該講一下....                     07/31 02:56

→ kof2200:SILee那個只能比喻或是形容!!                             07/31 02:56

→ apflake:AMD並沒有強調同時脈比較快,市場已經接受時脈就是效能錯誤  07/31 02:57

推 sunsonsam:你們說的clock rate是繞完一圈的還是oscillator的?       07/31 02:57

推 ruemann:AMD那時搞出一個等效計算式,amd的時脈低但等同於intel的   07/31 02:57

推 kingofsdtw:謝~ch大@@~可以搬完不回報cpu嗎?!加入新運算記號..      07/31 02:58

推 gg123sf:AMD有強調的好像是如果型號是1300+ 代表他的效能比intel的  07/31 02:58

→ ruemann:高時脈cpu                                               07/31 02:58

→ gg123sf:1300還要好                                              07/31 02:58

推 eterbless:clock rate都是做完一個stage的                         07/31 02:58

→ kingofsdtw:但是 好像以線代..來解說..我好像脫褲子放屁~"~         07/31 02:59

→ sunsonsam:原來是這樣= =  我以為是一開始給的...                  07/31 02:59

→ SILee:clock rate當然是指oscillator振出來的frequency             07/31 02:59

→ sunsonsam:= =  你們兩個去打一架啦XD                             07/31 02:59

推 GTOKevin:這邊釣出不少專業人士出來                               07/31 02:59

→ apflake:概念,所以反而在行銷上必須隱藏時脈,例如athlon系列        07/31 02:59

推 lwsun:糟糕,我得找個翻譯...                                      07/31 02:59

→ suzukihiro:那個叫做PR值吧                                       07/31 03:00

→ SILee:不過灌進CPU的clock,CPU內部還會作升頻和除頻就是了         07/31 03:00

推 OpenGoodHate:有紫外線抹除的ROM拿來看看就知道什麼叫DIE           07/31 03:00

推 eterbless:找翻譯沒用 這要從cpu結構開始講起..                    07/31 03:00

推 james0850:白算盤!!白算盤!!白算盤!!白算盤!!白算盤!!白算盤!!      07/31 03:01

→ OpenGoodHate:不過看完裡面的程式也DIE光光,記得拿壞的來玩        07/31 03:01

推 ruemann:要看die的話,拿AMD的某一代CPU就是封一半,半顆die在外面  07/31 03:01

推 costbook:clock為什麼不用PLL送?                   <---底層達人  07/31 03:02

推 johnlinvc:有關clock就要從外頻和倍頻來說起了吧                   07/31 03:02

推 PRAM:請翻譯 Blue who said, and whose. 這句話的中文              07/31 03:02

推 sunsonsam:把cpu的金屬蓋子拆開就看的到了不是嗎                   07/31 03:02

→ sunsonsam:樓上不入虎穴焉得虎子  大概10年前的笑話^.<             07/31 03:03

→ kingofsdtw:回RPM:  誰鳥你@@?                                    07/31 03:03

→ ruemann:快爆了 快爆了                                           07/31 03:03

→ costbook:金屬蓋子底下那個是封裝好的IC                           07/31 03:03

推 gg123sf:PRAM ..此英文非彼英文                                   07/31 03:04

推 PRAM:樓上年紀大了 (  ̄ c ̄)y▂ξ                                07/31 03:04

→ SILee:現在clock不是都用PLL振出來的嗎?                          07/31 03:04

→ costbook:die算是製程的術語,說明如上↑                          07/31 03:04

→ sunsonsam:我沒開過..之前看圖是DIE阿@@  閃亮亮的耶               07/31 03:04

推 choupi:pram=Parallel Random Access Machine 很高深的complexity   07/31 03:05

推 dennis7653:看完這篇的心得就是...以後電腦有問題我都要寄站內信給  07/31 03:05

→ dennis7653:原PO                                                 07/31 03:05

推 zoo3021515:給他爆 給她抱                                        07/31 03:05

→ SILee:閃亮亮那個是die上的散熱片吧                               07/31 03:06

推 suzukihiro:報                                                   07/31 03:06

推 ruemann:我爆啦                                                  07/31 03:06

→ sunsonsam:被搶了...                                             07/31 03:06

→ SILee:真正的die很脆弱的                                         07/31 03:06

推 kof2200:平行 隨機 存取 機器 是嗎!?                              07/31 03:06

推 feizizi:GKB是什麼機構啊??XDD                                    07/31 03:06

→ suzukihiro:顆顆  搶走了                                         07/31 03:06

→ zoo3021515:恭喜鈴木大得標                                       07/31 03:07

→ feizizi: 應該是神人呆的地方吧???                                07/31 03:07

→ kof2200:我只知道KGB                                             07/31 03:07

推 PRAM:是平行隨機沒錯 XD 板上高人雲集                             07/31 03:07

→ poppyvodka:完全看不懂 謎之領域 \冏/                             07/31 03:07

推 kingofsdtw:XD~ 原來 Pram ~"~ ...我完全外行                      07/31 03:07

推 costbook:我這裡還有幾顆EPROM和紫外線抹除機,可以看到die喔       07/31 03:07

→ ruemann:我只知道 GBK                                            07/31 03:07

推 vic81324:有料推                                                 07/31 03:07

推 Cheer313:真專業  給你推                                         07/31 03:07

推 OpenGoodHate:裸裝晶粒應該只有紫外線ROM看的到,剩下都是封裝好的  07/31 03:08

→ vic81324:不過變成專業版了顆顆                                   07/31 03:08

→ SILee:有啦 現在很多生物晶片也都是裸晶直接拿來用                 07/31 03:08

推 sunsonsam:http://0rz.tw/jEB3H這個嗎?                            07/31 03:08

→ costbook:不過我把抹除機拿來幫襪子殺菌...(有用嗎?)              07/31 03:09

→ SILee:不過這東西市面上應該拿不到                                07/31 03:09

推 nfsnfs:Good, 超棒~                                              07/31 03:09

推 kof2200:sunsonsam 是的~~ 中間那粒!!                             07/31 03:10

推 OpenGoodHate:裸晶不封裝要怎麼接腳位出來@@"                      07/31 03:10

→ kingofsdtw:原來這就是生物晶片@@ 疑?                             07/31 03:10

推 luckystrike5: 蓋                                                07/31 03:11

→ sunsonsam:對阿  那不就是CPU開蓋子的東西嗎QQ                     07/31 03:11

→ kof2200:中間那粒外層還有包裝!!                                  07/31 03:11

→ SILee:那鬼東西是拋棄式的啊,用過一次就丟了                      07/31 03:11

→ OpenGoodHate:連結算封裝過的不是嗎                               07/31 03:12

→ kingofsdtw:把 KY弄掉後.. 用指甲刮 就可以看到 裸晶@@?            07/31 03:12

→ SILee:而且那只是用來檢測蛋白質的晶片,灌個操作電壓進去而以      07/31 03:12

推 zoo3021515:這個嗎? http://www.inetdaemon.com/img/eprom-lg.jpg   07/31 03:13

→ OpenGoodHate:http://zh.wikipedia.org/wiki/EPROM                 07/31 03:13

推 upbed:專業推 計算機組織跟計算機結構學得很好唷XDDD               07/31 03:13

→ SILee:還拿去封測廠封裝太耗成本了,所以通常都是裸晶直接上        07/31 03:13

→ kingofsdtw:我好奇的是 蛋白呈色如何用晶體取代@@? 商業機密?       07/31 03:14

→ OpenGoodHate:了解,我想到好像RFID的TAG沒上封膜前好像也是裸晶    07/31 03:14

推 kof2200:交大的校長說在座的各位可以上"高等 計算機結構學"了XD     07/31 03:15

推 aegis144:英文翻中文那會真的看不懂WW                             07/31 03:15

→ SILee:細節我也不太懂,我不是做這個的                            07/31 03:15

→ kingofsdtw:了解>\\\<                                            07/31 03:15

→ kof2200:呼叫原po再來禪釋一下!!有問題了~~~                       07/31 03:16

推 choupi:原po可是CA助教級以上的人物呢...                          07/31 03:16

推 finkel:CELL和CUDA的程式差很多吧 CUDA的程式不難寫..麻煩的地方其  07/31 03:16

→ SILee:只知道它主要是利用電場讓蛋白質依它的極性去排列和跑動      07/31 03:16

→ finkel:實是tool還不夠成熟..很難debug                            07/31 03:17

→ kingofsdtw:不過..要怎樣讓晶片組直接判斷丟給cpu和gpu.(遐想中)    07/31 03:17

→ choupi:kingofsdtw biochip上面是一些binding就會變色的物質        07/31 03:17

→ choupi:finkel 我指的是programming/computing model               07/31 03:18

→ finkel:還有原PO提到的資料傳送時間的問題,其實換一個角度來想     07/31 03:18

→ kingofsdtw:所以 生物晶片的辨識儀器 也只是..高級的..辨色?!..     07/31 03:18

→ finkel:運算和資料量都不高的程式 似乎也較沒有使用GPU加速的必要   07/31 03:19

 

應該說是總運算量高,但資料搬移的需求也多。

資料搬移未必是總資料量大,而是 cpu/gpu 協同工作的時候,

分工上有相依性,導致資料必須要搬來搬去的情況。

 

至少目前我會認為這種程式不適合用 cuda 架構來加速。

但有沒有加速的必要,我認為有。

 

至於 cuda 難不難寫... 我是覺得要寫得好還滿麻煩的,

必須要對 gpu 底層的運作有些了解才行。不了解當然還是可以照著寫,

程式也不會出錯,只是快不起來。這樣用 cuda 的價值就降低了。

 

→ kingofsdtw:3D遊戲資放:胃口是養大的..                            07/31 03:20

→ finkel:programming我是覺得差滿多的呀 就我自己寫過的經驗         07/31 03:20

推 LssFOREVER:看八卦長知識~~我絕到看到後面就像在看火星文           07/31 03:20

→ kingofsdtw:抱歉..我也是 局外人@@~ ..都問笨問題..                07/31 03:21

→ kof2200:記得午夜過後好文才會有!!                                07/31 03:21

推 costbook:這篇比我們計算機結構期末考還難                 (羞愧)  07/31 03:24

推 keepoo:翻成中文我也會看不懂 幸好是用原文                        07/31 03:25

推 kof2200:costbook你可以慶幸教授不會深夜爬起來看ptt的喔!!         07/31 03:25

→ costbook:教授目前出國,所以他應該起床了 XD                      07/31 03:25

推 tonyselina:後面是到產業了,會考也是前面的部分吧                 07/31 03:26

推 s4511981:這種文會爆 可見台灣真的很多人幹這行……                07/31 03:29

推 kof2200:考教授什麼是ddr不知道會不會猜對!?                       07/31 03:30

推 maxssn:是麥子大耶..有讀過計概或微算機應該看的懂.......名詞 XD   07/31 03:31

推 feizizi:東尼又跑來裝熟了 XD                                     07/31 03:32

推 costbook:怪了,我們用的書是Mano那本藍皮的,怎你們都用白算盤?   07/31 03:32

→ feizizi:請問麥子大大都在哪個版出沒啊?? 想多拜讀一下他的文章~~   07/31 03:33

推 kof2200:costbook你哪間!?                                        07/31 03:34

→ feizizi:或是說請教一下版友 哪個版會有類似這篇文章內容的文章??   07/31 03:34

推 decadentCat:拍謝挖跨攏謀..........                              07/31 03:34

推 stejiang:他常出現在魔獸版阿 被他電過 哭哭                       07/31 03:34

推 tonyselina:奇怪,會喊我裝熟,但是我又不認識你,承認是愛豬肉了   07/31 03:35

推 maxssn:魔獸板  XD                                               07/31 03:35

→ kof2200:魔獸版的英文是!?                                        07/31 03:35

→ tonyselina:還真是神奇,整天用跳板,但是推文老愛露餡,可憐 XD    07/31 03:35

→ kof2200:哪間大學的計組是用Mano那本藍皮的啊!?                    07/31 03:36

推 choupi:WarCraft                                                 07/31 03:37

推 costbook:喔...我們是"科大"。藍皮書太簡單了嗎?                  07/31 03:37

→ kof2200:掯~~~好難!!可以給校名嗎!?我馬上發email申訴!!            07/31 03:38

推 tonyselina:kof是在幹嘛? 話說轉這文去電蝦就超奇怪的              07/31 03:39

→ kof2200:增加知識!!獨樂樂不如眾樂樂~~                            07/31 03:40

→ kof2200:我每天晚上都熬夜蒐集一些很好的文章!!                    07/31 03:42

推 kingofsdtw:爆!! 我只知道 三國版..  WarCraft!                    07/31 03:42

推 suzukihiro:轉就轉了 有差嗎                                      07/31 03:45

推 kof2200:tonyselina你怎麼知道我用跳板!?你是我認識的嗎!?          07/31 03:50

推 e04su3:不是很懂 但看起來很專業 大家都推 我就推吧                07/31 03:54

推 kof2200:小弟錯了!!我刪除了~~~                                   07/31 03:55

推 OpenGoodHate:<-stallings 培生  只上一學期  一整個沒印像的計組   07/31 03:57

推 vintw:除了OpenCL之外據傳微軟也在下一版的DirectX訂定類似的規範   07/31 03:58

→ OpenGoodHate:intel 推 Larrabee 想要在分散式領域幹掉NV           07/31 04:01

 

分散式指的是平行計算嗎? 如果能夠的話,希望能在別的板看到一些更細節的東西。

大家提出來的點都滿有趣的。 :)

 

推 vintw:在研討會上遇過的很多研究者對Larrabee抱有高度的期待        07/31 04:01

→ vintw:倒是ATi到目前為止都沒有實際動作,不知道下一步會是什麼     07/31 04:02

 

上次聽 amd/ati 的人演講,似乎也是要往 opencl 靠過去。但我還沒看到什麼具體作為。

 

推 germ611:快推...不然會被說我看不懂                               07/31 04:03

推 OpenGoodHate:MS的好像是叫HLSL吧 用DX11的SHADER改的(上課印像)    07/31 04:06

→ OpenGoodHate:看了一下筆記,講反了,是HLSL→COMPUTER SHADER      07/31 04:08

推 james732:有看有推!!                                             07/31 04:11

推 Lindemann:推專業認真文                                          07/31 04:19

推 seiyaku:這才叫專業!                                             07/31 04:19

推 Waterpig:不推人家會說我們看不懂~~                               07/31 04:24

推 vkyoung:這篇只要稍具"電"字背景都可以看得懂, 很深入淺出的好文!   07/31 04:25

推 lolikung:推這篇,計組魂XDDDD                                    07/31 04:31

推 bomberhack:這篇的重點就是現在的硬體設計偏向硬體整合系統的       07/31 04:43

→ bomberhack:分工合作設計方式,藉以提高軟體的效能.                 07/31 04:44

推 blackkane:我怎麼覺得重點是澇英文= = 單元 管線 南北橋 主記憶體   07/31 04:49

→ blackkane:週期 時脈..不懂為啥一定要打英文弄的文章看來就很難讀   07/31 04:51

推 Phater:有看有推                                                 07/31 04:51

推 jeta890119:有些東西講英文比中文好懂                             07/31 04:56

→ jeta890119:就像數位邏輯的:OR AND NOR NAND XOR 翻中文好懂嗎?   07/31 04:57

推 upbed:                     或  及 反或 反及 互斥反或            07/31 05:08

推 blackkane:我知道阿 單元  週期 記憶體 英文會比較好懂嗎= =?       07/31 05:09

推 upbed:    I know a Unit cycle memory                            07/31 05:10

→ blackkane:instruction之間真的都是independent < 打獨立會難懂囧?  07/31 05:11

推 albert7387:推 完全看不懂                                        07/31 05:11

→ upbed:    指令                   獨立                           07/31 05:11

推 suzukihiro:有時候中文字你會混淆意思 尤其像管線 深度之類的       07/31 05:12

→ upbed:說真的喔~那個管線跟pipeline我覺得沒什麼關聯= =            07/31 05:13

推 blackkane:我是說非必要性的啦= = 獨立和相依那個我看到覺得超蝦..  07/31 05:13

→ upbed:講「生產線」還比較容易懂…當然樓上提的獨立打獨立會比較好  07/31 05:13

推 suzukihiro:可能跟個人習慣有關吧...或許被老闆要求成這樣          07/31 05:14

→ blackkane:管線這名詞翻譯不是解釋意思 反而像是形容一種觀念想法   07/31 05:14

→ suzukihiro:自然而然寫出來就變這樣了                             07/31 05:14

→ blackkane:share 就打分享阿= = 弄得半洋半中的 閱讀很痛苦         07/31 05:16

→ blackkane:鄉民很愛推的  i有thing要跟you say 就很像這種文章..    07/31 05:17

推 suzukihiro:其實還好...很多老師上課都這樣搞                      07/31 05:17

→ suzukihiro:早就被苦毒慣了...                                    07/31 05:18

→ blackkane:我知道很多老師都愛這樣 可是不代表自己要這樣阿...      07/31 05:18

→ suzukihiro:大概是被影響到了吧 XDD                               07/31 05:18

→ blackkane:上課教學表達是一種筆記方式 能快速表達當然是好         07/31 05:19

→ blackkane:但當打一篇文章時就應該要要求用字遣詞了阿..= =         07/31 05:19

→ suzukihiro:或許有人喜歡用口語化來打字 這是個人習慣              07/31 05:20

→ blackkane:我生活笑的音是呵呵 阿我不就可以打注音ㄏㄏ 更傳神?     07/31 05:21

→ erasermyself:我跑來電蝦版了嗎                                   07/31 05:21

→ suzukihiro:我也不能說他不對 這是他的習慣 我沒什麼資格要求她改   07/31 05:21

→ suzukihiro:我又不是他老爸老媽老師之類的                         07/31 05:21

→ blackkane:也許吧= = 但不管中英 內容是很正確的 pipeline解釋不錯  07/31 05:22

→ suzukihiro:可以阿  你打ㄏㄏ我也沒意見 顆顆                      07/31 05:22

→ blackkane:沒要他改阿 也沒說他錯阿  推文不就舒發自己心得用的..   07/31 05:23

推 suzukihiro:那就對啦 顆顆                                        07/31 05:24

推 suPerFlyK:(′・ω・‵)                                        07/31 05:37

推 jeromeshih:推原po分享文                                         07/31 05:39

推 sandowZ:我竟然看得懂.... = ="                                   07/31 06:39

推 neofire:這篇好像也沒什麼吧....四年多前的pcdiy有相同的東西       07/31 06:48

→ neofire:不過人家雜誌的內容頗有水準,不會連製程,單位,都不會打     07/31 06:49

→ neofire:而且這種東西,隨便問一個從celeron 300 oc 500的玩家都弄   07/31 06:51

→ neofire:的出類似的心得,那些問題當初p4上市都有雜誌刊出這種論點   07/31 06:54

→ neofire:當時是2002年                                            07/31 06:55

推 jefflaii:這篇超專業的                                           07/31 07:05

推 PHINEAR:第三段總歸一句話,就是hazard的代價                      07/31 07:25

推 PHINEAR:指令平行的部份還有superscalar這技術                     07/31 07:29

推 roea68roea68:.........太專業了                                  07/31 07:31

推 ymsgcat:......我看懂了                                          07/31 07:45

→ gname:慘了...  我剛好都看的懂...我是不是很宅啊...><             07/31 08:10

推 Darkword1987:超專業                                             07/31 08:30

推 woohyuk49:推麥大...超威                                         07/31 08:35

推 bearching:八卦的清流XD                                          07/31 08:37

推 parkerlived:Intel如果把nvidia吃下來的話....amd真的要哭哭了      07/31 08:37

推 zznkqb:寫得非常的清楚,八卦板果然是神出鬼沒的地方 :)            07/31 08:38

推 sohate5566:換句話說,Intel當時覺得netburst衝時脈已經不行了       07/31 08:39

→ sohate5566:所以又改回P3一樣的微架構繼續推新的產品               07/31 08:39

→ sohate5566:到了i7以後就換了另一種叫做QPI的架構了                07/31 08:40

 

我不太清楚 netburst 是什麼,但 QPI 應該不屬於微架構的一部份(吧?)

QPI 全名是 QuickPath Interconnect ,也就是互連的介面,

主要是用來連接處理器,輸出入單元跟記憶體。

並沒有牽涉到處理器內部的設計,所以和微架構不是那麼相關。

 

這個 demo 影片滿不錯的:

 

http://www.intel.com/technology/quickpath/demo/demo.htm

 

推 McHamburger:end                                                 07/31 08:41

推 suzukihiro:SOHATE講的算是精華 XXDD                              07/31 08:48

推 cpt:其實CPU市場萎縮是遲早的事情 AMD不另尋活路只會越來越慘       07/31 08:52

→ cpt:Intel早已布局和TSMC合作打ARM  自己的製程也往將來做SoC發展   07/31 08:53

推 wholewing:怎麼辦,我都看不懂QQ                                  07/31 08:54

→ cpt:再往更久的未來看 如果cloud computing開始主流化 整個軟硬體   07/31 08:56

→ cpt:市場生態搞不好都會重新洗牌                                  07/31 08:56

推 morris2:兄台在晶心上班嗎?                                       07/31 09:09

推 Maybetrue:專業                                                  07/31 09:22

推 sohate5566:簡單說Intel過一段時間就腳位技術全都換一換繼續噱錢    07/31 09:29

→ sohate5566:Intel就靠洗腦跟技術大搬風就可以噱到一堆無知人的錢了  07/31 09:30

推 im5566:資工魂XD                                                 07/31 09:30

→ sohate5566:所以說請板友們繼續買AMD不是沒有理由的,別讓AMD倒下去  07/31 09:30

→ sohate5566:...完了我會不會被Intel告啊囧                         07/31 09:34

推 nfsong:感恩                                                     07/31 09:34

推 Mizake:麥大推推                                                 07/31 09:42

推 jimihsu:太專業了, 沒八卦.......那 VIA 呢 ? XDDDDD               07/31 09:43

推 willwuwillwu:高手  好厲害                                       07/31 09:43

※ 編輯: sitos           來自: 140.112.31.132       (07/31 09:54)

推 gmlush:像這種東西翻成中文才會更多人看不懂...專業推              07/31 09:47

推 abucat:M系列是十年左右才有一次的改革.......                     07/31 09:49

推 LucasChen:拜讀                                                  07/31 09:51

→ syh7211:專業!!所以完全看不懂= =                                 07/31 09:51

推 asuka627:跨嚨某......太專業的關係?                             07/31 09:54

推 TurtleBB:推一下,超專業。                                       07/31 09:57

推 ntcbacc:太專業了,我還請同事幫我翻譯                             07/31 10:03

推 koibito1103:想問她要不要跟樓下的經濟學結拜 攻佔台灣理論市場...  07/31 10:05

 

--

※ 發信站: 批踢踢兔(ptt2.cc)

◆ From: 220.135.244.211

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 dosa740612 的頭像
    dosa740612

    賤人賤誌

    dosa740612 發表在 痞客邦 留言(0) 人氣()