Cell

**Petrik** · 25.06.2006, 22:14

No tak to nevypada dobre, doufejme ze to je jen nejaka kravina, ze to je zpusobeno nejakou stupidni chybkou v navrhu. Vtipny ale je, ale jelikoz ma Cell 2 druhy pameti, tak ze to jde obejit, idkyz za cenu velikeho zpomaleni..

Původně odeslal Semik

Brutalna chyba v navrhu Cell ...

http://www.theinquirer.net/?article=32171

**MadCap** · 26.06.2006, 10:58

co k tomu dodat? proste LOL ale uvidime ako sa s tym popasuju ... myslim ze to bude pre sony tazke ...

**Masster** · 13.07.2006, 19:32

IBM on Cell processor yields

Electronic News: What’s the defining factor that makes some chips better than others?

Reeves: Defects. It becomes a bigger problem the bigger the chip is. With chips that are one-by-one and silicon germanium, we can get yields of 95 percent. With a chip like the Cell processor, you’re lucky to get 10 or 20 percent. If you put logic redundancy on it, you can double that. It’s a great strategy, and I’m not sure anyone other than IBM is doing that with logic. Everybody does it with DRAM. There are always extra bits in there for memory. People have not yet moved to logic block redundancy, though.

http://www.reed-electronics.com/elec...dustryid=21365

**Masster** · 15.07.2006, 16:58

V souvislosti s timhle interview doporucuju precist tento clanek na cdr. Takhle dobre jsem se uz dlouho nenasmal.
Z puvodniho rozhovoru nezustalo v te novince snad nic dobre, krome nazvu procesoru a firmy, ktera ho vyrabi

**Petrik** · 03.08.2006, 14:57

http://www.cdr.cz/a/18155
Ze by z toho nakonec preci jen neco bylo?

**MATRIX** · 11.08.2006, 00:47

ked clovek xce vykon na fakt zlozite vypocty tak to si radsej kupi 10x PS3 a da ix do blade a ma ovela vacsi vykon ako jedna pridavna karta do PC.

**LISP** · 14.08.2006, 14:10

No nevím. Cena je přehnaná, ale třebas se dočkáme levnějších verzí od jiných firem, určených spíše pro domáctnost. Tady by se mohl využít Cell, kde jsou zčásti vadné některé PPE jednotky. Nakonec, může to počítat skoro všechno (fyzika, video), výkon na to má. Bylo by to univerzální řešení.

**Petrik** · 07.09.2006, 11:32

Tak budoucnost cellu se zda byt zrejmne nakonec precijen docela ruzova, ale nastava to co tady mnozi predpovidali: http://www.root.cz/zpravicky/ibm-pos...-superpocitac/
Cell bude skutecne pouzit jen jako ultra rychly akcelerator vypoctu v plovouci carce, kde exceluje, hlavni procesory budou Opterony od AMD

Jsem zvedav kolik petaflops to bude mit. Jelikoz to na 99% pobezi na Linuxu, daji se ocekavat masivni investice do kvalitniho prekladace a dalsich vyvojovych nastroju, ktere by mohly ulehcit beznym programatorum psat pro Cell. Jsem zvedav co z cellu bude treba za 5 let

doufam ze bude skutecne v kazde lednicce jak by to IBM chtelo.

**bukva** · 09.09.2006, 18:33

Původně odeslal Petrik

Cell bude skutecne pouzit jen jako ultra rychly akcelerator vypoctu v plovouci carce, kde exceluje, hlavni procesory budou Opterony od AMD

Já to teda ze zprávy na PCT pochopil přesně naopak - hlavní procesory budou Celly, Opterony budou zajišťovat jen "podporu" a pomocné služby (hlavně zásobování daty, spojení v síti atd.)

**Petrik** · 10.09.2006, 02:41

Spatne jsem to napsal. Hlavni jsem myslel v tom, ze budou rozdelovat praci, propojovat a mozna i pocitat veskee celociselne operace, ve kterych cell zvorva neexceluje.Celly budou pocitat "jen" operace v plovouci carce, ve kterych maj vykon primo giganticky, pokud je SW spravne napsan

Původně odeslal bukva

Já to teda ze zprávy na PCT pochopil přesně naopak - hlavní procesory budou Celly, Opterony budou zajišťovat jen "podporu" a pomocné služby (hlavně zásobování daty, spojení v síti atd.)

**Eagle** · 12.09.2006, 00:02

Původně odeslal Petrik

Spatne jsem to napsal. Hlavni jsem myslel v tom, ze budou rozdelovat praci, propojovat a mozna i pocitat veskee celociselne operace, ve kterych cell zvorva neexceluje.Celly budou pocitat "jen" operace v plovouci carce, ve kterych maj vykon primo giganticky, pokud je SW spravne napsan

Ano, ta poznámka na konec je správná - "pokud je SW správně napsán". Ono totiž sestrojit takový SW pro 99 % případů nelze. Ostatně proč myslíš, že drtívá většina aplikací má jen jedno zátěžové vlákno? A teď ti prozradím jednu maličkost - grafické karty jsou dnes 256bit SIMD procesory a jsou schopny dosahovat výkonu podobného Cellu. Pokud je u high-end grafik 24 těchto 256bit SIMD pipelines, spočítej si, jaký je asi tak výkon takového řešení.

Čistě hypoteticky: Cell 3 GHz vs. grafická karta 600 MHz (5x nižní frekvence).

256bit / 128bit (poměr SIMD u grafiky vs. Cell) x 24 / 5 = 9,6

Tj. grafická karta má (za jinak stejných okolností) výkon asi jako 9,6 jader Cellu. Jenže... ona má nižší frekvenci, to znamená, že delay může být delší, a proto instrukční latence kratší. Výkon grafiky by tímto přepočtem stoupnul třeba dvojnásobně nebo trojnásobně. Stačí, když "je SW správně napsán", a výkon grafické karty je gigantický.

Co to znamená? Že výkon, který možná vypadá zajímavě, mají někteří z nás už delší dobu v domácím PC, byť slouží k jinému účelu. Cell není žádný zázrak, je to čistě účelový design, který nemá šanci se v běžných PC uchytit. Intel ani AMD nejsou hloupí a moc dobře vědí, proč nepřidávají další SIMD jednotky - je to prostě zbytečné. V normálních úlohách má out-of-order Conroe řádově vyšší výkon než in-order Cell. Ano, možná by byl dobrý na enkódování videa, ale to je asi tak všechno.

Pokud se budeme bavit o "dobře napsaném software", je možné dosáhnout o několik řádů vyššího výkonu se zlomkem transistorů, které má Cell. Ano, mluvím o specializovaných DSP procesorech. Myslíš si třeba, že Pentagon luští šifry na nějakém komerčně dostupném CPU?

**Fox!MURDER** · 12.09.2006, 09:36

Dobre napsany software

Ja sice mam rad sci-fi, ale kluciii, vratte se do reality ... specialne na PC se vec jako 'Dobre napsany software' nekona a konat nebude ...

**Petrik** · 12.09.2006, 13:03

Pockat, pokud se nepletu, tak se tu v tuto chvili nebavime o PC, ale o nejvykonnejsim pocitaci, jaky brzy bude na svete. Kdyby byly graficke GPU tak uzasne, jak pises, Eagle, urctite by je nekdo do nejakeho super pocitace jiz davno pouzil, tim si jsem jisty. Ja se obavam, ze ty SIMD jednotky v grafikach nejsou zdaleka tak univerzalni jako SPE v cellu, nebo snad ano? Nebo ze by se rozhodli pro cell jen kvuli potrebe a cene? neverim... Nezapomen, ze cell muze mit diky revolucni architekture podstatne lepsi zasobovani vypocetnich jednotek daty, takze mozna ze GPU maji vetsi teoreticky vykon, ale myslim si ze diky relativne pomalemu pristupu (oproti rychlosti pristupu SPE do sve lokalni SRAM) do jedine centralni pameti bude vetsina GPU pri pocitani nejake fyziky nebo jinych vypoctu zahalet. Dale nevim, kde jsi vzal ze 99% programu je nutne sigle threaded, koukni se na benmarky noveho 4-jadra od intelu a uvidis, ze ve vetsine programu je jiz velmi znatelny narust vykonu, nekdy az 4-nasobny. A ze vsechny superpocitacove programy jsou jaxi nutne mega-multithreadove (kdyz to bezi na tisicech procesoru, tak to ani jinak nejde, ze) asi netreba dodavat. Pokud se nepletu, tak pomoci GPU se zatim krome vyvojovych center nic jineho nez rendering her pocitat realne nedari, coz se neda rici o cellu. Byly nejake pokusy pocitat prostorovy zvuk, ATi se snazi pocitat fyziku a nvidia myslim chce enkodovat video (to uz mozna nejak funguje), ale zatim kde nic tu nic. Psat pro GPU je zrejmne jeste vetsi nocni mura nez pro Cell, pro ktery navic jsou nebo budou relativne pratelske nastroje a kompilery, ktere doufam odvedou vetsinu spinave prace za cloveka (automaticka paralelizace kodu, optimalizace pro cell a pod.). Konsorcium kolem Cellu slibuje, ze by to v budoucnu (mozna uz ted) melo vypadat tak, ze se proste vezme stavajici kod v Cku, prozene se specialnim kompilerem a voala, staci to pustit na cellu a valit oci na rychlost, jakou to cell chroupa...

Me proste bavi, jak jste vsichni desne chytri a tvrdite, ze to fungovat nemuze, ze to je nanic, ze se na to neda psat a pod. a jaxi ignorujete fakt, ze nejenom ze uz jsou hry pro playstation 3, ale ze kdyz se IBM rozhodne vybudovat nejvykonejsi superpocitac na svete, tak ze to ma asi sakra posefovany, nemyslite?

**Eagle** · 12.09.2006, 20:53

Původně odeslal Petrik

Ja se obavam, ze ty SIMD jednotky v grafikach nejsou zdaleka tak univerzalni jako SPE v cellu, nebo snad ano? Nebo ze by se rozhodli pro cell jen kvuli potrebe a cene? neverim...

Dyť na nich chtějí počítat fyziku a dekódovat HDTV MPEG4 AVC, tak proč by to nezvládly?

Původně odeslal Petrik

Nezapomen, ze cell muze mit diky revolucni architekture podstatne lepsi zasobovani vypocetnich jednotek daty

Revoluční? Co je na nějaké SRAM revolučního? To si vážně myslíš, že to nemá někde úzké hrdlo? Třeba přístup do RAM, závislosti výpočtů, latence mezi SPE a hlavním jádrem (jak dlouho asi bude trvat překonat takovou fyzickou vzdálenost...), sdílení dat mezi SPE... aby to mohlo dosahovat dobrého výkonu, bude to vyžadovat software, který bude mít kvanta SIMD operací a hlavně navzájem nezávislých - takový mě napadá jen jeden: práce s videem. Na jakékoli jiné věci (včetně např. her) je to jaksi na nic, protože všechny ty jednotky až na jednu budou stát a čekat, co se stane.

Původně odeslal Petrik

takze mozna ze GPU maji vetsi teoreticky vykon, ale myslim si ze diky relativne pomalemu pristupu (oproti rychlosti pristupu SPE do sve lokalni SRAM)

No a? Do registrů bude mít přístup za 0T jako jakýkoli jiný procesor. Ale o tom to není, důležitý je prefetch, náhodné vyhledávání, latence do RAM atp. Grafická karta má přirozeně taky nějakou svojí SRAM na mezivýpočty.

Původně odeslal Petrik

Dale nevim, kde jsi vzal ze 99% programu je nutne sigle threaded, koukni se na benmarky noveho 4-jadra od intelu a uvidis, ze ve vetsine programu je jiz velmi znatelny narust vykonu, nekdy az 4-nasobny.

95 % her pro Xbox 360 v době vydání používalo jediné ze třech jader. Programátoři z toho byli nešťastní. Od Sony a jeho "úchvatného" Cellu dokonce utíkali, že se pro něco takového nedá programovat. Zrovna dělám test dual-core vs. single-core a je to bída - až na kódování videa a rendering je přínos dual-core ubohý, pokud už lze někde hovořit o nárůstu výkonu vlivem multithreadingu, je to tak kolem + 10 %. V mnoha testech je navíc dual-core pomalejší než single-core. Upozorňuju tě, že používám striktně reálně používané aplikace, ne nějaké synteťáky typu PCMark (navíc optimalizovaný na Intel pomocí jejich Math Library) či podobné věci.

Původně odeslal Petrik

A ze vsechny superpocitacove programy jsou jaxi nutne mega-multithreadove (kdyz to bezi na tisicech procesoru, tak to ani jinak nejde, ze) asi netreba dodavat.

Superpočítače počítají vědecké výpočty:
1) které jsou paralelizovatelné
2) do jejichž vývoje byly investovány miliony dolarů
Ani jedna z těchto podmínek není u běžného použití splněna (proto taky s dual-core přišli až v okamžiku, kdy neměli jinou možnost, jelikož jsou to neschopáci v dosahování frekvencí).

Původně odeslal Petrik

pro Cell, pro ktery navic jsou nebo budou relativne pratelske nastroje a kompilery

Přátelský nástroj je Visual Studio od Microsoftu, které pro Cell určeno není. Všechny proprietární řešení mají malou podporu vyplývající z toho, že tam nejsou peníze.

Původně odeslal Petrik

ktere doufam odvedou vetsinu spinave prace za cloveka (automaticka paralelizace kodu, optimalizace pro cell a pod.).

Zapomeň. Žádný kompilátor není schopen určit, které části kódu jsou paralelizovatelné a které ne. Nejlepší kompilátor světa - Intel C++ Compiler - umí auto-paralelizaci pouze u cyklů a výsledky jsou nepostřehnutelné. S vektorovými výpočty je na tom podobně. Vešketé paralelizace a výkonové vektorizace jsou dělány ručně... proto jich je taky tak málo.

Kompilátor, který by uměl určit závislosti kódu, by musel používat nějakou formu umělé inteligence a profile-guided optimalizace. Navíc by to byl tak složitý úkon, že by kompiloval odhadem týden.

Původně odeslal Petrik

Konsorcium kolem Cellu slibuje, ze by to v budoucnu (mozna uz ted) melo vypadat tak, ze se proste vezme stavajici kod v Cku, prozene se specialnim kompilerem a voala, staci to pustit na cellu a valit oci na rychlost, jakou to cell chroupa...

Sci-fi. Možná ve Startreku. Mimochodem, je úplně jasné, že nic jiného říct nemůžou. Hypováním si získávají pověst u lidí slyšících na velká čísla (podobně jako například u aut se děti chlubí maximálkou, i když každý řidič ví, že o té to zdaleka není)... hodně GFlopů, ale že je to jen někde, to už se neříká (podobně jako McLaren F1 může jet 380 jen na okruhu nebo na runwayi).

Původně odeslal Petrik

Me proste bavi, jak jste vsichni desne chytri a tvrdite, ze to fungovat nemuze

Protože třeba víme něco o programování? Máme s ním zkušenosti, víme něco o assembleru, pointerech atd.?

Původně odeslal Petrik

nejenom ze uz jsou hry pro playstation 3

Upřímně - myslíš si, že hry na Playstation budou lepší než hry na PC ? Nedávno nějaká firma tvořící jakousi novou střílečku prohlásila, že jí na konzole jako PS3 a XBox 360 nebude portovat, protože jsou na ní příliš pomalé! Fakt si myslíš, jak to všem Cell natře, když je Conroe schopen zásobovat daty dvojnásobný grafický výkon PS3ky? (high-end SLI jsou dvě grafiky, každá na úrovni té z PS3).

Původně odeslal Petrik

kdyz se IBM rozhodne vybudovat nejvykonejsi superpocitac na svete, tak ze to ma asi sakra posefovany, nemyslite?

No a? Itanium 2 má šest paralelním ALU jednotek. A už do něj taky cpou HyperThreading, aby je bylo možné nějak využít.

**swarm** · 13.09.2006, 05:49

Původně odeslal Eagle

Dyť na nich chtějí počítat fyziku a dekódovat HDTV MPEG4 AVC, tak proč by to nezvládly?

Souhlas. Zkuste si něco programovat v shaderech. Na grafikách se shader modelem 3.0 jsou cykly, větvení, skoky,...
Jako grafiky maj v sobě kurevsky velkej potenciál.
To je i důvod proč neuznávám třeba samostatné fyzikální akcelerátory. Proč si přidávat další vektorový procesor do počítače, když jeden velmi výkonný už tam máme v podobě grafické karty.

**Petrik** · 18.09.2006, 00:44

Původně odeslal Eagle

Dyť na nich chtějí počítat fyziku a dekódovat HDTV MPEG4 AVC, tak proč by to nezvládly?

Ano, presne tak, chteji. A pokud vim, chteji to uz sakra dlouho a porad kde nic tu nic. Proc asi, hm?

Původně odeslal Eagle

Revoluční? Co je na nějaké SRAM revolučního? To si vážně myslíš, že to nemá někde úzké hrdlo? Třeba přístup do RAM, závislosti výpočtů, latence mezi SPE a hlavním jádrem (jak dlouho asi bude trvat překonat takovou fyzickou vzdálenost...), sdílení dat mezi SPE... aby to mohlo dosahovat dobrého výkonu, bude to vyžadovat software, který bude mít kvanta SIMD operací a hlavně navzájem nezávislých - takový mě napadá jen jeden: práce s videem. Na jakékoli jiné věci (včetně např. her) je to jaksi na nic, protože všechny ty jednotky až na jednu budou stát a čekat, co se stane.

Ano Eagle, totalne revolucni. Nic jako 8+1 core NUMA system on chip pokud vim krome cellu skutecne neexistuje. Nechci se s tebou hadat, nevim jakou velikost maji registry GPUcek, ale 256kB na jednotku to asi nebude, ze? A pokud beres jako uzke hrdlo tu centralni sbernici, ktera ma propustnost 100GBps (GigaByte), tak souhlas, to je skutecne uzke hrdlo

) to nema zadna L1 cache v zadnem procesoru, Eagle. Otakzka jakou ma latenci, ale predpokladam ze zadnou nebo velmi malou. a co se pristupu do centralni pameti tyka, jak jiste vis, je to super rychla XDR.

Původně odeslal Eagle

No a? Do registrů bude mít přístup za 0T jako jakýkoli jiný procesor. Ale o tom to není, důležitý je prefetch, náhodné vyhledávání, latence do RAM atp. Grafická karta má přirozeně taky nějakou svojí SRAM na mezivýpočty.

Tady jde o to, ze kazda SPE ma 256kB SRAM primo u sebe

prefetch a ostatni veci bude resit kompilator resp vysledny kod ktery na tom pobezi stejne jako to ma transmeta pokud se nepletu.

Původně odeslal Eagle

95 % her pro Xbox 360 v době vydání používalo jediné ze třech jader. Programátoři z toho byli nešťastní. Od Sony a jeho "úchvatného" Cellu dokonce utíkali, že se pro něco takového nedá programovat. Zrovna dělám test dual-core vs. single-core a je to bída - až na kódování videa a rendering je přínos dual-core ubohý, pokud už lze někde hovořit o nárůstu výkonu vlivem multithreadingu, je to tak kolem + 10 %. V mnoha testech je navíc dual-core pomalejší než single-core. Upozorňuju tě, že používám striktně reálně používané aplikace, ne nějaké synteťáky typu PCMark (navíc optimalizovaný na Intel pomocí jejich Math Library) či podobné věci.

Tak to delas neco blbe, eagle, dual core by skutecne nemelo byt pomalejsi nez single core. Navic se koukni na tomshardware, tak testovali 2-core 2 duo (4 jadra) a skoro ve vsem je rychlejsi nez pbyc core 2 duo.

Původně odeslal Eagle

Superpočítače počítají vědecké výpočty:
1) které jsou paralelizovatelné
2) do jejichž vývoje byly investovány miliony dolarů
Ani jedna z těchto podmínek není u běžného použití splněna (proto taky s dual-core přišli až v okamžiku, kdy neměli jinou možnost, jelikož jsou to neschopáci v dosahování frekvencí).

Pokud sis vsiml meho minuleho prispevku, ja se tu ted bavim o superpocitacich a ne o beznem pouziti.

Původně odeslal Eagle

Přátelský nástroj je Visual Studio od Microsoftu, které pro Cell určeno není. Všechny proprietární řešení mají malou podporu vyplývající z toho, že tam nejsou peníze.

No tak si pis ze tady penize skutecne budou

)

Původně odeslal Eagle

Zapomeň. Žádný kompilátor není schopen určit, které části kódu jsou paralelizovatelné a které ne. Nejlepší kompilátor světa - Intel C++ Compiler - umí auto-paralelizaci pouze u cyklů a výsledky jsou nepostřehnutelné. S vektorovými výpočty je na tom podobně. Vešketé paralelizace a výkonové vektorizace jsou dělány ručně... proto jich je taky tak málo.

Podle toho, co jsem o tom cetl, to vypada, ze se alespon castecne mylis. A intel c++ je mozna nejlepsi v c++, ale co jsem pochytil z linuxove komunity, vsechny dulezite veci se pisi v samotnem C a v tom v hodne kodech exceluje GCC :P

Původně odeslal Eagle

Kompilátor, který by uměl určit závislosti kódu, by musel používat nějakou formu umělé inteligence a profile-guided optimalizace. Navíc by to byl tak složitý úkon, že by kompiloval odhadem týden.

Nechame se prekvapit, co rikas? Tyhle tvoje nazory, ze neco nejde, mi pripominaji takovej ten forek, ze nejakej programator nevedel, ze neco nejde a sel a udelal to

A to se deje docela casto, Eagle, pozor na to.

Původně odeslal Eagle

Protože třeba víme něco o programování? Máme s ním zkušenosti, víme něco o assembleru, pointerech atd.?

Neni to nahodou spis tim, ze jste nejchytrejsi na svete, takze nikdo nemuze udelat nic lepsiho nez si vy myslite, ze jde udelat? Hm? Ja ti neberu, ze toho vis hodne, ale zkus byt nekdy trochu vice otevrenejsi.

Původně odeslal Eagle

Upřímně - myslíš si, že hry na Playstation budou lepší než hry na PC ? Nedávno nějaká firma tvořící jakousi novou střílečku prohlásila, že jí na konzole jako PS3 a XBox 360 nebude portovat, protože jsou na ní příliš pomalé! Fakt si myslíš, jak to všem Cell natře, když je Conroe schopen zásobovat daty dvojnásobný grafický výkon PS3ky? (high-end SLI jsou dvě grafiky, každá na úrovni té z PS3).

Eagle, to je ale ubohe... patrne myslis vyvojare hry crysis a jejich pokracovani, ze. Tak kdybys to jejich prohlaseni cet pozorne, tak bys vedel, ze to neni kvuli vykonu (ten je u obou dostatecny), ale proto, ze to je psany pro DX10, ktere ani jedna nepodporuje.

Původně odeslal Eagle

No a? Itanium 2 má šest paralelním ALU jednotek. A už do něj taky cpou HyperThreading, aby je bylo možné nějak využít.

Nejak nechapu, co to ma delat s tematem, ale budiz.

**Petrik** · 18.09.2006, 00:48

http://www.scienceworld.cz/sw.nsf/ID...ocument&cast=1

Predpokladam eagle, ze jim jdes napsat, at se na to vykaslou, ze to prece nemuze nikdy fungovat a ze i kdyby, tak ze se pro to neda programovat. Mozna ze mas pravdu v tom, ze pro bezne pouziti to neni a mozna ze ani nidky nebude, ale myslim ze tohle je pro Cell genialni vyuziti.

**Eagle** · 18.09.2006, 03:20

Původně odeslal Petrik

Ano, presne tak, chteji. A pokud vim, chteji to uz sakra dlouho a porad kde nic tu nic. Proc asi, hm?

Protože zatím nemají čipset, který by jim umožňoval 2+1 grafiky.

Původně odeslal Petrik

Ano Eagle, totalne revolucni.

Na 486ce s pár SIMD procesory mi nic revolučního nepřijde.

Původně odeslal Petrik

Nechci se s tebou hadat, nevim jakou velikost maji registry GPUcek, ale 256kB na jednotku to asi nebude, ze?

To rozhodně nebude, když registry je úplně něco jiného než cache. Mimochodem, právě ses prokecnul, že jsi nikdy v assembleru neprogramoval. To je pak složité ti něco vysvětlovat, když ti chybí základní znalosti.

Původně odeslal Petrik

je to super rychla XDR.

Kdyby byly XDR tak super-rychlé a úžasné, už by je dávno použili na grafických kartách.

Původně odeslal Petrik

Tady jde o to, ze kazda SPE ma 256kB SRAM primo u sebe

No a? Itanium 2 má 24 MB cache a 1.7 miliardy transistorů. Velikost cache je čistě záležitostí výrobních nákladů a požadavků pro jakž tak plynulý výkon. Nemyslíš, že to je spíš důkazem zaostalosti, když nějaká SIMD jednotka potřebuje 256 kB cache? Logicky by měla využívat jen malou cache a vše ostatní si tahat ze sdílené cache, aby nebyl problém s koherencí.

Původně odeslal Petrik

vysledny kod ktery na tom pobezi stejne jako to ma transmeta pokud se nepletu.

Transmeta má x86 -> VLIW dekodér. To je kapánek něco jiného.

Původně odeslal Petrik

Tak to delas neco blbe, eagle, dual core by skutecne nemelo byt pomalejsi nez single core.

Dual-core může být vcelku snadno pomalejší než single-core. Stačí něco vědět o operačních systémech a je ti to jasné.

Původně odeslal Petrik

Navic se koukni na tomshardware, tak testovali 2-core 2 duo (4 jadra) a skoro ve vsem je rychlejsi nez pbyc core 2 duo.

1) To je ta stránka, kde udělali podraz na AMD, protože si u nich nechtělo objednat reklamu? P4 throttlující při 35 stupních mám ještě v živé paměti.
2) Ten test jsem viděl a až na pár specifických případů se žádný nárůst výkonu nekonal.

Původně odeslal Petrik

Pokud sis vsiml meho minuleho prispevku, ja se tu ted bavim o superpocitacich a ne o beznem pouziti.

Ty tady fanaticky obhajuješ 486ku se SIMD procesory, protože sis někde přečetl jakési číslíčko špičkového výkonu a seš z toho na větvi.

Původně odeslal Petrik

Nechame se prekvapit, co rikas?

Klidně. Už před rokem a půl mi spousta lidí nevěřila, že dual-core to bude mít na desktopu hodně těžké. Teď se ukazuje pravda.

Původně odeslal Petrik

zkus byt nekdy trochu vice otevrenejsi.

To mi připadá, jako kdyby ses mě snažil přesvědčit, že fyzikální zákony nefungují. Úplně stejná věc - určitá pravidla o posloupnosti instrukcí platí u každého procesoru. A že je in-order čip z dnešního pohledu krutě zastaralý, je realita (viz srovnání Pentium II vs. Pentium).

Původně odeslal Petrik

Nejak nechapu, co to ma delat s tematem, ale budiz.

Zřejmě tolik, že ani Itanium 2, které se už teď prosadilo v supercomputingu, nedokáže zcela využít svůj potenciál naplno.

**Petrik** · 18.09.2006, 13:38

http://www.cdr.cz/a/18570 Hned dva celly v rozkosne malem baleni vcetne 1GB XDR ECC. Sice je to podle Eagla uplne nanic, ale me se to moc libi

)

**Petrik** · 18.09.2006, 14:01

Nebudu to quotovat, jen neco napisu.
1)tech 256kB neni zadna cache, Eagle, ale tzv. local store a to je prave ta genialita te architektury. U cache musis resit koherenci apodobne veci, kdezto tento local store se pro SPE jevi jako normalni RAM, az na to, ze fakt rychla. Do hlavni pameti si saha pres DMA prenosy. To je prave ta genialita cellu, kteoru porad odmitas pochopit. Cely se to proste chova jako NUMA system, zadna cache (krome 512 u G5 PPE) se nekona.
2)Nikdy jsem netvrdil, ze jsem programoval v assembleru.Taky jsem nikdy netvrdil, ze rozumim procesorum.
3)mozna se milim, ale nema nahodu itanium 2 tak trochu problem se zasobovanim ALU a FPU daty? Neni to nahodu tim, ze cely chip je tak hrozne slozity, ze nez povede jeden jediny vypocet, musi nejdirv jeho logika provest tisice operaci? Cell je prvy opak, je velmi, velmi jednoduchy a v tom je podle me jeho sila. Ale mozna ze se bude opravdu hodit jen jako vykona kalkulacka pro nejake x86 procaky, jako to bude v tom movem 1PFlops superstroji (mimochodem, spickovy vykon ma byt 1.6PF, 1PT ma byt udrzitelny)
4)ad GPU: kdyz je GPU nekolikrat rychlejsi nez cell, nac vice grafik nez dve? dve grafiky das do kazde alespon trochu slusne desky.Problem bude podle me jinde.
5)ad transmeta: ja vim, co to je VLIW dekoder (je SW dekoder instrukci, ze?), ale nema nahodu i vetsinu logiky delanou pomoci SW? myslim tim prefetch a podobne veci, ktere jsou normalne zadratovany.
6)"To je ta stránka, kde udělali podraz na AMD, protože si u nich nechtělo objednat reklamu? P4 throttlující při 35 stupních mám ještě v živé paměti."
O podrazu na AMD nic nevim, ale na P4 trottlujici pri 35 stupnich neni nic divneho, u starych jader to zpusobovalo lokalni prehrivani, proc myslis, ze napr. nordwood mel jinak rozmistene ALU a FPU?
7)"Klidně. Už před rokem a půl mi spousta lidí nevěřila, že dual-core to bude mít na desktopu hodně těžké. Teď se ukazuje pravda."
To nemyslis vazne, ze? Vsichni, co si poridili dual core, na nej pejou oslavne ody, si trochu obcas precti forum, Eagle. I kdyby se vypocty nezrychlily, ve windows se ma vyrazne zlepsit odezva systemu pri vetsi zatezi (v linuxu to tak dramaticke asi nebude kvuli lepsimu CPU scheduleru). A skoro vsechny nove hry jiz samozrejmne vice jader podporuji a jsou hry, u kterych to uz ani jinak nejde, viz treba Ghost recon Advanced warfigter, ktery je brzden mojim 2.8GHz K8 sempronem a vic nez 40FPS z nej nevytahnu ani v 640x480.

Původně odeslal Eagle

Protože zatím nemají čipset, který by jim umožňoval 2+1 grafiky.

Na 486ce s pár SIMD procesory mi nic revolučního nepřijde.

To rozhodně nebude, když registry je úplně něco jiného než cache. Mimochodem, právě ses prokecnul, že jsi nikdy v assembleru neprogramoval. To je pak složité ti něco vysvětlovat, když ti chybí základní znalosti.

Kdyby byly XDR tak super-rychlé a úžasné, už by je dávno použili na grafických kartách.

No a? Itanium 2 má 24 MB cache a 1.7 miliardy transistorů. Velikost cache je čistě záležitostí výrobních nákladů a požadavků pro jakž tak plynulý výkon. Nemyslíš, že to je spíš důkazem zaostalosti, když nějaká SIMD jednotka potřebuje 256 kB cache? Logicky by měla využívat jen malou cache a vše ostatní si tahat ze sdílené cache, aby nebyl problém s koherencí.

Transmeta má x86 -> VLIW dekodér. To je kapánek něco jiného.

Dual-core může být vcelku snadno pomalejší než single-core. Stačí něco vědět o operačních systémech a je ti to jasné.

1) To je ta stránka, kde udělali podraz na AMD, protože si u nich nechtělo objednat reklamu? P4 throttlující při 35 stupních mám ještě v živé paměti.
2) Ten test jsem viděl a až na pár specifických případů se žádný nárůst výkonu nekonal.

Ty tady fanaticky obhajuješ 486ku se SIMD procesory, protože sis někde přečetl jakési číslíčko špičkového výkonu a seš z toho na větvi.

Klidně. Už před rokem a půl mi spousta lidí nevěřila, že dual-core to bude mít na desktopu hodně těžké. Teď se ukazuje pravda.

To mi připadá, jako kdyby ses mě snažil přesvědčit, že fyzikální zákony nefungují. Úplně stejná věc - určitá pravidla o posloupnosti instrukcí platí u každého procesoru. A že je in-order čip z dnešního pohledu krutě zastaralý, je realita (viz srovnání Pentium II vs. Pentium).

Zřejmě tolik, že ani Itanium 2, které se už teď prosadilo v supercomputingu, nedokáže zcela využít svůj potenciál naplno.

**Caleb** · 21.09.2006, 11:35

Původně odeslal Petrik

Ano, presne tak, chteji. A pokud vim, chteji to uz sakra dlouho a porad kde nic tu nic. Proc asi, hm?

http://www.gpureview.com/ati-firestr...ticle-404.html
http://www.theregister.co.uk/2006/09/19/ati_gpgpu/
http://www.peakstreaminc.com/news_ev...es/091806a.php

**Fox!MURDER** · 21.09.2006, 12:27

Původně odeslal Caleb

http://www.gpureview.com/ati-firestr...ticle-404.html
http://www.theregister.co.uk/2006/09/19/ati_gpgpu/
http://www.peakstreaminc.com/news_ev...es/091806a.php

uz se tesis, az si budes ud moct pustit i na grafice ?

**Caleb** · 21.09.2006, 12:33

Původně odeslal Fox!MURDER

uz se tesis, az si budes ud moct pustit i na grafice ?

Hehe, ani ne, nevim proc bych mel svoji elektrinou sponzorovat nejaky vyzkum mimozemstanu nebo co to pocitaji

**Petrik** · 21.09.2006, 20:47

Jako ja vim, ze se chysta spousta veci, ale prave se porad chystaji...zatim. Cell je v tom dal, na tom uz neco opravdu bezi.

*UPDATE*: Ha! tak to vypada, ze se uz neco objevilo: http://www.zive.cz/h/Bleskovky/AR.asp?ARI=131337 Jestli to vyuziva jen 5% a je to pritom nekolikanasobne rychlejsi, tak nechci vedet, jak rychle to pojede, kdyz to bude vyuzivat 100%

)

Par citaci z http://folding.stanford.edu/FAQ-ATI.html :

Much like the Gromacs core greatly enhanced Folding@home by a 20x to 30x speed increase via a new utilization of hardware (SSE) in PC’s, in 2006, Folding@home has developed a new streaming processor core to utilize another new generation of hardware: GPU’s with programmable floating-point capability. By writing highly optimized, hand tuned code to run on ATI X1900 class GPU’s, the science of Folding@home will see another 20x to 30x speed increase over its previous software (Gromacs) for certain applications.

In addition, through a collaboration with Pande Group, Sony has developed an analogous core for the PS3’s Cell processor (another streaming processor), which should see a significant speed increase for the science over the types of calculations we could previously do on a x86/SSE Gromacs core as well. Following what we did with the introduction of Gromacs, we will now switch benchmark machines and include an ATI X1900XT GPU in order to be able to benchmark streaming WUs (which cannot be run on non-GPU machines). This machine will also benchmark CPU units (which continue to be of value since GPUs work only for certain simulations) without using its GPU.

Mozna to ale s ostatnima GPU tak horky nebude:

What about video cards with other (non-ATI) chipsets?
The R580 (in the X1900XT, etc.) performs particularly well for molecular dynamics, due to its 48 pixel shaders. Currently, other cards (such as those from nVidia and other ATI cards) do not perform well enough for our calculations as they have fewer pixel shaders. Also, nVidia cards in general have some technical limitations beyond the number of pixel shaders which makes them perform poorly in our calculations.

Původně odeslal Caleb

http://www.gpureview.com/ati-firestr...ticle-404.html
http://www.theregister.co.uk/2006/09/19/ati_gpgpu/
http://www.peakstreaminc.com/news_ev...es/091806a.php

**Petrik** · 17.10.2006, 09:44

Treba protoze ti to jednou muze zachranit zivot? Je to protein folding a vyuziti bude napr. pri lecbe rakoviny a podobne...

Původně odeslal Caleb

Hehe, ani ne, nevim proc bych mel svoji elektrinou sponzorovat nejaky vyzkum mimozemstanu nebo co to pocitaji

Téma: Cell

Nástroje témat

Zobrazení

Re: Chyba v Navrhu Cell CPU

Re: Chyba v Navrhu Cell CPU

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Re: Cell

Informace o tématu

Users Browsing this Thread

Podobná témata

Procesory Cell - PS3

Nvidia podvádí i v Beyond3d's Splinter Cell benchmark?

Pravidla přispívání