Citace Původně odeslal Eagle Zobrazit příspěvek
Cache nijak s dvoujádrem nesouvisí. Intel klidně mohl udělat single-core se 4 MB L2. Neudělal, protože by na to nemohl nabalit dual-core BS a prodávat to za dvojnásobnou cenu. Lidi nejsou zas tak hloupí, aby nevěděli, že velká cache není něco, za co by se nechali nachytat a za co by byli ochotni zaplatit dvojnásobek.
No, neviem, viz servrove CPU. Su podstatne drahsie - ale iba koli cache. Ak by bola 2x vacsia cache, tak by sa robil marketing o tu cache. V podstate skoro ani nezavisi aky je ten novy procesor, ake ma presne feature, hlavne ze je celkovo vykonnejsi a teda ho mozno draho predavat. Marketing by skratka propagoval inu feature, ale o tom sme sa tu uz bavili...

Víš, jakých procesorů se prodá nejvíc, zejména ve státě typu ČR ? Jsou to levné Semprony a levné A64. Takových čipů se prodává hromada, C2D E6300 je teď v cenové relaci, která je pro hodně lidí příliš vysoká. Modelů jako E6600 se u nás prodá naprosté minimum. A jen pro zajímavost - CPU v ceně nad 20 tisíc se prodá v pár desítkách, maximálně stovkách kusů za rok. Ano, uznávám, že v porovnání s E6600 je AMD dražší, ale to nic nemění na faktu, že za pár MHz navíc bych si ty horentní sumy nepřiplatil ani u Intelu, a proto je pro mě tahle kategorie nezajímavá. Beztak v téhle kategorii už single-core nejsou a nač bych platil víc za DC, když ho nevyužiju? (= E660 stojí víc jak 3x tolik co A64 3500+, ale o kolik má vyšší výkon? 20 % ?).
Sice e6600 stoji 3x viac ako 3500+, ale ja ti viem ukazat fx-62, ktory ma rovnaky vykon ako 6600 a stoji este 2.5x viac...
A ano, najviac procakov sa preda lacnych, no a?
A samozrejme, tiez je jasne ze optori procesoru s najlepsim pomerom cena/vykon, budu mat vsetky ostatne tento pomer horsi. Ved aj SC s o 20% vyssim vykonom nestoji o 20 ale o 50% viac...

Víš, ony se ty ceny změní tak, že single-core ještě zlevní. Teď máš Celeron D 347 za 1500 s DPH. P4 6xx má od ledna stát 69 dolarů (2000 s DPH). C2D zlevňovat nebude, A64 X2 asi taky ne.
a potom zmenis tie tvrdenia ze p4 za danu cenu nema co nabidnout? Ved potom bude lacnejsi ako rovnako vykonny A64...
Budes prepisovat vsetky tie prispevky?

Protože tohle, co tady uvádíš, ti přidá nějakou hodnotu (např. u té limonády chuť). Já vím, že je těžké pochopit, že dual-core nepřidá vůbec nic. Tak se ti to pokusím vysvětlit ještě jinak, polopaticky:

výkon SC: x
výkon DC v ST aplikaci: x
cena SC: y
cena DC: 2y

poměr výkon/cena u SC: x/y
poměr výkon/cena u DC: x/2y

Co má vyšší poměr? Jistě že SC. A nezmění se to do doby, než výkon u DC v ST aplikacích bude 2x nebo cena DC bude y. Ale taková situace teď není.
tak za 1., vykon DC v ST aplikaci 1.1-1.3x v zavislosti co vsetko mi bezi na pozadi (winamp, TS, dc++, driver zvukovky atd.)
za 2., cena DC 1.2y, 1.3y, resp. v istych kategoriach vykonu obdobne SC nie je. Ty si nasiel jeden priklad kedy je cena 2x vyssia, ja som ti nasiel dva protipriklady kedy nie je - ale odmietas to uznat.

Tam ti pomůže i cache OS a DRAM buffer na disku. Další prostor pro zlepšení je malý.
nj, tak ked uz nic, aspon to znizi spotrebu, ale ak tam budu dobre nacacheovane veci, tak to moze dost pomoct (napr. pri bootovani a pod.).
To uz je ale trocha OT.

Pokud mi něco na default přinese jen pár desítek procent výkonu navíc a přitom to stojí majlant, tak to nepovažuju za dobrou koupi.
Poradim ti, pretaktuj...


Latence RAM se nemění, ale zvyšuje se propustnost, takže agresivní prefetch a velká cache můžou hodně zachránit. Kdyby ještě udělali hardwarový speculative-precomputation, podaří se jim tenhle bottleneck z velké části odbourat.
Myslim ze pre-computation by dost zvysila spotrebu.

Jenže ty tu srážku musíš odhalit a to se ti bude dělat pěkně blbě, když budeš hýbat dvěma objekty současně a ne po jednom.
tak mi prosim popis, v com presne spociva rozdiel pri pocitani fyziky seriovo a paralelne, v com sa meni algoritmus ratania kolizii a preco to sposobi tak velky problem, ak sa budu robit vypocty paralelne...

Co sa tyka toho textu - bud dobre nerozumies anglicky, alebo si to fakt necital.

V tom textě nic takového napsané není.
Ale je!
Je tam cosi o tom, že umožňují číst z jedné lokace více threadům, což ale předpokládá nezávislost operací.
spravne
V reálu ale ty závislosti jsou a hodně.
5% nepovazujem za hodne
Zbytek zavání šílenými deathlocky, což sami autoři potvrzují.
ano a hned dalsia veta popisuje riesenie
Jak je překonat, je snad jasné - prostě se na závislosti vykašlat a udělat to se zastaralými daty (= prasárna).
NIEEE, proste sa pouzije r/w lock, ziadne stare data, ziadne prasarny.

Tak este raz ten text:

The new pipeline featured so much multithreading that special efforts were needed to avoid the dreaded deadlocks and other pitfalls mentioned earlier. To accomplish this, programmer Leonard made use of a technique called lock-free algorithms. He implemented a spin lock to replace the more traditional mutexes (mutual-exclusion algorithms) and semaphores that are used to flag threads as being "safe" to multithread. The spin loop utilizes a new interlock instruction that is built into the CPU. However, there were still too many deadlocks. Tom examined the threads' activity with profiling tools, and it turned out that 95 percent of the time the threads were reading memory while only spending 5 percent of their time writing. A read/write lock allowed many threads to read the same bit of memory, but only one thread to write to it.

Takze sa pouziva spin lock a r/w lock. Co je na tom nepochopitelne? Normalne sa zamyka, normalne to funguje.