Vykon CPU, Teplota a optimalne odladenie RAM.
Pri testovani novej zostavy som narazil na problem v tom ze som na ramkach nemal tolko setrit... A tiez na to ze DDR2 varianty dosky by boli asi aj spolahlivejsie na chod a mali by lepsie OC.
Ramky mam Nanye 1600 9-9-9-28 1,5v, CPU je x3360 (alias xeonova verzia q9550), chipset je X48.
Default config:
FSB 400, vsetky napatia okrem CPU na defaulte, Ram na 1600mhz Frekvencia CPU 3400Mhz
K testu stability a ciastocne vykonu som pouzil LinX (tj Linpack x64).
Pri tomto nastaveni sa linpack test vykonal za 105 sekund.
Toto nastavenie ale vykazovalo nestabilitu prave kvoli RAM ktore niesu vobec vhodne k danej doske a na mnohych nastaveniach ani nefunguju spravne. Preto som alternativne nastavil delicku 333/1066 s vyslednou frekvenciou ram 1280Mhz a CAS 7-7-7-14..
FSB 400, Vsetky napatia okrem CPU na Defaulte, Ram na 1280mhz Frekvencia CPU 3400Mhz
Pouzity presne ten isty Linx bez nejakych dalich uprav systemu.
Pri tomto nastaveni sa linpack test vykonal za 99 sekund.
Povodne som si myslel ze je to statisticka chyba +-5 Percent. Problem ale bol v tom ze k testu sa pridruzil este jeden merany aspekt a to bola teplota CPU ktora bola vyssia v priemere o 6 stupnov celzia (z 62-68), tak som testy zopakoval tolko krat aby som chybu vylucil. Danym vysledkom casu tiez zodpovedali hodnoty v Gflops.
Ak to zjednodusim... Mam tu celkom spolahlivu metodu merania toho vykonu CPU ktore je zavisle na RAM. Momentalny vysledok znamena zlepsenie vykonu CPU o 5 percent v specifickom tasku., pricom mam aj nejake realne namerane cisla ktore hovoria ze nejaka mensia frekvencia a nizsia CAS je lepsia nez privysoka frekvencia s vyssimi CAS. Nasledne ocakavam ze sa tato optimalizacia prejavi aj pri kompresii videa a pouzvani komprimovacich programov. Prakticky som ale takto zvysil efektivitu spoluprace RAM a CPU.
Prepocty s CAS latenciou pri danej frekvencii ukazali ze 1600Mhz pri CAS9 trva 56 nansekund nez RAM odpovie procesoru, 1280 CAS7 trva 54 nanosekund nez ram odpovie. Tak by mohla vyzerat pricina.
Testy v 3dmarku03 potom ukazali ze vykon sa nijak dramaticky nezmenil z pohladu 3d aplikacie resp ze presuny vacsich dat medzi grafikou a pamatou spomalenie frekvencie vyrovnali rychlejsiu pracu medzi CPU a RAM. (Aneb 68000 3d markov VS 68000 3d markov)
Urcite som neobjavil ameriku - vcelku je mi jasne ze mensie CAS latencie resp nizsie response time na RAM znamenau automaticky zlepsenie vykonu, trochu ma ale prekvapilo ze k zlepseniu doslo aj za stavu ked sa frekvencia RAM znizila.
Chladim inak vzduchom - Case THERMALTAKE VK60001N2Z ELEMENTS s aktivnymi vypustmi vzduchu okolo CPU chladica - Thermolab baram s 12cm ventilatorom ale aj tak 6 stupovy rozdiel povazujem za celkom velky, ale zhruba to zodpoveda tomu kolko z plochy CPU tvori Cache.
Predbezne vysledky ukazuju ze kazda ram ma istu frekvenciu a CAS kedy je vykon CPU lepsi nez na maximalnej frekvencii a CAS ktore dovoluje a hlavnym faktorom je hlavne odozvy, ale v urcitom stave uz kratsie latencie prestanu stacit a prejavi sa to ze prenos dat trva dlhsie. Napriklad 1600 CAS7 by na 1333CAS 8 boli pomalsie, az na CAS 6 by boli rychlejsie. Otazkou je ci by to taketo ramky zvladli a ci to zvladne doska.
Hodnoty kedy mi RAMky pri istych frekvenciach a CAS funguju som si zatabulkoval a dopocital som teoreticke cakanie v nanosekundach. napriklad 1066 CAS6 tieto ramky uz nezvladaju, a 1066 CAS7 trva odozva od ram rovnako dlho ako pri 1600 CAS9 - 56ns. Ak by som sa teda rozhodol znizit ich frekvenciu za ucelom lepsich CAS problem by sa urcite dostavil v tom ze vykon by bol nizsi nez pri "default" hodnotach RAM. Nie kazda frekvencia s nizsim CAS znamena lepsie hodnoty.
Default Frekvencia + Default CAS + Default Odozva = Vykon X.
Mensia frekvencia + Mensia CAS + Default odozva = Vykon <X
Mensia frekvencia + Mensia CAS + Mensia odozva ako pri default = Potencial pre Vykon =>X
Bohuzial to nieje stopercentne.
Z tabulky tiez vyslo to ze pri danych ramkach je frekvencia 1280 a CAS 7 najidealnejsie pretoze cas na reakcie RAM je v tomto pripade najkratsi zo vsetkych co nasledne potvrdili aj merania ktore som urobil - pri ziadnej inej moznej frekvencii a CAS by sa mi tento jav zvyseneho vykonu pri LinXe urcite neprejavil.
Re: Vykon CPU, Teplota a optimalne odladenie RAM.
Jestli máš čas tak prosím otestuj ještě Cinebench R10. Podobný pokusy jsem dělal s AMD Phenom II a tam naopak k mému zklamání nemělo nastavení ram prakticky žádný vliv (ale LinX jsem nezkoušel, až bude čas zkusím).
Re: Vykon CPU, Teplota a optimalne odladenie RAM.
1280 CL 7:
Opengl standard test" CB 5718
Single CPU Render Test" CB 4211
Multiple CPU Render Test" 15004
(este test na inim nastaveni a uvidime realne, zatial ale vidim zlepsenie, len to overim.)
Update
1600 cl9
Opengl standard test" CB 2940
Single CPU Render Test" CB 4194
Multiple CPU Render Test" 15163
Na Cinebenchi ziadny velky rozdiel - opengl standard sa tu vzdy zosekal, takze vysledok nieje doveryhodny.
Re: Vykon CPU, Teplota a optimalne odladenie RAM.
Pokud máte zájem,mužu udělat pár testú na mé i920:)
Re: Vykon CPU, Teplota a optimalne odladenie RAM.
Takto este jedna vec. Tych cca 5-6 percent v LinXe sa prejavilo pri vyuziti vsetkych styroch jadier (of course), to znamena ze pri dvojjadrovom stroji by sme rozdiel nad 2.7 percenta vo vykone nedostali a to by som si uz ani ja nevsimol, pri jednom jadre by akekolvek rozdiely boli zanedbatelne.
Momentalne som v praci takze nemam moznost dokoncit test na 1600Mhz ale predtym som mal vykon v CB okolo 13 000-14 000, len vtedy som nemal pc skoro vobec odladene.
Od jedneho australskeho Overclockera mam este referenciu ze je to specifikum pre P35 az X48 chipsety. Mozno to suvisi s archaickou metodou akou tieto cipsety funguju (ich zakladna idea je stara cez 15 rokov, moje PIII ma cipset rovnakeho typu oznacovany ako Intel GTL+, hlavne ale ide o to ze pamatovy radic je v chipsete), a post-Nehalem intely a vsetky AMD s integrovanym pamatovym radicom na CPU uz s tymto nebudu mat tak vyraznu reakciu na zmeny nastavenia. Pokial je pravda aj to ze u Core2 kazdy CPU core adresuje pamat separatne nezavisle na ostatnych jadrach alebo hocicom inom (pac neviem o tom ze by Core2 quad malo nejaku specialnu sucast aka je napr v nehalemoch a optimalizuje pristupy k ram a cache) tak je vcelku jasne aj to preco sa mi 2 nanosekundy tak drasticky prejavili na teplote CPU.
Jedna tabulka:
3 4 5 6 7 8 9
800 37 50 62* 75 87 100 112
1066 28 37 46 56* 65 75 84
1280 23 31 39 46 54* 62 70
1333 22 30 37 45 52 60* 67
1600 18 25 31 37 43 50 56*
1800 16 22 27 33 38 44 50
toto su vypocitane (teoreticke) casy v nanosekundach kym ram zareaguje pri urcitej frekvencii a CAS latencii. Ak mam ramku 1600 CAS 9 tak mozne konfiguracie su tie oznacene hviezdickou. tj ak uberiem jednu triedu frekvencie tak znizim CAS o 1 a plati to viac menej univerzilne +- nejake rozdiely spravia dobre taktovatelne ramky. 1600vky s CAS 7 by mi dali teda teoreticky 39ns pri 1280 CAS 5.
Re: Vykon CPU, Teplota a optimalne odladenie RAM.
Hlavně by jsi měl přesat počítat a připomenou si některá akta. LGA 775 používá quad-pumped FSB. Stejnou jakou používala první P4 do socketu 423 s chipsetem I850. Tato sběrnice byla optimalizovaná na chos a pamětpmi rambuss rim, memory prefetchem v L2 cache CPU, atd.
Co je ale zásadnější je, že desky kde se chipset a CPU propojujou staromódní FSB, což je tento případ, jsou hodně háklivé na synchro /asynchro přenos. V dobách P3 to bylo naprosto zásadní. Když člověk měl cpu s FSB 100 a dal tam paměti na 100mhz, vše bylo ok, ale když jsi je přepnl na 133, tak ačkoliv byl jejich takt větší, razantně jsi pocítil propad ve výkonu.
Teď si vezmi třeba takový Core 2 duo E8600. baseclock je 333mhz, sběrnice je quadpump = 1333mhz. Sběrnic na cpu má šířku 64-bit. Tak a paměti protože jsou DDR ne QDR, tak při baseclock té samé ala 333mhz pracujou na 667, ve chvíli kdy ale máš dual-chanell, tak maj šířku 128-bit a tedy stejnou ropustnost jaká je propustnost FSB. Navíc clockgen jeden pro cpu i ram synchro na 333. Toto v kombinaci s agresivníma latencema je je tedy nejlepší volba. I velice opulární kombo s 800mhz pamětma je špatně protože už se tam ztrácí synchron a je to horš. Další je až pak synchron na 2.0 ala když paměti poběžej na dvojnásobku FSB, v tomto případě by to byly DDRIII 1333. Nicméně prostupnost už neroste díky limitaci FSB a tudiž se může projevit jen negativní růst latencí. Výkon se nezvedne. Nebo jen v rámci chyby měření.
Více než na Intelech je to vidět na Nforce. Ty oproti Intelu maj při asynchro modu horší výkon ale v syncho jej často i porazej. Chipsety s DDR2 na synchronu a s DDR3 na tom dvojnásobnym.
Takže strategie co se mi vždy u core 2 yplatla nejvíce, dát paměti na syncho, vyhnat FSB co to jen jde, pak upravit násobič a nakonec ještě zkusit agresivnější latence. Víc nemá smysl řešit. (krom pár vyjímek ala zpomalení Nforce nad FSB420 atd.).
Re: Vykon CPU, Teplota a optimalne odladenie RAM.
Synchro ako take je mi znama vec. To samozrejme viem. S tym som pocital pri kupe ram a uvazoval som bezat na synchre 1:1 na 800Mhz alebo 1:2 1600 (kde ma to nakoniec poslalo do teplych krajin)
Agresivnejsie CAS su samozrejme moznost s tym pocitam tiez, ale problem u Synchier na tejto masine s tymito RAM je to proste vacsinou ani nepostne, co je uz problem pamati, a dufam ze ho vyriesi par novych OCZ ...
Re: Vykon CPU, Teplota a optimalne odladenie RAM.
OCZ jsou teda nic moc paměti dnes. Kdyby jsi koupil radši ňáký Corsairy. Všeobecně ale LGA 775 a DDR3 = bad move,. To k sobě prostě nejde a nepatří.
2 Příloh-a(y)
Re: Vykon CPU, Teplota a optimalne odladenie RAM.
DOCu, cim idealne merit propustnost pameti? Napr. u Everestu mi to hlasi vyssi propustnost pri pametech na 1066MHz a pomeru fsb/dram 3:4 nez kdyz je snizim na 800MHz a snizim latence... bohuzel porovnavaci screeny uz nemam resp. ted "nazpet" muzu porovnat jen X48+Corsairy@1066-5-5-5-15 vs. P35+Kingstony@800-4-4-4-12 (viz. prilohy), ale pamatuju si, ze me vzdy vykon v Everestu rostl spise s frekvenci pameti (testovano se stejnymi moduly, jen zmenen pomer a casovani). Tim nechci tvrdit, ze nemas pravdu - spis prosim o radu, cim tedy realne merit (sw). Diky
Re: Vykon CPU, Teplota a optimalne odladenie RAM.
Podobneho vysledku dosiahlo viac ludi. Pre P35 az X48 aj niekolko testov na Anandtechu ukazuje ze zakladnym ukazovatelom uz nieje synchro ako som aj ja zvyknuty, ale cisto latencia (kolonka uplne vpravo u ramiek).
OCZ ktore kupujem by mali mat cip Micron D9GTR. odporucili mi ho vsetci overclockeri s ktorymi som bol v kontakte a su to jedine ramky ktore vyrobca tej dosky odporucil aj v najtazsich konfiguraciach.
Re: Vykon CPU, Teplota a optimalne odladenie RAM.
Nou to je celkem logickýá protože jak jsem popsal předtim, nad 2x FSB už je to asynchro a jediný co tam člověk získává s DDR3 jsou horší latence, jedině Nforce 790 ještě těžila z toho 2x versus FSB.
jimmy - Já nikdy netestuju prostupnost pamětí protože je nepodstatná. Kdyby mi šlo o tu tak tu dodnes sedim s I850E P4 NW 3,06 @ 3,6 a dual-chanell RDRAM 1066 @ na bůh ví co. Pro paměti (snad s vyjímkou winraru, atd.) je hlavně důležitá přistpovka. Tím nemyslim CL 2,3,4,5... ale přístup do paměti, čili poměr frekvence a časování + dělička a jak si s tim kterej chipset popere. A testuju si to obvykle tak, že si najdu hodně cpu limited hru s jednou statickou vždy stejnou a stálou scénou, a sleduju FPS, kde dostanu nejelpší tak to je pro mě nejlepší nastavení pamětí. Propustnost v Mb/s v ňákym teoreticky benchmarku neměřim. Občas jsem to jště testoval na ramdrive což je celkem reálnej ukazatel práce paměti, ale systém musí bejt naprosto v klidu a nic neběžet na pozadí, i pohyb USB myši (protože uSB je stupidní CPU driven sběrnice) způsoboval znatelné odchylky.
Re: Vykon CPU, Teplota a optimalne odladenie RAM.
OCZ Platinum 1600 CL7 1.65v
1600Cl7
Linx
103 sekund priemer
Teplota CPU 67 stupňov
CinebenchR10 x64
OpenGL Standard test:
CB 6623 (6697)
Single CPU Render test:
CB 4219 (4241)
Multiple CPU Render test:
CB 14918 (14953)
(oproti Nanya ram je zlepšienie 2 percenta, rozhodne sa ale zlepšilo efektívne vyťaženie CPU, skúsim ešte 1280 a CL ktoré pôjde, ale dovolilo max CL6, čo rozdiel v medzi 1600 a 1280 samorejme zmenší)
1280 CL6
LinX 106 sekund
Teplota CPU 67 stupnov
Cinebench R10 x64
OpenGL Standard test:
CB 6721 (6808)
Single CPU Render test:
CB 4207 (4229)
Multiple CPU Render test:
CB 14547 (14910)
Este Teda 1280 CL7...
LinX 100 sekund (!)
cinebench
OpenGL Standard test:
CB 6697 (6787)
Single CPU Render test:
CB 4216 (4222)
Multiple CPU Render test:
CB 14908 (15137)
A ešte skúsim 1600CL7 a procesor dám na 3200mhz cez multiplikátor.
Linx 109 sekund
Teplota 65 stupnov
cinebench
OpenGL Standard test:
CB 6671
Single CPU Render test:
CB 3989
Multiple CPU Render test:
CB 14226