Výsledky 1 až 9 z 9

Téma: Abit VP6 a experiment s tualatinmi

Threaded View

Předcházející příspěvek Předcházející příspěvek   Další příspěvek Další příspěvek
  1. #5

    Standardní Re: Abit VP6 a experiment s tualatinmi

    pri testoch s 2x CU mine som zistil velmi zaujímavé veci o chovaní multithreadových aplikácií.

    Ak by sme na takejto zostave s dvoma starými a slabučkými procesormi spustili hru alebo program s jedným threadom tak by sme k behu programu využili jeden z týchto procesorov a výkon aplikácie by tomu zodpovedal.

    príklad zostavy:
    2x CU-Mine 1Ghz. (jedno jadro má výkon 230mflops)
    grafika X850xt (s fillrate 8000 megatexelov)
    1,5 gb SDRam 133Mhz CL2

    versus
    1x Tualatin 1,4 Ghz (jedno jadro má výkon 420 mflops)
    ostatné komponenty vrátane čipsetov ostávajú rovnaké

    ako testovaciu aplikáciu som použil 3dMark2001.

    Pri týchto kombináciách procesorov a grafickej karty a testovacieho SW je jasné že sa využijú maximálne schopnosti z éry DX 8.1 takže shader engine sa velmi nevyužije a to čo dostaneme vypovedá skôr o výkone procesoru než o výkone grafickej karty (ktorá je totálne predimenzovaná a umožňuje teda procesoru ukázať naozaj všetko, ničmenej sa ukáže sila len jedného procesoru)

    2x CUmine - 7000 bodov (jeden thread)
    1xTualatin - 12000 bodov (tiež jeden thread)

    Ako druhú testovaciu aplikáciu som zvolil Oblivion ktorá je viacthreadová ale zároveň je slávna tým ako je bugová a neoptimalizovaná. To čo som potreboval a chcel vidieť je ako dokáže aplikácia distribuovať výkon na dve jadrá ktoré sú spolu rovnako výkonné ako jedno iné samostatné jadro, pričom ostatné podmienky (ramka, čipset, harddisk, zvukovka, OS) som zachoval identické.

    2x CU Mine
    Velmi výrazne lepšie sa chovalo "loading level" ktoré prakticky skoro nijak nenarušovalo chod hry. Rovnako fyzika (pri padaní vecí a kreatúr) nenarušovalo chod hry viac než bolo treba. Tiež AI niesla znaky toho že sa výkon distribuuje.

    Pokial vyjdete z "Prison Sewers" a kúsok sa prejdete po ostrove tak aby ste mali výhľad na "Waterfront" tak pri CUminoch zistíte že počítaču dochádza dych. Waterfront je LOD (to jest vzdialená zjednodušená lokácia). NIesú tam nijaké NPC, nieje tam aktívna fyzika sú tam len trojuholníky. Je to jedna z najzložitejších LOD štruktúr aké v hre môžete vidieť.

    Tento test teda ukázal že v Oblivione máme nasledovné separátne thready:
    - 3d rendering (meshe a práca s nimi)
    - výpočet fyziky
    - práca s AI

    Thready sú v rámci procesu generovania 3d obrazu prepojené a práca jedného je závislá na výsledkoch ostatných. Pokial ktorýkolvek thread začne so svojou prácou meškať (lebo zahlcuje procesor) tak ostatné thready musia čakať na to kým pomalší thread dokončí svoju prácu a až potom môžu pracovať dalej alebo použiť dalšíe výsledky.

    Najnáročnejším threadom sa ukázal byť thread 3dRenderingu (je kompletne založený na DirectX a vôbec si nezľahčuje prácu tým že by využíval menej náročný openglide).

    V globále teda multithreading bol použitý čo sa ukázalo v celkovo svižnom chode hry, ale zároveň sa ukázalo že celkový výkon je limitovaný jedným z programových threadov. Úplne rovnakého efektu by sme dosiahli inštalovaním slabej grafickej karty (povedzme NV6200)


    Potom som spustil Oblivion na Tualatine. Celkové priemerné FPS bolo o cca 10 vyššie. Avšak nahrávanie terénu, AI alebo fyzika viditelne spôsobovali zásadnejšie framedropy. Dôvodom je to že zdielanie jedného CPU pri multitaskingu spôsobovalo dočasné potlačenie niektorých taskov a tým pokles výkonu. Prejavilo sa však to že u tualatinu mohol rendering thread prekročiť hranicu 230mflops ktorou ho limitovali CU Mine.

    Zistenia:
    - jeden thread v multithread aplikácii sa chová rovnako ako jednothreadová aplikácia - to jest jeden thread sa zavesí len na jeden procesor. na CUmine sa prejavilo že jeden thread zahltil jeden z procesorov a tým pádom aplikácia mohla pracovať len tak rýchlo ako ten najpomalší thread.
    - viac threadov pomáha distribuovať výkon rovnako ako keď spustíte viac nezávislých jednothreadových aplikácií. Inými slovami viacthreadová aplikácia sa chová ako "dva a viac" v jednom.
    - jedno výkonnejšie jadro môže byť efektívnejšie než viac málo výkonných. Ak napríklad má aplikácia dva thready pričom jeden potrebuje 800 Mflops a druhý potrebuje 400 Mflops tak vám postačí uniprocesor s výkonom 1200 mflops. Ak by ste skúsili túto aplikáciu spustiť na procesore Core2 Duo kde jedno jadro by malo výkon 600 mflops x2 aplikácia by nebežala tak efektívne pretože thread 1 by svoje jadro zahlcoval a bežal by teda pomalšie.

    toto je však otázka ako dobre dokáže byť náročnosť distribuovaná v rámci aplikácie.

    - viacthreadová aplikácia síce pracuje na relatívne nevýkonnej konfigurácii 2x CUmine pomalšie, ale zato plynulejšie bez väčších výkyvov ktoré by spôsobovali prehnané nároky na jediný procesor v dôsledku absencií optimalizácií - menšie framedropy, minimálne FPS bližšie k priemeru.
    - pri viacjadrových riešeniach sa nedá kalkulovať štýlom "mám celkový výkon 4000 mflops pretože mám 4 jadrá o výkone 1000 mflops" správne vyjadrenie je "1000 mflops pre jeden thread a môžem ich mať 4"
    - prechod na dvojjadro, alebo štvorjadro o rovnakej frekvencii a nominálnom i reálnom výkone nemusí znamenať zvýšenie výkonu - to je u každej aplikácie individuálne
    - prechod na jadro s vyšším nominálnym (frekvencia) i reálnym (merania v Mflopoch) výkonom znamená vyšší výkon vždy, v určitých prípadoch aj ked je to prechod z dualu na uniprocesor.


    Vedlajší produkt testovania:
    - grafické karty ATI používajú na Win98se VXD ovládače a na Win2k WDM ovládače. To mi v 3dmarku2003 pomohlo k vyššiemu výkonu, ničmenej k horšej kvalite (sekanie ktoré ale neznižovalo FPS, takže boli len umiestnené do obrazu v zlom časovom okamihu ale nebol to problém s Vsync)

    Pokiaľ teda niekto mal dojem že na WinXP alebo Win2k idú hry a grafické programy rýchlejšie než na starších tak toto s ťažkým srdcom (ako fanda Win98 a ATI) musím potvrdiť v prípade Ati kariet - ovládače sa používajú lepšie.

    Práve toto mi bohužial znova vložilo do hlavy chrobáka či neskúsim nejakú Nvidiu.

    - nový rekord v 3dmarku2003 - 11127 3dmarkov pre Pentium III
    - aplikácie s ktorými sa dodával Windows 2000 sú všetky jednothreadové .)

    test pravdepodobne bude ešte pokračovať dalej.
    Naposledy upravil Mir; 15.09.2008 v 10:51.
    Abit VH6-T mod "Immolator" * Intel Pentium III-S "Tualatin" 1.400@1,628Mhz * PQI SDR SDRAM PC133CL3 @ 155CL2 - 1,5 Gb * Asus Radeon x850XT 256mb * Pinnacle 300i * Creative SoundBlaster LIVE! * Adaptec 19160 * Intel PRO GT 10/1000 * Seagate Cheetah 15k 73GB * Windows 98SE

Informace o tématu

Users Browsing this Thread

Toto téma si právě prohlíží 1 uživatelů. (0 registrovaných a 1 anonymních)

Podobná témata

  1. Abit IP35Pro- informace, recenze, zkusenosti...
    Založil tx3rf v sekci fóra Intel čipové sady
    Odpovědí: 143
    Poslední příspěvek: 19.07.2012, 19:43
  2. Abit VP6 - dual
    Založil BRUCEF v sekci fóra Intel čipové sady
    Odpovědí: 3
    Poslední příspěvek: 25.02.2004, 15:47
  3. ABIT AN7 - nastupca NF7-S ....
    Založil Deviant v sekci fóra NVIDIA čipové sady
    Odpovědí: 37
    Poslední příspěvek: 12.01.2004, 15:52
  4. Dotaz ..Abit VP6 a P3 1.1
    Založil LISP v sekci fóra VIA čipové sady
    Odpovědí: 7
    Poslední příspěvek: 21.07.2003, 15:53
  5. Abit VP6
    Založil LISP v sekci fóra VIA čipové sady
    Odpovědí: 2
    Poslední příspěvek: 31.03.2003, 19:56

Pravidla přispívání

  • Nemůžete zakládat nová témata
  • Nemůžete zasílat odpovědi
  • Nemůžete přikládat přílohy
  • Nemůžete upravovat své příspěvky
  •