Abit VP6 a experiment s tualatinmi
Doska Abit VP6 je jedna z velmi mála dosiek ktorá ma na sebe namontovaný AGP slot a dva nezávislé sockety 370. Doska samotná podporuje procesory Via a tiež Intel Pentium III do generácie Coppermine.
Bolo pár pokusov ako sfunkčniť dva procesory tualatin avšak všetky mne známe pokusy zlyhali - vždy sa ohlásil iba jeden procesor.
Pri mojich prvých skúškach s touto doskou a párom 1ghz coppermine som prišiel na nasledujúce veci:
1. Naozaj len málo programov ktoré mám k dispozícii podporuje multiprocessing.
2. Pri použití programu TestCPU 0.96 naozaj dôjde k testovaniu len jedného jadra.
3. TestCPU okrem iného zistí že "Čip obsahuje APIC (podpora více procesoru). Ako podla očakávania COppermine procesory v doske VP6 túto funkciu majú.
4. Podla očakávania procesor Intel Pentium III-S "Tualatin" 1400 steppingu TA1 túto funkciu neobsahuje.
Otázky:
A) Podporujú funkciu APIC tualatiny steppingu TB1? treba overiť. máte niekto možnosť?
B) Treba update mikrokodov v biose dosky VP6? možno áno, možno nie. každopádne bios tieto cpu nerozozná a bude ich treba nastavovať manuálne. (mám prax ked som nahodil na Tualatin board non tualatin bios)
V prvom rade by ma zaujímalo či niekto máte možnosť overiť či tualatiny steppingu TB1 majú funkciu apic...
Re: Abit VP6 a experiment s tualatinmi
APIC ma tusim vsetko od Pentia vyssie. Akurat moze byt disablovany, co vacsinou byva v single-CPU mode (s vypnutym IO-APIC). Ked das ten CPU do nejakej novsej dosky s i815 chipsetom, ktora ma povoleny IO-APIC, tak uvidis, ze tam zrazu ten APIC je.
Re: Abit VP6 a experiment s tualatinmi
skúsim sa na to pozrieť, každopádne informácia u tualatinov steppingu TA1 o tom že niesú určené na multiprocesing môže naznačovať že proste tieto jadrá neobsahujú apic alebo je odstavený podobne ako modifikovanie multiplikátora... aneb velmi šikovný spôsob ako zabrániť via čipsetom pracovať na multiprocessingu s AGPčkom...
intel totiž v tej dobe mal masívne zisky z malých a drahých blade servrov s 2x Tualatin a lacnejší via čipset by bol vážnou konkurenciou ak by podporoval tualatin. Coppermine sú totiž takmer polovične výkonné v porovnaní s tualatinom.
to ako málo aplikácií u mňa podporovalo viac threadov je ale strašné. v podstate všetko okrem os
Re: Abit VP6 a experiment s tualatinmi
hmm. ak porovnávam Abit VH6-T akožto najlepšiu jednojadrovú dosku pre tualatiny (s via chipsetom) s VP6 ako jednu jedinú dosku ktorá využíva možnosti čipsetu Apollo Pro 133 na maximum tak viem potvrdiť nasledovné veci:
1. VP6 umožňuje aj úpravu voltáží na 3.3 vetve, čím je vhodným kandidátom na omnoho vyššie FSB než som dosahoval u VH6T. Teoreticky s procesorom P3-S 1266 by som sa tam dostal na cca 162mhz bey vážnejších problémov s tým že ram by boli 2gb a ramke by som trochu "prikúril" viac voltov...
2. na VP6 treba bohužial modnúť/nadrátovať procesor alebo redukciu od powerleapu a bios si nebude istý či má u seba ten správny procesor, ale fungovať to bude.
3. je otázka či 1266 bude na fsb 162-164 silnejší než 1400 na 155mhz FSB. Skôr nie...
4. čo by asi tak so systémom spravilo 512mega ram navyše...
5. jeden človek sa ma snaží nahovoril skúsiť v jednej z týchto dosiek grafiku ako sú nvidia 9800 alebo ati 3870... mno mohlo by to byť zaujímavé natlačiť mimo ram do grafiky 512-1gb textúr a meshov a ramku úplne vynechávať z takýchto procesov :D že by som predsalen skúsil XPčka len kvôli tomu?
Re: Abit VP6 a experiment s tualatinmi
pri testoch s 2x CU mine som zistil velmi zaujímavé veci o chovaní multithreadových aplikácií.
Ak by sme na takejto zostave s dvoma starými a slabučkými procesormi spustili hru alebo program s jedným threadom tak by sme k behu programu využili jeden z týchto procesorov a výkon aplikácie by tomu zodpovedal.
príklad zostavy:
2x CU-Mine 1Ghz. (jedno jadro má výkon 230mflops)
grafika X850xt (s fillrate 8000 megatexelov)
1,5 gb SDRam 133Mhz CL2
versus
1x Tualatin 1,4 Ghz (jedno jadro má výkon 420 mflops)
ostatné komponenty vrátane čipsetov ostávajú rovnaké
ako testovaciu aplikáciu som použil 3dMark2001.
Pri týchto kombináciách procesorov a grafickej karty a testovacieho SW je jasné že sa využijú maximálne schopnosti z éry DX 8.1 takže shader engine sa velmi nevyužije a to čo dostaneme vypovedá skôr o výkone procesoru než o výkone grafickej karty (ktorá je totálne predimenzovaná a umožňuje teda procesoru ukázať naozaj všetko, ničmenej sa ukáže sila len jedného procesoru)
2x CUmine - 7000 bodov (jeden thread)
1xTualatin - 12000 bodov (tiež jeden thread)
Ako druhú testovaciu aplikáciu som zvolil Oblivion ktorá je viacthreadová ale zároveň je slávna tým ako je bugová a neoptimalizovaná. To čo som potreboval a chcel vidieť je ako dokáže aplikácia distribuovať výkon na dve jadrá ktoré sú spolu rovnako výkonné ako jedno iné samostatné jadro, pričom ostatné podmienky (ramka, čipset, harddisk, zvukovka, OS) som zachoval identické.
2x CU Mine
Velmi výrazne lepšie sa chovalo "loading level" ktoré prakticky skoro nijak nenarušovalo chod hry. Rovnako fyzika (pri padaní vecí a kreatúr) nenarušovalo chod hry viac než bolo treba. Tiež AI niesla znaky toho že sa výkon distribuuje.
Pokial vyjdete z "Prison Sewers" a kúsok sa prejdete po ostrove tak aby ste mali výhľad na "Waterfront" tak pri CUminoch zistíte že počítaču dochádza dych. Waterfront je LOD (to jest vzdialená zjednodušená lokácia). NIesú tam nijaké NPC, nieje tam aktívna fyzika sú tam len trojuholníky. Je to jedna z najzložitejších LOD štruktúr aké v hre môžete vidieť.
Tento test teda ukázal že v Oblivione máme nasledovné separátne thready:
- 3d rendering (meshe a práca s nimi)
- výpočet fyziky
- práca s AI
Thready sú v rámci procesu generovania 3d obrazu prepojené a práca jedného je závislá na výsledkoch ostatných. Pokial ktorýkolvek thread začne so svojou prácou meškať (lebo zahlcuje procesor) tak ostatné thready musia čakať na to kým pomalší thread dokončí svoju prácu a až potom môžu pracovať dalej alebo použiť dalšíe výsledky.
Najnáročnejším threadom sa ukázal byť thread 3dRenderingu (je kompletne založený na DirectX a vôbec si nezľahčuje prácu tým že by využíval menej náročný openglide).
V globále teda multithreading bol použitý čo sa ukázalo v celkovo svižnom chode hry, ale zároveň sa ukázalo že celkový výkon je limitovaný jedným z programových threadov. Úplne rovnakého efektu by sme dosiahli inštalovaním slabej grafickej karty (povedzme NV6200)
Potom som spustil Oblivion na Tualatine. Celkové priemerné FPS bolo o cca 10 vyššie. Avšak nahrávanie terénu, AI alebo fyzika viditelne spôsobovali zásadnejšie framedropy. Dôvodom je to že zdielanie jedného CPU pri multitaskingu spôsobovalo dočasné potlačenie niektorých taskov a tým pokles výkonu. Prejavilo sa však to že u tualatinu mohol rendering thread prekročiť hranicu 230mflops ktorou ho limitovali CU Mine.
Zistenia:
- jeden thread v multithread aplikácii sa chová rovnako ako jednothreadová aplikácia - to jest jeden thread sa zavesí len na jeden procesor. na CUmine sa prejavilo že jeden thread zahltil jeden z procesorov a tým pádom aplikácia mohla pracovať len tak rýchlo ako ten najpomalší thread.
- viac threadov pomáha distribuovať výkon rovnako ako keď spustíte viac nezávislých jednothreadových aplikácií. Inými slovami viacthreadová aplikácia sa chová ako "dva a viac" v jednom.
- jedno výkonnejšie jadro môže byť efektívnejšie než viac málo výkonných. Ak napríklad má aplikácia dva thready pričom jeden potrebuje 800 Mflops a druhý potrebuje 400 Mflops tak vám postačí uniprocesor s výkonom 1200 mflops. Ak by ste skúsili túto aplikáciu spustiť na procesore Core2 Duo kde jedno jadro by malo výkon 600 mflops x2 aplikácia by nebežala tak efektívne pretože thread 1 by svoje jadro zahlcoval a bežal by teda pomalšie.
toto je však otázka ako dobre dokáže byť náročnosť distribuovaná v rámci aplikácie.
- viacthreadová aplikácia síce pracuje na relatívne nevýkonnej konfigurácii 2x CUmine pomalšie, ale zato plynulejšie bez väčších výkyvov ktoré by spôsobovali prehnané nároky na jediný procesor v dôsledku absencií optimalizácií - menšie framedropy, minimálne FPS bližšie k priemeru.
- pri viacjadrových riešeniach sa nedá kalkulovať štýlom "mám celkový výkon 4000 mflops pretože mám 4 jadrá o výkone 1000 mflops" správne vyjadrenie je "1000 mflops pre jeden thread a môžem ich mať 4"
- prechod na dvojjadro, alebo štvorjadro o rovnakej frekvencii a nominálnom i reálnom výkone nemusí znamenať zvýšenie výkonu - to je u každej aplikácie individuálne
- prechod na jadro s vyšším nominálnym (frekvencia) i reálnym (merania v Mflopoch) výkonom znamená vyšší výkon vždy, v určitých prípadoch aj ked je to prechod z dualu na uniprocesor.
Vedlajší produkt testovania:
- grafické karty ATI používajú na Win98se VXD ovládače a na Win2k WDM ovládače. To mi v 3dmarku2003 pomohlo k vyššiemu výkonu, ničmenej k horšej kvalite (sekanie ktoré ale neznižovalo FPS, takže boli len umiestnené do obrazu v zlom časovom okamihu ale nebol to problém s Vsync)
Pokiaľ teda niekto mal dojem že na WinXP alebo Win2k idú hry a grafické programy rýchlejšie než na starších tak toto s ťažkým srdcom (ako fanda Win98 a ATI) musím potvrdiť v prípade Ati kariet - ovládače sa používajú lepšie.
Práve toto mi bohužial znova vložilo do hlavy chrobáka či neskúsim nejakú Nvidiu.
- nový rekord v 3dmarku2003 - 11127 3dmarkov pre Pentium III :D
- aplikácie s ktorými sa dodával Windows 2000 sú všetky jednothreadové .)
test pravdepodobne bude ešte pokračovať dalej.
Re: Abit VP6 a experiment s tualatinmi
openglide? wtf?
skor si myslim ze mas na mysli OpenGL co je nieco uplne ine ako openglide...
Open Graphics Library
Re: Abit VP6 a experiment s tualatinmi
Re: Abit VP6 a experiment s tualatinmi
Trocha mimo misu ale zaujima ma či tato doska dokaže botovať z USB?
Zohnal som bios z 2001 a tam to tiež neni.
Re: Abit VP6 a experiment s tualatinmi
nie. tieto dosky z USB bootovať nevedia. Nabootujú z IDE, SCSI/SATA, alebo rozhrania ktoré sa dokáže chovať ako bootovateľné SCSI/SATA rozhranie.
mám SCSI radič z ktorého sa bootovať dá, mám tiež SATA radič z ktorého sa dá bootovať, ale mám aj SATA radič ktorý bootovať nevie... ak by to USB rozhranie teoreticky podporovalo tak by sa cez voľbu "SCSI" dalo zariadiť aj bootovanie cez prídavnú USB PCI kartu. ale len čiste teoreticky, ešte som také USB rozhranie nevidel.