kategória | ||||||||||
| ||||||||||
| ||
|
||||||||||
Harmadik generációs szuperskalár processzorok: az utasításon belüli párhuzamos végrehajtás áttekintése (három-operandusú utasítások, SIMD-utasítások, VLIW-architektúrák)
Utasításon belüli párhuzamosság
Duál-müveletes utasítások SIMD VLIW
Multimédia (fixpontos) 3D (lebegöpontos)
A logikai architektúra kiterjesztése Teljesen új
logikai architektúra
Duál müveletes utasítások:
Fogalma: egyetlen utasításban kettö darab müvelet
Pl.: X=a*b+c (A szorzatok eredményét c-ben felgyüjtjük)
LOAD/OP (Betöltés után azonnal elvégzi a müveletet is)
A 70-es években jelentek meg
Numerikus feldolgozásoknál használják, de az általános célúaknál nem jellemzö
SIMD:
Fogalma: egyetlen utasításban ugyanazon müvelet több operanduson van értelmezve
Fajtái: Fixpontos: ~ 2-8-szoros gyorsítás
Lebegöpontos: 2-4-szeres gyorsítás
Ez képezi a processzorok fejlödésének fö irányvonalát: ~ 1994-töl
Sajátosságai:
o A logikai architektúra módosítást igényel
o Az L2 gyorsítótár felkerül a processzor lapkájára
o A rendszer-architektúra is módosul: megjelenik az AGP (Accelerated Graphics Port)
VLIW:
Fogalma: egyetlen utasításokban sok müveletet írunk elö
Korai VLIW-ek:
o Igen hosszú utasítások, pl.: a TRACE VLIW processzor esetén:
256-1024 bites utasítások
7-28 müveletet tartalmaz
o A statikus ütemezés során a compiler gondoskodik a függöségek feloldásáról
o A compiler szoros kapcsolatban áll a fizikai architektúrával, pl.: ismernie kell a végrehajtó egységek számát, azok késleltetését, a behívási késleltetést, stb.
o A 80-as évek elsö felében papíron, második felében a piacon is megjelentek (pl.: TRACE)
o Gyorsan leállt a forgalmazásuk, mivel a compiler túlságosan kötödött a fizikai architektúrához
Mai VLIW-ek:
o A compilerek fejlödtek, ezért a 90-es évek végén újra megjelentek
o Szerverek piaca:
INTEL Itanium: 6 db végrehajtó egységgel rendelkezik
A szuperskalárok 4 db / ciklus feldolgozási rátáját kívánják a 6 db végrehajtó egységgel túlszárnyalni
o Hordozható gépek piaca: a Transmeta cég processzorai:
A statikus ütemezés egyszerübb processzort eredményez → kisebb áramfogyasztás (2W DVD-lejátszás közben!)
Fajtái:
4 db végrehajtó egységgel
8 db végrehajtó egységgel
Találat: 2416