Pokročilé architektury počítačů - OI-Wiki

Transkript

Pokročilé architektury počítačů - OI-Wiki
Pokročilé architektury počítačů
Architektura paměťového a periferního podsystému
České vysoké učení technické, Fakulta elektrotechnická
A4M36PAP Pokročílé architektury počítačů
Ver.1.00
2010
1
Motivace
• Architektura
• Paměťový
podsystém
• I/O podsystém
A4M36PAP Pokročílé architektury počítačů
2
Disproporce ve výkonu proc-pam, Moorův zákon
A4M36PAP Pokročílé architektury počítačů
3
Srovnání paměťových technologií
Převzato z:
A4M36PAP Pokročílé architektury počítačů
4
Paměťová hierarchie – základní principy
• Programy/procesy přistupují v daném okamžiku
jen k malé části svého adresového prostoru
• Časová lokalita
• Položky, ke kterým se přistupovalo nedávno, budou
zapotřebí brzy znovu.
• Příklad: programová smyčka,proměnné instrukcí.
• Prostorová lokalita
• Položky poblíž nedávno používaným budou brzy
zapotřebí také.
• Příklad: sekvenční přístup ike kódu, datová pole.
A4M36PAP Pokročílé architektury počítačů
5
Co z uvedeného plyne?
• Je výhodné uspořádat paměťový prostor
hierarchicky – paměťová hierarchie.
• Všechny potřebné informace uchovávejte v
sekundární paměti.
• Položky nedávno používané a blízké zkopírujte
do (menší) paměti implementované DRAM.
• Operační paměť.
• Položky ještě častěji používané (i ty jim blízké)
zkopírujte do menší a rychlejší SRAM.
• Skrytá paměť.
A4M36PAP Pokročílé architektury počítačů
6
Jak a kde pak ale hledanou informaci najdeme?
• Podle adresy a informace o platnosti.
• Hledat začneme v paměti nejvyšší
hierarchické úrovně (nejblíže procesoru).
• Požadavky:
• Paměťová konzistence.
• Prostředky:
• Virtualizace adresy,
• Mechanizmy uvolňování místa a migrace informace
mezi paměťovými úrovněmi.
• Hit, miss.
A4M36PAP Pokročílé architektury počítačů
7
Poznámka
• Každou paměť v hierarchii výše můžeme
považovat za skrytou paměť nižší
hierarchické úrovně.
• Přímo mapovaná skrytá paměť
A4M36PAP Pokročílé architektury počítačů
8
Jen připomenutí: např. podle R.Lórenc, X36APS
• Mějme 8-mi blokovou skrytou paměť. Kam se do ní umístí
blok 12 v případě
• Plně asociativní.
• Přímo mapované, nebo
• S omezeným stupněm asociativity N=2 (2-cestná, 2-way cache)?
A4M36PAP Pokročílé architektury počítačů
9
Přímo mapovaná skrytá paměť podrobněji
A4M36PAP Pokročílé architektury počítačů
10
SP s omezeným stupněm asociativity N=4 podrobněji
A4M36PAP Pokročílé architektury počítačů
11
Paměťová hierarchie
• Různá hlediska
posuzování:
• Rychlost,
• Velikost,
A4M36PAP Pokročílé architektury počítačů
• Cena/kapacita,
• Úroveň.
12
Paměťová hierarchie konkrétně
• 256 B – 1KB typická
kapacita
• 8K-128KB kapacita,
latence < 1ns
• 128 KB - 16 MB, ~10 ns
latence (typicky)
• 128 MB – 100+ GB,
~100 ns latence (typicky)
A4M36PAP Pokročílé architektury počítačů
13
Virtualizace paměti
• VP je způsob správy operační paměti umožňující
běžícímu procesu zpřístupnění paměťového prostoru,
který je uspořádán jinak, nebo je dokonce větší, než je
fyzicky připojená operační paměť.
• Převod mezi virtuální VA a fyzickou PA adresou může
podporovat procesor (HW mapováním TLB, viz dále).
• V současně běžných operačních systémech je virtuální
paměť implementována pomocí stránkování paměti spolu
se stránkováním na disk, které rozšiřuje operační paměť
o prostor na disku.
* R. Lórenc, X36APS, 2005
A4M36PAP Pokročílé architektury počítačů
14
Virtuální paměť: spolupráce HW a SW
A4M36PAP Pokročílé architektury počítačů
15
Virtuální paměť - stránkování
• Virtuální prostor tvoří stejně velké stránky (pages), které se
přiřazují jednotlivým běžícím procesům.
• Fyzickou paměť tvoří stejně velké rámce (frames).
A4M36PAP Pokročílé architektury počítačů
16
Realizace převodu adres?
• Tabulka stránek, Page Table.
• Jednotkou mapování jsou stránky,
• Stránka je také jednotkou přenosu mezi
vedlejší a hlavní paměti.
• Mapovací funkce se nejčastěji implementuje
Look-up Table (vyhledávací tabulkou).
• Příklad:
A4M36PAP Pokročílé architektury počítačů
17
Tabulka stránek – význam položek
Look-up Table
A4M36PAP Pokročílé architektury počítačů
18
Poznámky
• Každý proces má svou Tabulku stránek,
• Tedy i svou hodnotu PTBR (bázového registru).
• To, mimochodem, zajišťuje paměťovou
bezpečnost procesů.
• Formát položky Tabulky stránek
• V – Validity Bit. V=0 Stránka není platná.
• AR – Access Rights. Přístupová práva (Read Only,
Read/Write, Executable, apod.),
• Frame# - číslo rámce.
V
AR
A4M36PAP Pokročílé architektury počítačů
Frame#
19
Co dělat, když je výpadek stránky – Page Fault?
• Fyzická paměť je volná, ale
• Rámec je prázdný, data jsou na disku.
• Požadovaná stránka se DMA načítá do prázdného rámce. Přepne
se na případně čekající proces, který může probíhat.
• Po dokončení DMA přenosu přerušení, aktualizuje se Tabulka
stránek procesu.
• Přepne se zpět na původní proces.
• Paměti je nedostatek
• Pomocí LRU najdeme rámec, který můžeme uvolnit.
• Má-li nastaven Dirty Bit, zapíšeme stránku do vedlejší paměti.
• Aktualizuje se Tabulka stránek procesu.
A4M36PAP Pokročílé architektury počítačů
20
TLB – Translation Lookaside Buffer
• Jde Paměť stránek udělat i jinak?
• Ano, skrytou pamětí.
• Plně asociativní TLB, reálné pro 256-512
položek).
A4M36PAP Pokročílé architektury počítačů
21
Jak to potom vypadá?
• Běžná a bezpečná
organizace hierarchie
pamětí.
• Pozor: Namísto PA teď
píšeme FA.
• Nevýhoda sekvenčního
překladu pomocí TLB a
následného čtení – dlouhý
Hit Time.
• Jsou možná i jiná
uspořádání…
A4M36PAP Pokročílé architektury počítačů
22
Jiná uspořádání hierarchie s TLB
nebo
Pozor! Tady může dojít k
přístupu jiných procesů do
jiných bloků fyzické
paměti. I tady se tomu říká
Aliasing.
A4M36PAP Pokročílé architektury počítačů
23
Srovnání, nenechte se zmást
Virtuální paměť
Skrytá paměť
Stránka
Blok/řádek
Page Fault
Read/Write Miss
Velikost stránky: 512 B – 8 KB
Velikost bloku: 8 – 128 B
Asociativní
DM, N-cestná, asociativní
Výběr oběti: LRU
LRU/Náhodný
Write Back
Write Thru/Write Back
• Rozumíte pojmům?
• Co je oběť
• Závěr: každé adjektivum popisuje o něco jiného…
A4M36PAP Pokročílé architektury počítačů
24
Výkon paměťového podsystému
A4M36PAP Pokročílé architektury počítačů
25
Opakování terminologie
•
•
•
•
Vybavovací doba paměti
Doba přístupu
Propustnost
Latence
A4M36PAP Pokročílé architektury počítačů
26
Výpočet výkonnosti paměťového podsystému
• Hit: zásah. Data jsme nalezli v příslušném bloku paměti (tady blok X).
• Hit Time (HT) = vybavovací doba paměti příslušné úrovně. Zahrnuje samotný
vybavovací čas pamětí vyšší úrovně + čas na určení Hit/Miss.
• Hit Rate (HR) = četnost zásahuP podíl úspěšných k celkovému počtu přístupů.
• Miss: výpadek. Požadovaná data nebyla nalezena v dané úrovni paměti
(blok X), ale až v nižší úrovni (blok Y), X € Y.Procesor čekal.
• Miss Rate (MR) = 1 – HR. Jinak též koeficient výpadku.
• Miss Penalty (MP) = čas na získaní dat z nižší úrovně paměti (blok Y) + čas na
přenos dat do vyšší úrovně (blok X) + čas na doručení dat do procesoru.
• AMAT = HT + MR * MP
• AMAT (Memory Access Time). Střední přístupová doba do paměti.
• HT << MP.
A4M36PAP Pokročílé architektury počítačů
27
Vliv paměťového podsystému na dobu výpočtu
Tcpu = IC * (CPIint + CPImem) * Tclk = IC * (CPIint + MAPI * MR * MP) * Tclk
MAPI … Memory Access Per Instruction
C … Miss Per Instruction MPI = MAPI*MR = Memory Accesses * MR/IC
Tcpu = IC * (CPIint + MPI * MP) * Tclk
A4M36PAP Pokročílé architektury počítačů
28
Konkrétní příklad: Celeron
Čtení/zápis z/do
Počet taktů procesoru, které
jsou zapotřebí
Registr procesoru
1 či méně. To v případě
úspěšného zřetězení instrukcí
Skrytá paměť L1
cca 3
Skrytá paměť L2
cca 14
Operační paměť
cca 240
Zdroj: http://www.root.cz/clanky/architektury-vyrovnavacich-pameti/
A4M36PAP Pokročílé architektury počítačů
29
Paměťové čipy
A4M36PAP Pokročílé architektury počítačů
30
Fáze přístupu k datům v DRAM čipu
A4M36PAP Pokročílé architektury počítačů
31
Klasická DRAM – asynchronní rozhraní
• Důvod rozdělení adresy na 2 části byl dán malým počtem
pinů původních DRAM pouzder.
• Toto rozdělení se dodnes zachovává, ačkoli pouzdro už
není problém.
RAS – Row Address Strobe,
CAS – Column Address Strobe
A4M36PAP Pokročílé architektury počítačů
32
EDO DRAM – cca 1995
• EDO DRAM má registr na výstupu, což umožní překrýt
následující CAS s čtením předchozích dat.
A4M36PAP Pokročílé architektury počítačů
33
SDRAM – konec 90.let – časování čtení synchronních DRAM
• SDRAM čip obsahuje čítač, který umožňuje nastavit délku
souvislého (burst) čtení dat.
A4M36PAP Pokročílé architektury počítačů
34
SDRAM – paměť současnosti
• SDRAM – frekvence až 100 MHz, 2.5V.
• DDR SDRAM – použití obou hran CLK při přenosu dat,
2.5V.
• DDR2 SDRAM – snížení spotřeby použitím napětí 1.8V,
frekvence až 400 MHz.
• DDR3 SDRAM – snížení spotřeby použitím napětí 1.5V,
frekvence až 800 MHz.
• DDR4 SDRAM …
• Dále ještě existují paměti a moduly RAMBUS, které
ovšem mají zcela odlišné rozhraní i způsob použití.
• Všechny tyto inovace vylepšují propustnost čtení dat,
nikoli latenci čtení první položky.
A4M36PAP Pokročílé architektury počítačů
35
Architektura
A4M36PAP Pokročílé architektury počítačů
36
Co je úkolem?
• Propojit jednotlivé části výpočetního
systému
• Možnosti?
• Optimální datové cesty
• S ohledem na závislost cena/výkon
existuje hranice výkonnosti
• datové cesty je možné sdílet
• Datové cesty je výhodné sdílet
A4M36PAP Pokročílé architektury počítačů
37
Obecně architektura počítače
A4M36PAP Pokročílé architektury počítačů
38
A4M36PAP Pokročílé architektury počítačů
39
Příklad I.
A4M36PAP Pokročílé architektury počítačů
40

Podobné dokumenty

hw-sw okruhy

hw-sw okruhy funkce pro proměnné  x0 x1 x2 x3  nebo např. řádek 1 je  x0 x1 x2 x3 ). Takže akorát do  jednotlivých políček tabulky napíšeme, jakou hodnotu má pro daný řádek  (vstupní písmeno)  výstupní funkce. ...

Více

Detailní propozice: Hodnocení turnaje: Secret Agenda Mission:

Detailní propozice: Hodnocení turnaje: Secret Agenda Mission: token=AWxO7NWugscHZpaB3odzwqyTagtsFrhrL1zEkJPWFlYe930gophWgpN1fgUzis4VH44gc 1sVLwvW86iSGZELl1UEKaepk_9xt3yMdCdiS3ygi1y8C1N8KvzbHI3_LZnbdPAyxb_kDEHVP6_XcpCeHPil75Z8eeEooVMjQFcppwDw

Více

zde - Fosfor.cz

zde - Fosfor.cz • Vlákna jsou jednotky plánované pro spuštění na CPU. • Vlákno má svůj vlastní program counter (pro uchování informace o výpočtu), registry (pro uchování aktuálních hodnot), zásobník (který obsahuj...

Více

Typy pamětí. Hierarchické uspořádání paměťového

Typy pamětí. Hierarchické uspořádání paměťového Vnitřní paměti procesoru – registry, jednotky bytů, velmi rychlé – čtení v průběhu 1 cyklu procesoru. Tyto paměti slouží pří výpočtech v procesoru k ukládání mezivýsledků a podobně. L1 Cache – velm...

Více

leták k Mechanical Desktopu 6

leták k Mechanical Desktopu 6 projektu další specialisty, a během minuty jim zpřístupnit své návrhy a sdílet s nimi další informace. Mechanical Desktop podporuje vzájemnou komunikaci mezi konstruktéry pomocí funkcí Meet Now (Ko...

Více

Poznámky k vydání

Poznámky k vydání Mnoho našich zákazníků a partnerů požadovalo 64-bitovou verzi doplňku Kerio Outlook Connector (Offline Edition). My jsme je vyslyšeli. Od verze Kerio Connect 7.3 mohou uživatelé bez obav používa...

Více

Poznámky k vydání

Poznámky k vydání Connector (Offline Edition). My jsme je vyslyšeli. Od verze Kerio Connect 7.3 mohou uživatelé bez obav používat 64-bitové verze aplikace Microsoft Outlook, resp. balíku Microsoft Office. V 32-bitov...

Více

Základní deska (anglicky motherboard)

Základní deska (anglicky motherboard) ještě nejsou na trhu, prodej možná rok 2013 maximální takt je 4266MHz při 1,05V

Více