Itanium 2 - Heidelberg Universityra.ziti.uni-heidelberg.de/pages/student_work/seminar/ws... ·...

Itanium 2

Götz BeckerLehrstuhl für Rechnerarchitektur

Übersicht

● Einführung in die Itanium Architektur● Besonderheiten der Architektur

– Beispiele für deren Anwendung● Mikro-Architektur des Itanium 2● Compiler und Benchmarks● Ausblick

Itanium 2

● Nachfolger des Itanium,der ersten Implemantion von EPIC/IA-64

● Hersteller Intel● 1997 Itanium ● 2002 Itanium 2

EPIC, IA-64

● Explicit parallel instruction computing● ISA (instruction set architecture)

Gemeinschaftsentwicklung von Intel und Hewlett-Packard, angekünditg Juni 1994

● Ziel:Erweiterbare 64-bit ISA mithoher Ausdruckskraft für Parallelität

● Für „High Performance“ CPUs

EPIC - Ansatz

● Compiler kennt die Abhängigkeiten im Programmablauf– Kann mehr Arbeit in Optimierung stecken– Kann Informationen aus Profiling-Tests benutzen

● Vermeidung von aufwendigerOut-of-Order Logik im Prozessor– moderne Risc-CPUs z.b. Power5 von IBM

Wie erreicht man „High Perfomance“?

● mit vielen parallelen RechenwerkenFunctional Units (FU)

● mit Pipelining● mit einer Speicherhierarchie

● VLIW (very long instruction word)feste Anzahl Operationen in einem VLIWDiese werden parallel von mehreren FUs ausgeführt

● Alle Operationen in einem VLIW müssen unabhängig sein

● Statische Instruktions Scheduling vom Compiler● Problem:

– Kontrollflußfehler– Cache-Misses können nicht versteckt werden

IA-64 Bundle

● VLIW mit 5bit Zusatzinfos● 128bit Bundle:

– 3 x 41bit Instruktionen● 2 Quellregister, 1 Zielregister, 1 Predikat

– 1 x 5bit Template● Kodiert 6 Instruktionstypen (A, I, M, F, B, LX)● Template kodiert Instruktions-Abhängigkeiten

41bit 41bit 41bit 5bit

IA-64 Bundle Instruktions Typen

M M F MMF

M I B MIB

IA-64 Register

stacked/rotating

ALATadvanced-load address table

● Kernstück der Data Speculation● Tabelle mit 32 Einträge● Addressiert durch

– die physikalische Speicheradresse– einem „ALAT register tag“

besteht u.a. aus der Registeradresse

Beispiel folgtspäter

Instruction Level Parallism (ILP)

Ausdrucksmöglichkeiten für ILP in IA-64:● Predication● Control Speculation● Data Speculation● Loop Pipelining

Predication:

compare

branch

cmp pr1,pr2

If then else – Zerlegung durch Predication

Kein Branch mehr vorhanden!Kontrollfluß wird Datenfluß

Control Speculation

instr i

branch

ld r1 = mem

use r1

Problem:Compiler legt den load nicht vor den branchRiskiert Exception (Page Fault)

use eine Operation z.b. add, sub

Control Speculation

Compiler kann schon vor Branch laden:

ld.s speculative load

ld.c speculative check

checkt das NaT-Bit des Registers und lädt Wert falls noch nicht vorhanden

Fehlerbehandlung erst wenn Wert tatsächlich benötigt wird

ld.s r1 = mem

instr i

branch

ld.c r1

use r1

Control Speculation

ld.s r1 = mem

instr 1

use r1

instr 2

branch

chk.s use

Recovery code:ld r1 = memuse r1branch

Für komplexe Korrekturen:chk.s speculative check

Branch zu Recovery Funktion

Data Speculation

instr 1

instr 2

store mem?

ld r1 = mem!

use r1

Problem:

Compiler weiß nicht, ob ein Wert, der aus dem Speicher geladen wurde, noch gültig ist.?

Data Speculation

Compiler kann mit Hilfe der ALAT „spekulieren“

ld.a advanced loadlegt einen Eintrag im ALAT an

ld.c checked loadprüft ob Eintrag in ALAT vorhanden, neuladen wenn nicht

ld.a r1 = mem

instr 1

store mem?

ld.c r1

use r1

Data Speculation

ld.a r1 = mem

instr 1

use r1

instr 2

store mem?

chk.a r1

Recovery code:ld r1 = memuse r1branch

Für komplexe Korrekturen:chk.a speculative check

Branch zu Recovery Funktion

ALAT Semantik

● Eintrag anlegen– Ein ld.a legt einen Eintrag an

● Eintrag löschen– Falls ein store eine „überwachte“ Adresse (auch

Registeradressen) anspricht, wird dieser Eintrag gelöscht

Alle vorhandenen Einträge verweisen auf noch gültige Speicheroperationen

ALAT - Abfrage

● ld.c – checkt ob der Eintrag gültig ist und lädt bei einem

Miss den Wert erneut aus dem Speicher● chk.a

– checkt ob der Eintrag gültig ist und springt bei einem Miss zu einer Recovery Funktion

– Recovery Funktion wird vom Compiler erzeugt– Bietet mehr Flexibilität, vergrößert den Code– Mögliche Kontrollflußänderung

Loop Pipelining

● Bsp: 6 Interationen einer einfachenload > load > op > store > branch Schleife

Durch spezielleSchleifenzähler in Hardware effizient umsetzbar.Spezielle Schleifen-Branch Befehle steuern LC und EC

[3] 22

Kannlängersein

Cache Hierarchie

L1i16K1 cycle

L1d16K1 cycle

L2256K5/6 cycle

L31,5M-9M12/14 cycle

SystemBus

R 48GB/s

R/W 24GB/s

R/W 48GB/s R/W 6,4GB/s

Cacheline Sizes:L1 64BL2/L3 128B

IA-64 Speicherhiercharchie

● Explicit data cache line prefetching– L1/L2/L3 addressierbar– Je 2 Versionen, direct oder delayable

● Cache Hints (.nt1, .nt2 , .nta)– welche Hiercharchiestufe eine Speicheroperation

ansprechen soll – impliziert Nutzungsdauer– Hinweis für Ersetzungsstrategie

● Instruction Prefetching

Explicit control of Memory Access Order

● Memory Fence mf– Stellt sicher, daß alle früheren Speicheroperationen

architektonisch sichtbar waren, bevor weitere zur Ausführung kommen

● Acquire Load ld.acq – Sichtbar vor allen folgenden Speicheroperationen

● Release store st.rel – Alle vorherigen Speicheroperationen sind sichtbar

Itanium 2 (Madison 9M L3) – 592 Millionen Transistoren[4]

[1] 27

Pipeline

● 8 Stufen Tief● 6-wide (6 parallele FUs)● 6 Integer ALUs● 6 Multimedia ALUs● 2 ext. Floating Point Units● 2 load- , 2 store-Units ● 3 Branch Units

Pipeline

Instruction Issue

Pro Takt 2 Bundles = 6 Intructions in 11 FUsdynamische Verteilung auf freie FUsNicht alle Kombinationen sind möglich

Register Stack Engine

● Verwaltet Register File● Übernimmt Register Renaming● Kontrolliert Register Rotation● Bietet programmierbare Stackframes

– Inkl. Frame Overlaps und kompakten Frames● Simuliert ein unbegrenzt viele Register

– Lagert Register bei Bedarf automatisch ausund auch wieder ein

Register Stack Engine

Multi-way Branching

● Durch 2 abhängige Bundles– 6 in-order Instruktionen

● 3 Tests/Compares (z.b. MII) im Ersten● 3 predicated Branches (BBB) im Zweiten● Führt ein 3-fach Case in einem Takt aus

Multi-way Branching

Compiler

● Standard (kommerziell):– Intel – HP

● Open Source Projekte– Open Research Compiler (ORC)

● Unterstützt von Intel

– OpenIMPACT – Gelato● Unterstützt von HP

– gcc● Langsam

1-way SPEC results

int200_base fp2000_base0

Athlon64 FX 2.6 GHz

Pentium 4 3.5 GHz

Opteron 2.4 GHz

POWER5 1.9 GHz

Itanium 2 1.6 GHz

2-way SPEC results

int_rate200_base fp_rate2000_base0

POWER5 1.65 GHz

Opteron 2.4 GHz

PA-RISC 8800 1 GHz

Pentium 4 Xeon 3.2 GHz

Itanium 2 1.6 GHz

32-way SPEC results

int_rate200_base fp_rate2000_base0

POWER5 1.65 GHz

PA-RISC 8800 1 GHz

SPARC64 V 1.89 GHz

Alpha 21364

Itanium 2 1.6 GHz

Ausblick

● Patterson:„Surprising that an approach whose goal is to rely on compiler technology and simpler HW seems to be at least as complex as dynamically scheduled processors!“

● HP hat seine Itanium-Abteilung an Intel verkauft– Was macht nun Intel?– Inzw. Starke 64bit Konkurrenz im eigenen Haus

Itanium „Montecino“ 2005

● 1,72 Milliarden Transistoren![4]

Quellen

[1] Intel Itanium Archtecture Software Develper Manual Band 1-3http://www.intel.com/design/itanium/documentation.htm

[2] Vorlesungsfolien Prozessorarchitektur – Processor ArchitectureJoachim Gläß, Universität Mannheim, SS 2004

[3] Inside the Intel Itanium 2 Processor, HP Technical White Paper July 2002 http://www.dig64.org/More_on_DIG64/Itanium2_white_paper_public.pdf

[4] Microprocessor Report „ Best Servers of 2004“http://www.mpronline.com

[5] Ace´s Hardware SPEC CPU Dataminerhttp://www.aceshardware.com/SPECmine/Stand Dezember 2004

[6] Computer Science 252, Prof. Patterson Spring 2001http://www.cs.berkeley.edu/pattrsn/252501/Lec19-static.pdf

Vielen Dankfür Ihre Aufmerksamkeit

Itanium 2 - Heidelberg Universityra.ziti.uni-heidelberg.de/pages/student_work/seminar/ws... ·...

Documents

Transcript of Itanium 2 - Heidelberg Universityra.ziti.uni-heidelberg.de/pages/student_work/seminar/ws... ·...

Seminar - ra.ziti.uni-heidelberg.dera.ziti.uni-heidelberg.de/pages/student_work/seminar/ws0405/... · Geschichte des FPGAs Geschichte: - 1960 Estrin´s „fixed plus variable structure

110111 Laborbericht 10-01159-CX-GMB-00 Nachfolger 266-0690-98-MURD-N1(1)

Analyse und Entwicklung der webbasierten Konfiguration ...streitdf/DVP/student_work/... · AFROS Atari FRee Operating System AOP Aspektorientierte Programmierung API Application Programming

Trabajo itanium(2)

TABLET ODER NOTEBOOK? BEIDES! - static.lenovo.com · Inside, Intel Core, Intel Inside, Intel Inside Logo, Intel vPro, Itanium, Itanium Inside, Pentium, Pentium Inside, vPro Inside,

Cluster Operating Systems - Heidelberg Universityra.ziti.uni-heidelberg.de/pages/student_work/seminar/ws0304/frank... · Cluster Operating Systems 11.11.2003 2.1 Zentrales Merkmal

· Logo, Intel vPro, Itanium, Itanium Inside, Pentium, Pentium Inside, vPro Inside, Xeon. Xeon Phi und Xeon Inside Sind Marken der Intel Corporation in den USA und anderen Låndern,

NetCOBOL V10.5 FUJITSU Software€¦ · Red Hat(R) Enterprise Linux(R) 5 (for Intel64) (32ビット互換モード) Linux Red Hat(R) Enterprise Linux(R) 5 (for Intel Itanium) Linux(Itanium)

Sport Racing 10 LEVEL ITANIUM pentium 4 pentium. 4 …download.intel.com/pressroom/kits/events/moores_law_40th/ML... · Sport Racing 10 LEVEL ITANIUM pentium 4 pentium. 4 I Reco*ding

EISKALT GESPART!Inside, das „Intel Inside“-Logo, Intel vPro, Itanium, Itanium Inside, Pentium, Pentium Inside, vPro Inside, Xeon, Xeon Phi, Xeon Inside und Intel Optane sind Marken

Webinar SAP NetWeaver Identity Management – Nachfolger der ZBV

ΚΕΙΜΕΝΑ ΝΕΟΕΛΛ HΝΙΚΗΣ ΛΟΓΟΤΕΧΝΙΑΣ Α΄ ΛΥΚΕΙΟΥ3lyk-ag-parask.att.sch.gr/autosch/joomla15/images/Student_work... · ΝΕΟΕΛΛΗΝΙΚΗ ΠΟΙΗΣΗ

20 JAHRE PLANUNGSGRUPPE POTSDAM ARBEITSERGEBNISSE, UMSETZUNG, VORLÄUFER,NACHFOLGER DIETRICH FLICKE 4.OKTOBER 2010.

HighEnd a Mainframe procesory Itanium, SPARC, POWER

EPIC, IA-64 und Itanium

JasperReports als Nachfolger für Oracle Reports · 1 Ihr Partner für IT JasperReports als Nachfolger für Oracle Reports Bremen, 07.11.2017

V05L14R1 Release News Letter（第3版） · Red Hat Enterprise Linux 4 (x86,x64、Itanium、Power Systems、System z) Red Hat Enterprise Linux 5 (Itanium、Power Systems、System

DER ZUPFGEIGENHANSL UND SEINE NACHFOLGER

ΠΕΡΙΕΧΟΜΕΝΑ - 3lyk-ag-parask.att.sch.gr3lyk-ag-parask.att.sch.gr/autosch/joomla15/images/Student_work/2012... · γενετικό υλικό οι οποίες ενδέχεται

HP Integrity サーバー...インテル ®Itanium プロセッサー9310 1.6GHz/10MB Level 3キャッシュ インテル® Itanium プロセッサー9320 1.33GHz/16MB Level 3キャッシュ

HP Integrity サーバー...インテル ®Itanium プロセッサー9310 1.6GHz/10MB Level 3キャッシュインテル® Itanium プロセッサー9320 1.33GHz/16MB Level 3キャッシュ