CEFET-PE Arquitetura e redes de Computadores
Processadores Intel e AMD
Prof. Remy Eskinazi
CEFET-PE Arquitetura e redes de Computadores
Agenda
• Introdução• Conceitos básicos Microprocessadores• Histórico dos processadores X86 (Intel e AMD)• Linha evolutiva dos processadores• Mercado de processadores• Breve Comparativo Intel x AMD• Resumo Processador Celeron• Processadores 64 bits• Conclusões• Bibliografia e sites relacionados
CEFET-PE Arquitetura e redes de Computadores
Resumo Evolução Intel X AMD8088 / 8086
80286
80386
80486
Pentium
Pentium Pro
Pentium II
Pentium III
AMD 386
AMD 486
AMD K5
AMD K6
AMD K6-II
AMD K6-III
Celeron(Pentiums limitados) AthlonPentium IV Duron
Semprom
CEFET-PE Arquitetura e redes de Computadores
Evolução X86
Nome Data Transistores
• 8086 1978 29K– Processador de 16-bit. Base para o IBM PC & DOS– Limitado a 1MB de espaço de endereçamento. DOS disponibiliza ao usuário
apenas 640K
• 80286 1982 134K– Modo de endereçamento mais complexo, mas não muito útil– Base para IBM PC-AT e Windows
• 386 1985 275K– Extensão para 32 bits. Adicionado um novo tipo de endereçamento – Capaz de rodar Unix (modos Real, Protegido)
CEFET-PE Arquitetura e redes de Computadores
Evolução X86
• Nome Data Transistores
• 486 1989 1.9M• Pentium 1993 3.1M• Pentium II/MMX 1997 4.5M
– Adicionada uma coleção especial de instruções para operar em vetores de 64-bit de dados inteiros de 1, 2, ou 4 bytes
• PentiumPro 1995 6.5M– Adionadas as instruções de mov condicional
– Grande mudança na microarquitetura
• Preempção de tarefas (saltos)
CEFET-PE Arquitetura e redes de Computadores
Evolução X86
• Nome Data Transistores
• Pentium III 1999 8.2M– Adicionadas instruções “streaming SIMD” para operar sobre vetores de
128-bits de dados inteiro ou ponto flutuante de 1, 2 ou 4 bytes
• Pentium 4 2001 42M– Adicionados formatos de 8-bytes e 144 novas instruções para o modo
streaming SIMD
CEFET-PE Arquitetura e redes de Computadores
Evolução AMD
1975
1979
8080A 8086
1982
286
1991
Am386
1993
Am486
1995
AMD-K5™
1997
AMD-K6®
1999
AMD Athlon™
2002
Transistores 5k 29k 134k 275k 1.200k 3.500k 9.300k 22.000k 37.000k
AMD Athlon XP™
2003
0.80um 0.35um 0.25um 0.18um 0.13um
0.13um -> 0.09um
10um
100.000k Transistores
2004
+
2005
CEFET-PE Arquitetura e redes de Computadores
Evolução AMD
1991 1992 1993 1994 1995 1996 1997 1998
1999 2000 2001 2002 2003 2004 2005 2006
am386 am486
+
CEFET-PE Arquitetura e redes de Computadores
Arquitetura Interna de Microprocessador
CEFET-PE Arquitetura e redes de Computadores
Arquitetura 8086
– arquitetura de 16 bits• comunicação com a memória em 16 bits (8086)• capacidade máxima de memória de 1 MByte• 14 registradores (4 dados, 4 endereços, 4 segmentos, ponteiro
do programa, flags)• endereço físico = segmento * 16 + deslocamento• 85 instruções básicas• coprocessador: 8087 (67 instruções básicas)• sem cache, sem memória virtual
– 8088 - mesma arquitetura, barramento externo de 8 bits
8086 - primeiro microprocessador de 16 bits da Intel
CEFET-PE Arquitetura e redes de Computadores
Características da Arquitetura 8086
CEFET-PE Arquitetura e redes de Computadores
Características da Arquitetura 8088
CEFET-PE Arquitetura e redes de Computadores
Características da Arquitetura 8086
CEFET-PE Arquitetura e redes de Computadores
Características da Arquitetura 8086
15 8 7 0AX AH AL acumuladorBX BH BL baseCX CH CL contadorDX DH DL dado
SP ponteiro para pilhaBP ponteiro baseSI índice fonteDI índice destino
IP apontador de instruçõesFLAGS flags
CS segmento de códigoDS segmento de dadosSS segmento de pilhaES segmento extra
Dados
Endereços
Segmento
CEFET-PE Arquitetura e redes de Computadores
Registradores de Segmento 8086
• São registradores de endereços;
• Armazena endereços de programa e dados;
• Organização de memória:– Cada byte na memória possui um endereços de 20 bits iniciando em 0
até 220-1 ou seja, 1M de memória endereçável;
– Endereços são representados por 5 dígitos hexadecimais; de 00000 - FFFFF
– Problema: 20 bits de endereços é grande demais para ser colocado em registradores de 16 bits;
– Solução: Segmentação de memória• Blocos de memória de 64K consecutivos (65.536);
• Um número de segmento é um número de 16 bits;
• Faixa de um endereços de um segmento vai de 0000 a FFFF
• Em um segmento, uma posição de memória em particular é especificado como sendo um offset (deslocamento);
• Um offset também tem faixa de 0000 a FFFF
CEFET-PE Arquitetura e redes de Computadores
Características da Arquitetura 8086
CEFET-PE Arquitetura e redes de Computadores
Segmentação de memória no 8086
li ne
ar a
ddre
sse
s
one segment
CEFET-PE Arquitetura e redes de Computadores
Geração de endereço físico
CEFET-PE Arquitetura e redes de Computadores
Geração de endereço físico
• Registrador de segmento * 16 + offset
Physical Address (20 Bits)
Adder
Segment Register (16 bits) 0 0 0 0
Offset Value (16 bits)
CEFET-PE Arquitetura e redes de Computadores
Organização de memória
Bloco Dados
01 Área de memória para o usuário (64 Kb)
02 Área de memória para o usuário (128 Kb)
03 Área de memória para o usuário (192 Kb)
04 Área de memória para o usuário (256 Kb)
05 Área de memória para o usuário (320 Kb)
06 Área de memória para o usuário (384 Kb)
07 Área de memória para o usuário (448 Kb)
08 Área de memória para o usuário (512 Kb)
09 Área de memória para o usuário (576 Kb)
10 Área de memória para o usuário (640 Kb)
11 Memória de Vídeo
12 Memória de Vídeo
13 Área de Extensão da ROM
14 Área de Extensão da ROM
15 ROM-BIOS do sistema
16 ROM-BIOS do sistema e ROM-BASIC
CEFET-PE Arquitetura e redes de Computadores
Microprocessador Intel 80286– Praticamente a mesma arquitetura do 8086– Data bus 16 bits (D0 – D15), Address bus 24 bits (16Mb memória)– Modos real (8086) e protegido (memória vitual & 16Mb memória)– 4 Unidades funcionais
• EU – Unidade de execução de Instruções• BU – Unidade de Acesso e Controle de Barramento• IU – Unidade de decodificação de instruções• AU – Unidade de Formação de endereços
– Comunicação com a memória em 16 bits– 14 registradores (os do 8086)– Endereço físico ou virtual– 15 instruções extras (92 + 15 = 107 instr. básicas)– Co-processador: 80287– Sem cache– Memória virtual segmentada (apenas no modo protegido)– Maior parte dos programas desenvolvidos para modo Real
CEFET-PE Arquitetura e redes de Computadores
Microprocessador Intel 80386– Modos real (8086), protegido e virtual86
– 6 Unidades funcionais• EU – Unidade de execução de Instruções
• BU – Unidade de Acesso e Controle de Barramento
• IU – Unidade de decodificação de instruções
• PU – Unidade de pre-fetch com fila de até 16 bytes
• PgU – Unidade de formação de endereços (paging unit)
• SU – Unidade de formação de endereços (segmentation unit)
– Comunicação com a memória• 16 (SX) ou 32 bits (DX)• Capacidade máxima de memória de 4 GByte
– 14 registradores• do 8086, com 32 bits, e mais 2 regs. de segmento
– 44 instruções extras• 107 + 44 = 153 instruções básicas
– Endereço físico ou virtual (64 TByte)• Memória virtual segmentada (sempre) e paginada (opcional), ambas
apenas no modo protegido
CEFET-PE Arquitetura e redes de Computadores
Microprocessador Intel 8038615 8 7 0
EAX AH ALEBX BH BLECX CH CLEDX DH DL
ESPEBPESIEDI
EIPEF
CSDSSSESFSGS
1631acumuladorbasecontadordado
ponteiro para pilhaponteiro baseíndice fonteíndice destino
apontador de instruçõesflags
segmento de códigosegmento de dadossegmento de pilhasegmento extrasegmento extrasegmento extra
CEFET-PE Arquitetura e redes de Computadores
Microprocessador Intel 80386
Conceito do Memória Virtual
processador
memória virtual
mapeador
memória física
endereçovirtual
endereçofísico
grande espaço de endereçamento
pequeno espaço de endereçamento
endereço gerado pelas instruções sendo executadas
mapeamento por hardware
CEFET-PE Arquitetura e redes de Computadores
Microprocessador Intel 80386Questões da Memória Virtual:
• quando mover um bloco da memória secundária para a memória primária (real) ?
– por demanda
• quando mover um bloco da memória real para a memória secundária?– quando faltar espaço na memória real
• qual o tamanho ideal de um bloco?– constante (paginação) ou variável (segmentação)
• onde colocar um novo bloco transferido para a memória principal?– onde houver área livre (paginação) ou no “melhor” lugar (segmentação)
CEFET-PE Arquitetura e redes de Computadores
Microprocessador Intel 80386Dinâmica da Memória Virtual:
• programa gera endereço virtual– CPU transforma endereço virtual em endereço físico (hardware)
• bloco está na memória principal?– Sim: calcular o endereço físico (hardware)– Não: buscar o bloco da memória secundária (software)
• existe espaço para o bloco na memória principal?– Sim: carregar o bloco e atualizar descritor (software)– Não: retirar um outro bloco, carregar o bloco e atualizar descritores (software)
CEFET-PE Arquitetura e redes de Computadores
Microprocessador Intel 80386Memória Virtual Segmentada: (Segmentação => Converte endereços lógicos em endereços lineares)
0(globaloulocal)segm
315 31 04
Seletor de tabela(Global ou Local)
Registrador de segmento Deslocamento
031Tabela de descritores
Descritorde segmento(8 bytes)
Endereço base(32 bits)
(32 bits)
Endereço linear
+
GDTR ou LDTR
endereço lógico ou virtual
endereço linear (ainda não é o físico)
CS
DS
SS
ES
...
(Global ou Local)(Caso a paginação não esteja sendo utilizada, se converte em endereço físico)
CEFET-PE Arquitetura e redes de Computadores
Memória virtual segmentada
• programa gera endereço virtual– CPU transforma endereço virtual em endereço físico
• segmento está na memória principal?– Sim: calcular o endereço físico. Se este endereço estiver fora do segmento,
gerar erro– Não: buscar o segmento da memória secundária
• existe espaço suficiente para o o segmento na memória principal?– Sim: carregar o segmento na “melhor posição” e atualizar descritor– Não: retirar um (ou mais) segmentos, carregar novo segmento e atualizar
descritores
CEFET-PE Arquitetura e redes de Computadores
Memória virtual paginada
PDE(32bits)
031Endereço linear
22 21 12 11
Diretório Página Deslocamento
Diretório de Páginas(PD)
PTE(32 bits)
Tabela de Páginas(PT)
CR3031
Endereço físico
12 11
DeslocamentoEndereço de page frame
...
(Paginação => Converte endereços lineares em endereços físicos)
Tabelas
(1024 x 32)
(PT)...
CEFET-PE Arquitetura e redes de Computadores
Memória virtual paginada
• programa gera endereço virtual– CPU transforma endereço virtual em endereço físico
• página está na memória principal?– Sim: calcular o endereço físico. Este endereço sempre está dentro da
página.– Não: buscar a página da memória secundária
• existe espaço suficiente para a página na memória principal?– Sim: carregar a página em qualquer lugar e atualizar descritor– Não: retirar uma página (é suficiente), carregar nova página e atualizar
descritores
CEFET-PE Arquitetura e redes de Computadores
Microprocessador Intel 80386
• outras características
– Co-processador: 80387 (67 + 7 -1 = 73 instr. básicas)
– Sem cache
– TLB:• pequena memória associativa que retém os últimos e mais freqüentes
endereços de página acessado• uma pequena cache de endereços físicos
• apareceram vários microprocessadores compatíveis no mercado– AM386
CEFET-PE Arquitetura e redes de Computadores
Microprocessador Intel 80486
• Idêntico ao 386– Modos real (8086), protegido e virtual86– Comunicação com a memória em 32 bits – Capacidade máxima de memória de 4 GByte– 16 registradores (os do 80386, também em 32 bits)– 6 instruções extras (151 + 6 = 157 instruções básicas)– Endereço físico ou virtual
• Memória virtual segmentada• e paginada (opcional)
– Co-processador: 80487 (para 80486SX) integrado no 80486DX
– Com cache de 8 KByte FPU
CEFET-PE Arquitetura e redes de Computadores
Microprocessador Intel Pentium
• Reestruturação do 486– Modos real (8086), protegido e virtual86– 16 registradores (os do 80386, também em 32 bits)– Memória virtual segmentada e paginada
• Comunicação com a memória em 64 bits
• Capacidade máxima de memória de 4 GByte
• 5 instruções extras (157 + 5 = 162 instr. básicas)
• FPU: coprocessador aritmético integrado
• Cache de 16 KByte (2 x 8 KByte)
CEFET-PE Arquitetura e redes de Computadores
Microprocessador Intel Pentium
• 2 pipelines para inteiros, operando em paralelo• cada pipeline inteiro consta de 5 estágios:
– busca de instrução (a partir da cache de instruções),– decodificação de instrução,– geração de endereço,– execução,– escrita (write back).
• FPU também em pipeline (mas não em paralelo)• operação super-escalar: mais de uma instrução
pronta em um ciclo de relógio
CEFET-PE Arquitetura e redes de Computadores
Microprocessador Intel Pentium
BIU
Cache Instr.
ALU
FPU
Registradores
Buffer deinstruções
barramentos de 64 bitsexternos e internos
caches separadasdados e instr.
8 KB cada
bus interfaceunit
2 pipelines paralelosde 5 estágiospara inteiros
ALU
Cache Dados
BTB
reg.stack
+
÷U-pipe
V-pipe
FPU-pipe
com circuitosdedicadospara soma,divisão emultiplicação
CEFET-PE Arquitetura e redes de Computadores
Microprocessador Intel Pentium Pro (P6)
• Re-estruturação do Pentium (P5)– Mesmas características de 80386 (mem. virtual) e do
Pentium (largura de dados de 64 bits)– FPU– cache de 16 KByte (2 x 8 KByte)
• 5 instruções extras (162 + 5 = 167 instr. básicas)• Operação super-escalar• 14 unidades internas• Execução fora de sequência• Execução especulativa
CEFET-PE Arquitetura e redes de Computadores
Microprocessador Intel Pentium MMX
• Arquitetura do Pentium (P5)– Novo tipo de dado: “packed”– 57 instruções extras (além das 167 instr. básicas)– Com cache de 32 KByte (2 x 16 KByte)– Operação super-escalar– Não possui as características do Pentium Pro (execução
fora de sequência, exec.especulativa)– Instruções para processamento de vetores (8 bytes, 4
palavras ou 2 palavras duplas)– 8 novos registradores lógicos (MMX0 a MMX7)
CEFET-PE Arquitetura e redes de Computadores
Intel Pentium II (P6)
• Pentium Pro com MMX– Mesmas características do Pentium Pro– Instruções MMX– Cinco unidades internas– Execução fora de sequência– Execução especulativa
Pentium
ProMMX
PentiumII
CEFET-PE Arquitetura e redes de Computadores
Intel Pentium III
– Novo tipo de dado: “floating packed” (Ponto flutuante)– 70 instr. extras (além das 167 básicas e 57 MMX)– Instruções para processamento de vetores inteiros (MMX)
ou de ponto flutuante (SSE)– 8 novos registradores físicos (XMM0 a XMM7), de 128 bits,
para as instruções SSE– No de série do processador (Inst. CPUID)
CEFET-PE Arquitetura e redes de Computadores
Intel Pentium 4
• Lançado em novembro de 2000 Pipeline de 20 estágios (“hyper pipeline”) Até 128 instruções em execução (3 vezes mais que
no Pentium III) Algoritmo melhorado para previsão de desvios, com
tabela de 4K Novo sistema de cache de nível 1
Cache de execução de 12 K micro-operações (Execution Trace Cache)
Cache de dados de 8 KBytes
CEFET-PE Arquitetura e redes de Computadores
Intel Pentium 4
• Instruções SSE2 (Streaming SIMD Extensions 2) - 144 novas instruções– 67 instruções para vetores de pontos flutuante de precisão
dupla (64 bits)– 69 novas instruções MMX, para vetores inteiros de 128 bits
(utilizando os registradores XMM)– 8 instruções para controle de cache
Barramento do sistema “Net Burst” de 400 MHz
CEFET-PE Arquitetura e redes de Computadores
Intel Pentium 4 - Diagrama Resumido
CEFET-PE Arquitetura e redes de Computadores
Mercado de Processadores
• Low –End– Destinado à construção de máquina de baixo poder computacional
• Usuário iniciante– (Celeron D (Intel), Semprom (AMD)
• Mid-Range– Destinado à construção de máquinas de maior poder computacional
• Ferramentas CAD, design house – Pentium IV (Intel), Athlon (AMD)
• High-End– Destinado à maquinas de alto poder computacional e compartilhamento
• Servidores de Rede• Gerenciamento de Clusters
– Pentium HT (Intel), Athlon 64 D (AMD)
CEFET-PE Arquitetura e redes de Computadores
Comparativo entre Processadores Intel e AMD
• Intel foi isoladamente a líder em fabricação de CPUs até início dos anos 90– Até a fabricação do 80286 Não houve concorrência da AMD
– Concorrência começou devido a fabricação do AM386 DX
• Intel Pentium X AMD AM5x86• Intel Pentium, Pentium PRO X AMD K5
– Equivalente mas lançado 3 anos depois do Pentium
• Intel Pentium MMX, II X AMD K6– Vantagem AMD: Mais barato
• Intel Celeron X AMDK6– Celeron:Versão “light” do Pentium II
• Intel Celeron X AMD Sempron
CEFET-PE Arquitetura e redes de Computadores
Estado da Arte em Processadores
• AMD• Desktop: AMD Athlon 64 FX,
AMD Athlon 64• Server: AMD Opteron
• Intel• Desktop: Intel Pentium 4 w/
HT, Intel Pentium 4 Extreme Edition
• Server: Intel Itanium 2, Xeon
CEFET-PE Arquitetura e redes de Computadores
Resumo Processadores Celeron
• Os processadores Celeron diferenciam-se dos processadores Pentium II, III e IV pela limitação das seguintes características:
– Tamanho da Cache L2– Clock interno– Clock do barramento externo
CEFET-PE Arquitetura e redes de Computadores
Resumo Processadores CeleronModelo Nome-
código Baseado no Cache
L1Cache
L2Tecnolo
gia Barramento
ExternoSoquete
Celeron SEPP Convington
Pentium II com
núcleo Deschutes
32KB - 0.25µm 66MHz Slot 1
Celeron A Mendocino
Pentium II com
núcleo Deschutes
32KB 128KB 0.25µm 66MHz Slot 1
Celeron PPGA Mendocino
Pentium II com
núcleo Deschutes
32KB 128KB 0.25µm 66MHz Soquete 370
Celeron Coppermine
Coppermine
Pentium III com
núcleo Coppermine
32KB 128KB 0.18µm 66MHz / 100MHz
Soquete 370
Celeron Tualatin
Tualatin Pentium III com
núcleo Tualatin
32KB 256KB 0.13µm 100MHz Soquete 370
Celeron Willamette
Willamette
Pentium 4 com
núcleo Willamette
8KB 128KB 0.18µm 400MHz Soquete 478
Celeron Northwood
Northwood
Pentium 4 com
núcleo Northwood
8KB 128KB 0.13µm 400MHz Soquete 478
Celeron D Prescott Pentium 4 com
núcleo Prescott
8KB 256KB 0.09µm 533MHz Soquete 478 / Soquete 775
CEFET-PE Arquitetura e redes de Computadores
Resumo Processadores Celeron D
Processador Clock Interno Clock Externo Cache L2 Soquete Hyper-Threading
350 3,2 GHz 533 MHz 256 KB 478 ou 775 Não
345 3,06 GHz 533 MHz 256 KB 478 ou 775 Não
340 2,93 GHz 533 MHz 256 KB 478 ou 775 Não
335 2,80 GHz 533 MHz 256 KB 478 ou 775 Não
330 2,66 GHz 533 MHz 256 KB 478 ou 775 Não
325 2,53 GHz 533 MHz 256 KB 478 ou 775 Não
CEFET-PE Arquitetura e redes de Computadores
Resumo Processadores Sempron
Processador Clock Interno Clock Externo Cache L1 Cache L2 Soquete
Sempron 2200+ 1,50 GHz 333 MHz 128 KB 256 KB 462
Sempron 2300+ 1,58 GHz 333 MHz 128 KB 256 KB 462
Sempron 2400+ 1,67 GHz 333 MHz 128 KB 256 KB 462
Sempron 2500+ 1,70 GHz 333 MHz 128 KB 256 KB 462
Sempron 2600+ 1,83 GHz 333 MHz 128 KB 256 KB 462
Sempron 2800+ 2 GHz 333 MHz 128 KB 256 KB 462
Sempron 3000+ 2 GHz 333 MHz 128 KB 512 KB 462
CEFET-PE Arquitetura e redes de Computadores
Resumo Processadores Celeron
• Exemplo: Celeron D
– 16Kb Cache L1– 256Kb Cache L2– Clock ext. 533MHz (Burst 133MHz)– Clock int. 2,13 GHz a 3,2 GHz– Suporte Hyper – Threading => não disponível
CEFET-PE Arquitetura e redes de Computadores
Intel Extreme Edition
CEFET-PE Arquitetura e redes de Computadores
Intel Extreme Edition
Características:
•Primeiro processador desktop da Intel com tecnologia dual-core.
•Basicamente é evolução do Pentium IV
•Hyper-Threading (HT) : 2 processadores (lógico + Físico)
•Processador dual-core : 4 processadores (2 lógicos + 2 Físicos)
•Hyper-Threading + dual-core: execução de 4 threads simultaneamente
CEFET-PE Arquitetura e redes de Computadores
Intel Extreme Edition
•Processador “lógico”
•barramentos, caches e unidades de execução são compartilhados
•cada processador lógico tem estado próprio, bem como registradores de propósitos gerais.
•Processador físico
•tem seus próprios conjuntos de registradores e caches.
CEFET-PE Arquitetura e redes de Computadores
Intel Extreme Edition
•Cache
•2 caches de 16KB (L1).
•2 caches de 1 MB (L2), sendo 1 MB para cada core.
•principal vantagem: redução do tráfego do barramento.
•Trace cache
•cada core tem uma trace cache de até 12KB de micro-operações já decodificadas.
•principais vantagens: remoção da etapa de decodificação em loops e em execução de desvios.
CEFET-PE Arquitetura e redes de Computadores
Intel Extreme Edition
•Segurança: bit para desabilitar execução:
•recurso aliado ao S.O
•define áreas ativas ou não-ativas de memória.
•Conjunto de instruções
•instruções dedicadas ao processamento de imagens e compressão de dados
•mantém compatibilidade com IA-32.
•Gerenciamento de energia: capacidade de desligamento de pinos e outras partes do chip.
CEFET-PE Arquitetura e redes de Computadores
Intel Extreme Edition
Perspectivas:
•Aumento da velocidade do barramento PCI e AGP (média de 3.5 vezes).
•Facilidades para os softwares multi-threads do futuro.
•Dual-core : será base para as pesquisas da Intel nas tecnologias Hyper-Threading e EM64T.
CEFET-PE Arquitetura e redes de Computadores
AMD Athlon 64
CEFET-PE Arquitetura e redes de Computadores
AMD Athlon 64
• Resumo Processadores AMD Atuais– Desktop
• Semprom (Low End)• Athlon 64 (Mid Range)• Athlon 64 FX• Athlon 64 X2
– Notebooks• Athlon 64 Mobile• Turion 64
– Servidores• Opteron
CEFET-PE Arquitetura e redes de Computadores
AMD Athlon 64
1975
1979
8080A 8086
1982
286
1991
Am386
1993
Am486
1995
AMD-K5™
1997
AMD-K6®
1999
AMD Athlon™
2002
Transistores 5k 29k 134k 275k 1.200k 3.500k 9.300k 22.000k 37.000k
AMD Athlon XP™
2003
0.80um 0.35um 0.25um 0.18um 0.13um
0.13um -> 0.09um
10um
100.000k Transistores
2004
+
2005
CEFET-PE Arquitetura e redes de Computadores
AMD Athlon 64
UCP‘NorthBridge’
L1/L2 L3
‘SouthBridge’
USB
E/ISA
Bus E / ISA
Bus PCI
REDE
LAN
Bu
s S
CS
I
AdaptadorSCSI
SuperI/O
InterfaceGráfica
ROMBIOS
RA
M
PCI
I/O
PCMCIAInterface
Som
CD-ROM
CD-ROM
HD
HD
Scaner
Floppy
Mouse
RA
M
AG
P
COMLPT
CEFET-PE Arquitetura e redes de Computadores
AMD Athlon 64
• Novas características incorporadas– 1MB L2 Cache
– Controlador de Memória DDR incorporado
– HyperTransport Channel
– Menor consumo de potencia
– Novo Core Processador
– Registradores em dobro
– Pipeline maior (10 12 estágios)
– Maior “Look Aside Buffer” (TLB)
CEFET-PE Arquitetura e redes de Computadores
AMD64 Architecture Register Differences: AMD64 vs x86
• AMD64
– 64-bit integer registers
– 48-bit Virtual Address
– 40-bit Physical Address
• REX - Register Extensions
– Sixteen 64-bit integer registers
– Sixteen 128-bit SSE registers
• SSE2 Instruction Set
– Double precision scalarand vector operations
– 16x8, 8x16 way vectorMMX operations
– SSE1 already added with AMD Athlon MP
RAX
63
GGPPRR
xx8877
079
31
AHEAX AL
0715In x86
MMX0SSSSEE
127 0
MMX7
EAX
EIP
Added by AMD64
EDI
XMM8MMX8
MMX15
R8
R15
CEFET-PE Arquitetura e redes de Computadores
32-bit32-bit
Um Processador AMD64 pode rodar sistemas operacionais de 32 ou 64 bits
STARTSTARTSTARTSTART
BOOT UPBOOT UPUsing 32 bit BIOSUsing 32 bit BIOS
BOOT UPBOOT UPUsing 32 bit BIOSUsing 32 bit BIOS
LookLookat OSat OSLookLookat OSat OSLoad 32 bit OSLoad 32 bit OSLoad 32 bit OSLoad 32 bit OS
Run 32 bitRun 32 bitApplicationsApplicationsRun 32 bitRun 32 bit
ApplicationsApplications
Load 64 bit OSLoad 64 bit OSLoad 64 bit OSLoad 64 bit OS64-bit64-bit
Run 32 & 64Run 32 & 64bit appsbit apps
Run 32 & 64Run 32 & 64bit appsbit apps
OS for x64-based Systems32-bit and 64-bit on a single platform
CEFET-PE Arquitetura e redes de Computadores
Características da arquitetura AMD64
• Processamento nativo em 32 e 64 bits
• Controlador de memória DDR integrado ao processador
• Tecnologia Hyper Transport
• Cool’n’quiet (PowerNow! para servers e mobile)
• Proteção anti-vírus por hardware
• Benefícios
• Excelente desempenho
• Melhor custo/benefício
• Sistemas mais confiávies
• Preparado para software de 64 bits
CEFET-PE Arquitetura e redes de Computadores
Arquitetura do sistema com AMD64
Sistema típico
CPUCPUCPUCPU
North Bridge
North Bridge
SouthBridge
SouthBridge
PCIIDE, FDC,USB, Etc.
DDR
Sistema AMD64
CPUCPUAMD64AMD64
CPUCPUAMD64AMD64
PCI Bridge -Túnel HT
PCI Bridge -Túnel HT
I/OHub
I/OHub
IDE, FDC,USB, Etc.
DDR
PCI-X
PCI Express
PCI
PCIBridge
PCIBridge
PCI-X
PCI Express
CEFET-PE Arquitetura e redes de Computadores
Processadores AMD64 de dois núcleosDiferenças na fabricação e compatibilidade de socket e placa
Núcleo • Athlon 64• Athlon 64 FX• Sempron• Opteron• Turion
Processador “single-core”
Processador “dual-core”
Núcleos
• Athlon 64 X2• Opteron
Placa mãe
CEFET-PE Arquitetura e redes de Computadores
Processadores AMD64 de dois núcleosDiferenças na fabricação e compatibilidade de socket e placa
CEFET-PE Arquitetura e redes de Computadores
Fluxo de Dados em um AMD64 CPU
1MB
L2 Cache
1MB
L2 Cache
AMD64CPU
L1
Data
Cach
eL1
In
st.
Cach
e
MemoryController
DRAMController
CrossbarSwitch
64
-bit
s w
ide
Bussing Unit
Processor CoreCache, Load/Store &
Bussing UnitIntegrated North Bridge
Load/StoreUnit
Syste
m R
eq
uest
Qu
eu
e (S
RQ
)
HyperTransport Technology BUS
144-b
it w
ide
DR
AM
in
terf
ace
FP UnitExecution UnitFetch Scan Align
12
8-b
its w
ide
CEFET-PE Arquitetura e redes de Computadores
Arquitetura Interna
MemoryController
DRAMController
CrossbarSwitch
Syste
m R
eq
uest
Qu
eu
e (S
RQ
)
HyperTransport Technology BUS
144-b
it w
ide
DR
AM
in
terf
ace
1MB
L2 Cache
1MB
L2 Cache
AMD64CPU
L1 D
ata
Cach
eL1 I
nst.
Cach
e
64
-bit
s w
ide
Bussing Unit Load/StoreUnit
FP UnitExecution UnitFetch Scan Align
12
8-b
its w
ide
1MB
L2 Cache
1MB
L2 Cache
AMD64CPU
L1 D
ata
Cach
eL1 I
nst.
Cach
e
64
-bit
s w
ide
Bussing Unit Load/StoreUnit
FP UnitExecution UnitFetch Scan Align
12
8-b
its w
ide
CEFET-PE Arquitetura e redes de Computadores
• Processamento nativo em 32 e 64 bits
• Controlador de memória DDR integrado ao processador
• Barramento de sistema Hyper Transport
• Cool’n’quiet para modelos acima do Sempron 2800+
• Proteção anti-vírus por hardware
• Acesso à memória em 64 bits
• Computação do dia-a-dia
Processadores AMD Sempron
CEFET-PE Arquitetura e redes de Computadores
• Processamento nativo em 32 e 64 bits
• Controlador de memória DDR integrado ao processador
• Barramento de sistema Hyper Transport
• Cool’n’quiet - Gerenciamento avançado de energia
• Proteção anti-vírus por hardware
• Excelente custo/benefício
• AMD Athlon 64 FX:
• Campeão em aplicações single thread
• Jogos
Processadores AMD Athlon 64
CEFET-PE Arquitetura e redes de Computadores
• Dois núcleos AMD64 (Dual Core)
• Processamento nativo em 32 e 64 bits
• Controlador de memória DDR integrado ao processador
• Barramento de sistema Hyper Transport de 2.0GHz
• Cool’n’quiet - Gerenciamento avançado de energia
• Proteção anti-vírus por hardware
• Acesso à memória em 128 bits
• Alto desempenho multi-tarefa
Processadores AMD Athlon 64 X2
CEFET-PE Arquitetura e redes de Computadores
• Para servidores com 1, 2, 4 ou 8 processadores
• Processamento nativo em 32 e 64 bits
• Controlador de memória DDR integrado ao processador
• Barramento de sistema Hyper Transport – Sem gargalos de FSB
• Power Now! - Gerenciamento avançado de energia
• Acesso à paralelo à memória, em 128 bits
• Inclui modelos Dual Core
• Excelente consumo de energia
Processadores AMD Opteron
CEFET-PE Arquitetura e redes de Computadores
Funcionamento de servidor Dual Alta demanda - controlador de memória no chipset
CEFET-PE Arquitetura e redes de Computadores
Funcionamento de servidor Dual Alta demanda – arquitetura AMD64
CEFET-PE Arquitetura e redes de Computadores
Típico sistema multiprocessado
SouthBridge
SouthBridge
PCIIDE, FDC,USB, Etc.
PCI-XPCI-XBridge
PCI-XBridge
North Bridge
North Bridge
ProcessorProcessorProcessorProcessor
ProcessorProcessorProcessorProcessor
ProcessorProcessorProcessorProcessor
ProcessorProcessorProcessorProcessor
PCI-XPCI-XBridge
PCI-XBridge
PCI-XPCI-XBridge
PCI-XBridge
DDR
DDR
MemoryExpander
MemoryExpander
MemoryExpander
MemoryExpander
PCI-XBridge
PCI-XBridge
PCI-X
I/OHub
I/OHub
PCIIDE, FDC,USB, Etc.
AMDAMDOpteronOpteron
AMDAMDOpteronOpteron
AMDAMDOpteronOpteron
AMDAMDOpteronOpteron
AMDAMDOpteron™Opteron™
AMDAMDOpteron™Opteron™
AMDAMDOpteronOpteron
AMDAMDOpteronOpteron
PCI-XBridge
PCI-XBridge
PCI-X
OtherBridge
OtherBridge
OtherI/O
DDR
DDR
DDR
DDR
Sistema AMD Opteron™
Sistema Quad-processado Solução do problema de gargalo no chipset/FSB
CEFET-PE Arquitetura e redes de Computadores
I/O HubI/O HubUSBUSB
PCIPCI
PCI-E Bridge
PCI-E Bridge
PCI-E Bridge
PCI-E Bridge
PCI-E Bridge
PCI-E BridgeI/O HubI/O HubI/O HubI/O Hub
PCI-E Bridge
PCI-E BridgePCI-E Bridge
PCI-E BridgePCI-E Bridge
PCI-E Bridge
Memory Controller
Hub
Memory Controller
Hub
CPUCPU CPUCPU
Multiprocessamento com CPUs de núcleo duploNecessidade da evolução da arquitetura de interconexão
Arquitetura x86 tradicional• FSB compartilhado por CPUs, Memória e I/O
• Mais CPUs ≠ Maior performance
AMD64 com DirectConnect• Arquitetura x86 padrão de mercado
• Sem gargalo de FSB
• Menor latência no acesso à memória
SRQ
Crossbar
HTMem.Ctrlr
SRQ
Crossbar
HTMem.Ctrlr
CPUCPU CPUCPU CPUCPU CPUCPU8 GB/S
8 GB/S 8 GB/S
8 GB/S
CEFET-PE Arquitetura e redes de Computadores
CPU de 16 núcleos
O futuro do MicroprocessadorMais transistores, mais núcleos, mais threads
• Mais núcleos• Núcleos especializados• Mais controladores integrados• ...
CEFET-PE Arquitetura e redes de Computadores
BenchMark AMD X Intel
CEFET-PE Arquitetura e redes de Computadores
BenchMark AMD X Intel
CEFET-PE Arquitetura e redes de Computadores
Conclusões
• Processadores AMD atuais são mais indicados para aplicativos (Business), Jogos, Aplicativos 2D com melhor taxa de preço
• Processadores Intel estão mais indicados para aplicativos 3D e Multitasking
CEFET-PE Arquitetura e redes de Computadores
Bibliografia e Sites Recomendados
Patterson, D. - Organizacao e projeto de computadores - a interface hard/software
Torres, G. – Hardware – Curso completo
Weber, R. – Arquitetura de computadores pessoais
Intel Home page: http://www.Intel.com
AMD Home Page: http://www.amd.com
CEFET-PE Arquitetura e redes de Computadores
Pesquisa:
• Explicar em linhas gerais, as principais diferenças entre os seguintes processadores:
– Intel Pentium HT (HyperThreading )
– Intel Pentium D (Dual Core)
– Intel Pentium EE (Extreme Edition)
Enviar resposta para lista de discussão com subject: Nome do aluno
Top Related