Tiểu Luận Pentium III FINAL

26
1 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG KHOA ĐÀO TẠO QUỐC TẾ VÀ SAU ĐẠI HỌC ---------------**********---------------- BÀI TIỂU LUẬN Môn: KIẾN TRÚC MÁY TÍNH NÂNG CAO Chủ đề: “Tìm hiểu vi xử lý Intel Pentium III” Giáo viên giảng dạy: TS. Phạm Văn Cường Nhóm thực hiện: Hoàng Thị Hà Nguyễn Huyền Trang

Transcript of Tiểu Luận Pentium III FINAL

Page 1: Tiểu Luận Pentium III FINAL

1

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

KHOA ĐÀO TẠO QUỐC TẾ VÀ SAU ĐẠI HỌC

---------------**********----------------

BÀI TIỂU LUẬNMôn: KIẾN TRÚC MÁY TÍNH NÂNG CAO

Chủ đề: “Tìm hiểu vi xử lý Intel Pentium III”

Giáo viên giảng dạy: TS. Phạm Văn Cường

Nhóm thực hiện: Hoàng Thị Hà

Nguyễn Huyền Trang

Phạm Đình Vũ

Hoàng Hoài Nam

Lớp: Cao học Hệ thống thông tin 2013

Hà nội, ngày 28 tháng 3 năm 2014

Page 2: Tiểu Luận Pentium III FINAL

MỤC LỤC

MỤC LỤC..............................................................................................................2

NỘI DUNG.............................................................................................................3

Phần 1: GIỚI THIỆU..............................................................................................3

Phần 2: CẤU TRÚC HỆ THỐNG..........................................................................4

Phần 3: ĐẶC TÍNH CÔNG NGHỆ MỚI...............................................................9

3.1 Các tính năng nổi bật....................................................................................9

3.2 Pentium III Cache.........................................................................................9

3.3 Advanced Transfer Cache 256KB mức L2................................................11

3.4 Advanced System Buffering.......................................................................12

3.5 Bus độc lập kép- Dual Independent Bus (DIB)..........................................12

3.6 Bus hệ thống 133MHz................................................................................12

3.7 P6 Dynamic Execution Microarchitecture.................................................12

3.8 Internet Streaming SIMD Extensions.........................................................13

3.9 Các tùy chọn gói xử lý- Processor Package Options..................................15

KẾT LUẬN..........................................................................................................16

TÀI LIỆU THAM KHẢO....................................................................................19

2

Page 3: Tiểu Luận Pentium III FINAL

NỘI DUNG

Phần 1: GIỚI THIỆU

Pentium III ra đời vào mùa xuân năm 1999 với bảng mạch tích hợp các khe cắm

PCI (khe cắm mở rộng), đồ họa AGP (khe cắm Card màn hình). Họ vi xử lý Intel

Pentium III là một bước nâng cấp từ Pentium II. Nhân đầu tiên của Pentium III là

Katmai, đặc trưng bởi tập lệnh SSE (Streaming SIMD Extensions), cho phép ứng dụng

xử lý lên tới 4 số thực chính xác đơn cùng lúc. Những nhân Pentium khác thêm vào

các tính năng khác như 256 và 512 KB trên bộ nhớ đệm L2 và kích thước đóng gói

nhỏ hơn. Trong suốt vòng đời của nó, lõi bộ vi xử lý đã được thu nhỏ hai lần, từ 0.25

micron tới 0.18 micron, và sau đó là 0.13 micron.

Giống như bộ vi xử lý thế hệ trước x86, họ Pentium III bao gồm một vài họ nhỏ

hướng tới các phân đoạn khác nhau của thị trường máy tính:

Pentium III Xeon - phiên bản hiệu suất cao Pentium III desktop processors - máy tính để bàn Desktop Celeron - phiên bản chi phí thấp. Mobile Pentium III and mobile Pentium III-M -các phiên bản di động Mobile Celeron - phiên bản di động của bộ vi xử lý Intel Celeron

Bộ xử lý Intel Pentium III tích hợp kiến trúc vi xử lý linh hoạt P6, kiến trúc bus

độc lập kép DIB (Dual Independent Bus) gồm bus hệ thống đa dịch chuyển và công

nghệ cải tiến truyền thông Intel MMX. Thêm vào đó, Intel Pentium III cung cấp SSE

(Streaming SIMD Extensions), chứa 70 lệnh tăng hiệu suất hoạt động của bộ vi xử lý

trong các chức năng xử lý hình ảnh, âm thanh, video 3D, và nhận dạng giọng nói phục

vụ các trải nghiệm Internet nâng cao. Các phiên bản cũng bao gồm các công nghệ

Advanced Transfer Cache và Advanced System Buffering để đáp ứng các yêu cầu về

băng thông dữ liệu lớn hơn của môi trường hiện nay. Với hiệu năng tuyệt vời dành cho

Internet, các nhà kết nối và các môi trường đa nhiệm, Intel Pentium III nhắm tới phạm

vi chính là người tiêu dùng và doanh nghiệp. Bộ xử lý cũng đáp ứng được yêu cầu của

các máy trạm và máy chủ mức sơ cấp.

3

Page 4: Tiểu Luận Pentium III FINAL

Phần 2: CẤU TRÚC HỆ THỐNG

Hình 1 là sơ đồ khối của các loại Intel Pentium III. Chúng tích hợp kiến trúc vi

xử lý linh hoạt P6, kiến trúc bus độc lập kép DIB (Dual Independent Bus) gồm bus hệ

thống đa dịch chuyển và công nghệ cải tiến truyền thông Intel MMX. Thêm vào đó, bộ

xử lý Intel Pentium III cung cấp SSE (Streaming SIMD Extensions), chứa 70 lệnh tăng

hiệu suất hoạt động của bộ vi xử lý trong các chức năng xử lý hình ảnh, âm thanh,

video 3D, và nhận dạng giọng nói phục vụ các trải nghiệm Internet nâng cao. Kiến trúc

DIB làm tăng băng thông và hiệu suất cho từng bus riêng. Công nghệ vi kiến trúc P6

bao gồm khối đoán trước nhiều lệnh rẽ nhánh tĩnh và động (Dynamic Branch Predictor

và Static Branch Predictor), phân tích luồng dữ liệu và thực hiện lấy lén.

Vi kiến trúc P6 bắt đầu được áp dụng cho Pentium Pro từ năm 1995 và vẫn được

sử dụng cho Pentium III, nhưng linh hoạt hơn. Sự linh hoạt ở chỗ nó loại bỏ ràng buộc

của trình tự các lệnh giữa các pha đọc và thực hiện truyền thống. Có một bộ đệm sắp

xếp thứ tự ROB (Recorder buffer) (hình 2) lưu giữ các lệnh chưa thực hiện được ngay

và xác định những phụ thuộc của các thao tác, phân bổ và sắp xếp thứ tự các thanh ghi

cho chúng, lập thời gian biểu cho trạm dự phòng RS (Reservation Station).

Hình 1. Sơ đồ khối Pentium III

4

Page 5: Tiểu Luận Pentium III FINAL

Hình 2. Pha thực hiện thay bằng cặp pha rẽ nhánh/thực hiện và thu hồi trong

kiến trúc P6 lõi.

Pentium III làm việc ở các tần số 450 MHz đến 1,33 GHz. Khối giao tiếp bus

BIU (Bus Interface Unit) kết nối với 100 đến 133 MHz bus hệ thống với 64 bit và tốc

độ 1 GB/s. BIU có các bộ đệm: 4 bộ đệm ghi lại (writeback buffer), 6 bộ đệm làm đầy

(full buffer) và 8 của vào hang đợi bus (bus queue entries). Có 32kbyte L1 cache

không theo khối, gồm 16kbyte Icache và 16kbyte Dcache. Pentium III kết hợp trực

tiếp ngay trên chip 256 kbyte L2 ATC (Advanced Transfer Cache) có khối xử lý theo

ECC. L2 cache là 8 đường liên hợp tập hợp (8 way set associativity), không theo khối

và kết nối qua bus 256 bit trực tiếp với chip vi xử lý. Đơn vị tạo địa chỉ AGU (Address

Generation Unit) cũng quan trọng như ALU, bởi vì nó chịu trách nhiệm để lưu dữ liệu

từ hoặc tới đúng địa chỉ để nạp hay cất giữ.

Pentium III kiến trúc siêu ống lệnh với 10 phân đoạn (hình 3).

Hình 3. Ống lệnh 10 phân đoạn

Các đơn vị thực hiện tính toán số nguyên IEU (Integer Execution Unit) và FPU

có kiến trúc đường ống xử lý các số dấu phảy động 32 bit, 64 bit và 80 bit chính xác

kép theo chuẩn 754.

Các chipset cho Pentium III

Các chipset của Intel dùng cho các loại Pentium III, Celeron, Xeon phổ biến là

họ Intel 800 (Bảng 5.4). Các chipset 810, 820 còn có thể dùng được cho cả Pentium II.

5

Page 6: Tiểu Luận Pentium III FINAL

Chipset 810 có thể dung cho các vi xử lý Celeron, Pentium II, gồm có hai vi mạch:

82810 GMCH đóng vỏ 412 chân BGA và ICH đóng vỏ 241 chân BGA. Chip 82810

GMCH (Graphic and Memory Controller Hub) gồm có: bộ điều khiển bộ nhớ, bộ điều

khiển đồ họa với các chế độ 2D, 3D và video. Nó hỗ trợ kết nối RAM dung lượng tối

đa 512 MB. Các modun nhớ dùng loại SDRAM kết nối qua Bus PC66/100 MHz. Chip

ICH (I/O Controller Hub) hỗ trợ kết nối PCI 2.2 (6 khe mở rộng Bus PCI), kết nối IDE

6

Page 7: Tiểu Luận Pentium III FINAL

(2 cổng cho các ổ đĩa cứng), Ultra ATA/66, USB (2 cổng và 1 bộ điều khiển USB),

chuột, bàn phím,… Chipset 810 chỉ hỗ trợ hệ thống có 1 bộ vi xử lý. Sơ đồ đấu nối

Chipset Intel 810 với Pentium III cho ở hình sau:

Chipset 840 có tốc độ dữ liệu với Pentium III cao: 1,0 Gbit/s. Sơ đồ khối chức

năng kết nối CPU Pentium III với chipset 840 trên bo mạch chủ được mô tả trong hình

sau:

Chipset 840 gồm có các chip sau đây:

7

Page 8: Tiểu Luận Pentium III FINAL

- 82840 : Memory controller Hub- MCH: bộ tập trung điều khiển bộ nhớ, đóng

vỏ 544- pin BGA, giao tiếp với Pentium III qua bus hệ thống 100Mhz tốc độ

1,06 GHz, có giao tiếp AGP4X cho phép các bộ điều khiển đồ họa 3D truy

nhập đến bộ nhớ chính với tốc độ 1 Hbit/s, có hai kênh kết nối RDRAM và giao

tiếp PCI với hiệu suất I/O cao.

- 82801: (I/O Controller Hub- ICH: bộ tập trung điều khiển vào ra): đóng vỏ 241

chân BGA, sử dụng kiến trúc Hub của Intel (IHA Intel Hub Architecture) để kết

nối trực tiếp với 82840 MCH. Nó hỗ trợ kết nối PCI 32 bit, có bộ điều khiển

IDE và bộ điều khiển USB với hai cổng đề kết nối với các thiết bị ngoại vi qua

giao tiếp USB, hỗ trợ vi xử lý sử dụng bus hệ thống tốc độ 133MHz. Để nâng

cao hiệu suất, 2 chip này có thể được kết nối với 2 chip cơ bản sau đây:

o Bộ tập trung điều khiển PCI 82806 64 bit: hỗ trợ các khe PCI 64 bit ở

tốc độ 33 hoặc 66 MHz. P64H kết nối trực tiếp với 82840 MCH sử dụng

kiến trúc IHA.

o Bộ tập trung lặp bộ nhớ dựa trên RDRAM 82803 dùng để mở rộng dung

lượng RDRAM. Nó chuyển đổi từng kênh nhớ thành 2 kênh nhớ cho kết

nối.

8

Page 9: Tiểu Luận Pentium III FINAL

Phần 3: ĐẶC TÍNH CÔNG NGHỆ MỚI

3.1 Các tính năng nổi bật

Bộ xử lý Intel Pentium III có tốc độ trong khoảng từ 450 MHz tới 1.33 GHz.

Phiên bản hiện tại có bus hệ thống 133MHz hoặc 100MHz.

512 KB Advanced Transfer Cache với mã hiệu chỉnh ECC (Error Correcting Code)

Các phiên bản kết hợp cổng logic tìm nạp trước dữ liệu (Data Prefetch Logic

(DPL), đoán trước dữ liệu mà các ứng dụng cần và nạp trước nó vào Advanced

Transfer Cache, được thiết kế để tăng cường hiệu năng của ứng dụng và bộ xử lý.

32KB (16KB/16KB) non-blocking, bộ nhớ đệm cấp 1 (L1), vi kiến trúc P6 bao

gồm dự đoán đa rẽ nhánh, phân tích luồng dữ liệu và thực hiện suy đoán.

Phần mở rộng luồng Internet SIMD- Internet Streaming SIMD Extensions, gồm 70

lệnh cho phép tăng hiệu suất hoạt động của bộ vi xử lý trong các chức năng xử lý

hình ảnh, video và âm thanh 3D, nhận dạng giọng nói và các trải nghiệm Internet.

Công nghệ cải tiến truyền thông Intel® MMX™.

Khả năng lưu trữ vùng đệm lên tới 4GB không gian địa chỉ nhớ và khả năng mở

rộng bộ nhớ hệ thống lên tới 64GB bộ nhớ vật lý.

Tích hợp dữ liệu và những tính năng tin cậy như Mã hiệu chỉnh lỗi (Error

Correction Code), phân tích lỗi (Fault Analysis) và phục hồi cho cả hệ thống và các

bus đệm L2.

Các phiên bản dựa trên các tiến trình sản xuất Intel’s 0.13, 0.18 và 0.25 micron để

tăng tần số nhân xử lý và giảm thiểu tiêu tốn năng lượng.

Tương thích đầy đủ với các phần mềm kiến trúc Intel hiện có.

Các họ bộ xử lý Intel Pentium III hiện nay bao gồm các phiên bản lên đến 1,33

GHz cho máy tính để bàn, cũng như các máy trạm và máy chủ sơ cấp. Tất cả đều

tương thích với các bộ xử lý Intel thế hệ trước.

3.2 Pentium III Cache

Hệ thống con cache được sử dụng trong các thiết kế bộ xử lý Pentium III bao

gồm cả cache chính mức 1 và cache thứ cấp mức 2. Cache mức 1 -32K, non blocking

và cache mức 2 non blocking 256K cung cấp truy cập nhanh tới những lệnh và dữ liệu

lớn đã dùng gần đây. Bộ nhớ cache thứ cấp này cũng hỗ trợ việc giảm thời gian truy

cập bộ nhớ trung bình.

9

Page 10: Tiểu Luận Pentium III FINAL

Non- blocking Level 1 cache

Bộ xử lý Intel Pentium III gồm hai bộ cache mức L1 dung lượng 16KB độc lập,

một dùng cho các chỉ lệnh và cache còn lại dùng cho dữ liệu, tăng cường hiệu năng

tổng thể hệ thống.

Với kích thước của bộ cache mức 1 (nhỏ hơn nhiều lần dung lượng của một

chương trình trung bình cỡ Megabyte) hoặc một ổ đĩa cứng (Gigabyte), cần bổ sung

một vùng nhớ. Cache mức 2 (độc lập với chip RAM) được thêm vào cache bên trong

để hoạt động như là một vùng nhớ bổ sung. Phần này của cache L2 sử dụng SRAM

(RAM tĩnh) nhanh hơn 4/5 lần DRAM và cung cấp toàn bộ ưu điểm như bộ cache nói

chung. Sự ra đời của cache mức 2 cho phép mở rộng hệ thống tới 2 bộ xử lý và 64 GB

bộ nhớ vật lý cũng như cung cấp khả năng lưu trữ vùng đệm lên tới 4GB không gian

địa chỉ nhớ.

Non-Blocking Level 2 Cache

Một số phiên bản của bộ xử lý Intel Pentium III bao gồm một bộ cache L2 rời

rạc, off- die. Bộ cache L2 này chứa một cache thống nhất, non- blocking 256KB, cải

thiện hiệu suất qua các giải pháp cache trên bo mạch chủ bằng cách giảm thời gian

truy cập bộ nhớ trung bình và cung cấp truy cập nhanh cho các lệnh và dữ liệu đã được

sử dụng gần đây. Hiệu suất thực hiện cache trên bo mạch chủ cũng được nâng cao

thông qua bus cache chuyên dụng 64 bit.

Non- blocking cache hay còn gọi là lookup- free cache lần đầu tiên được đề

xuất bởi Kroft [15], bao gồm 3 đặc điểm sau:

1. Vận hành tải là không chia khối.

2. Các thao tác ghi không chia khối.

3. Cache có khả năng phục vụ nhiều yêu cầu miss cache.

Để cho phép các lệnh không chia khối, và phục vụ đa trễ, Kroft đã đưa ra thanh

ghi MSHR lưu lại thông tin liên quan đến các yêu cầu chưa được xử lý. Mỗi cổng

MSHR bao gồm:

1. Địa chỉ khối dữ liệu.

2. Khung bộ nhớ cache cho khối

3. Từ gây ra mis trong khối

4. Đơn vị chức năng hoặc thanh ghi mà dữ liệu được chuyển tới.

10

Page 11: Tiểu Luận Pentium III FINAL

Các tải non- blocking là những tính năng cụ thể trong bộ vi xử lý, các thao tác

ghi non blocking được hỗ trợ bởi bộ ghi đệm, khi đó, nếu cache có cho phép nhiều

truy cập cùng đồng thời chờ xử lý hay không, phụ thuộc không chỉ vào thanh ghi

MHSR mà còn phụ thuộc vào băng thông có sẵn của cache, như đã được xác định bởi

giao diện giao tiếp giữa cache và modul nhớ.

Các tải không chia khối yêu cầu hỗ trợ thêm thanh ghi MSHR kết hợp với cache

non blocking vào đơn vị thực thi của vi xử lý. Nếu lịch trình các chỉ lệnh tĩnh trong

pipeline được sử dụng trong vi xử lý, cần có một bit trống hoặc đầy trong thanh ghi để

lưu trữ những phụ thuộc dữ liệu đúng. Trong trường hợp lập lịch cho các chỉ lệnh

động, đưa ra thực thi ko có thứ tự (out of order), một vài cơ chế bảng ghi được yêu

cầu. Cả hai chiến lược lập lịch đều cần ngắt xử lý các lịch trình mà có thể giải quyết

với các ngắt của lệnh ko chia khối.

Các vùng ghi đệm được dùng để loại bỏ các ngăn trong thao tác ghi. Chúng cho

phép bộ vi xử lý tiếp tục thực thi mặc dù có một vài lệnh ghi chưa được hoàn tất. Các

bộ ghi đệm kết hợp với bộ nhớ cache ghi đặc biệt hữu ích trong việc giảm lỗi ghi. Đối

với cache ghi lại, các vùng đệm cache được dùng để lưu trữ tạm các giá trị được ghi

cho đến khi dòng dữ liệu được trả về. Một vài thực thi cho phép ghi nhiều lần trên

cùng 1 dòng kết hợp, do đó, giảm tổng số lần ghi cho mức tiếp theo của mô hình bộ

nhớ phân cấp. Một ví dụ khác của bộ ghi đệm là bộ đệm ghi lại(write- back buffer)

dùng cho lưu trữ tạm thời những khối được thay thế trong bộ nhớ ghi lại.

Trong Pentium III, hiệu suất bộ xử lý được nâng cao thông qua bus cache 64 bit

chuyên dụng. Bộ xử lý cũng có sẵn EEC- chức năng mã hiệu chỉnh trên bus cache mức

2, đặc biệt cho các ứng dụng yêu cầu bắt buộc độ tin cậy hoặc mật độ dữ liệu.

3.3 Advanced Transfer Cache 256KB mức L2

ATC bao gồm những cải tiến để cung cấp một giao diện băng thông dữ liệu lớn

hơn giữa cache L2 và nhân bộ xử lý mà hoàn toàn có khả năng mở rộng tần số nhân xử

lý. Các tính năng của ATC bao gồm:

Non-Blocking, tốc độ đầy đủ, bộ cache on-die mức 2. Liên kết 8 đường Bus dữ liệu 256 bit với bộ cache mức 2. Giao diện giảm độ trễ đối với cache dữ liệu (so sánh với lưu trữ rời rạc)

11

Page 12: Tiểu Luận Pentium III FINAL

3.4 Advanced System Buffering

Advanced System Buffering bao gồm sự tối ưu hóa kích thước vùng đệm bus hệ

thống và bảng ghi hàng đợi bus, dẫn đến việc tăng việc sử dụng băng thông có sẵn

trong bus hệ thống 100 và 133MHz.

4 writeback buffers 6 fill buffers 8 cổng hàng đợi bus.

3.5 Bus độc lập kép- Dual Independent Bus (DIB)

Bộ xử lý Intel Pentium III hỗ trợ kiến trúc hiệu năng cao Dual Independent Bus

(DIB). Kiến trúc DIB đặt mức 2 bộ nhớ đệm đã trình bày như trên, bus đệm tốc độ cao

cho phép bus hệ thống được giải phóng từ cache. Kiến trúc này cung cấp băng thông

hệ thống tổng thể cao hơn đáng kể và cho phép cải thiện đáng kể hiệu năng và khả

năng mở rộng hệ thống.

3.6 Bus hệ thống 133MHz

Bus hệ thống chạy ở tốc độ 100 MHz hoặc 133 MHz cho phép tăng 33% băng

thông có sẵn cho bộ xử lý (bus hệ thống trên 100MHz). Bus hệ thống hỗ trợ đa giao

dịch quá hạn để tăng tính có sẵn của băng thông. Nó cũng cung cấp “glueless” hỗ trợ

hai bộ xử lý (chỉ có gói S.E.C.C.2 ). Điều này làm cho chi phí thấp, đa xử lý đối xứng

hai chiều, tăng cường hiệu suất đáng kể cho các hệ điều hành đa nhiệm và các ứng

dụng đa luồng.

Các tính năng quan trọng khác của bộ xử lý Intel Pentium III:

- Đơn vị đường ống dấu chấm động để hỗ trợ các định dạng 32 bit và 64 bit

quy định tại tiêu chuẩn IEEE 754 cũng như định dạng 80 bit.

- Các tín hiệu chẵn lẻ của bus hệ thống địa chỉ/ yêu cầu- đáp ứng với cơ chế thử

lại để đảm bảo tin cậy và toàn vẹn dữ liệu.

3.7 P6 Dynamic Execution Microarchitecture

Dự đoán đa nhánh: dự báo thực hiện chương trình thông qua nhiều nhánh, tăng

tốc luồng công việc cho bộ xử lý.

Phân tích luồng dữ liệu: tạo ra một lịch trình các câu lệnh được tối ưu hóa và sắp

xếp lại bằng cách phân tích các phụ thuộc dữ liệu giữa các lệnh.

12

Page 13: Tiểu Luận Pentium III FINAL

Thực hiện suy đoán: thực hiện các lệnh một cách phỏng đoán và dựa trên lịch

trình đã được tối ưu, đảm bảo rằng các đợn vị thực thi superscalar, của bộ xử lý luôn

duy trì thực hiện, đẩy mạnh hiệu suất chung.

3.8 Internet Streaming SIMD Extensions

Internet Streaming SIMD Extensions bao gồm 70 lệnh đơn, đa dữ liệu dấu chấm

động, số nguyên SIMD và các lệnh điều khiển khả năng cache. Một vài lợi ích đối với

máy tính để bàn và các ứng dụng Internet của ISSE:

Có thể xem và thao tác với các hình ảnh có độ phân giải và chất lượng cao

hơn trước đây.

Âm thanh chất lượng cao, video MPEG 2, mã hóa và giải mã đồng thời

MPEG2.

Sử dụng CPU cho nhận dạng giọng nói cũng như độ chính xác cao hơn và

thời gian đáp ứng nhanh hơn.

70 lệnh mới:

Các tính năng SSE trong Katmai chia thành hai loại: các chỉ lệnh SIMD và các

tính năng phân luồng bộ nhớ (memory-streaming feature). Mục đích của các chỉ lệnh

SIMD là để tăng tốc độ xử lý dữ liệu dạng vector – loại phổ biến nhất trong các ứng

dụng đa phương tiện. Các chỉ lệnh SIMD cung cấp cho các phần mềm phương thức để

biểu diễn tính song song vốn có trong loại dữ liệu này, do đó phần cứng có thể dễ dàng

xử lý nó song song.

SSE bao gồm các lệnh số nguyên và các lệnh dấu chấm động SIMD. Các lệnh số

nguyên thực ra chỉ là phần mở rộng của tập lệnh MMX. Tuy nhiên Intel đề cập đến

chúng như là "những chỉ lệnh truyền thông mới" (new-media instructions) Cái tên

khiến khách hàng dễ hiểu hơn và tránh những ý kiến cho rằng MMX còn thiếu sót,

chẳng hạn như việc thiếu khả năng nén video.

Các lệnh truyền thông, liệt kê trong bảng dưới đây, sẽ đẩy nhanh các tác vụ đa

phương tiện quan trọng mà MMX đáp ứng kém. Ví dụ, các lệnh PMAX và PMIN, các

lệnh quan trọng đối với thuật toán tìm kiếm Viterbi được sử dụng trong nhận dạng

giọng nói, không có trong MMX. Các lệnh trung bình (PAVG) được bổ sung để tăng

tốc độ giải mã video, và các lệnh Sum of Absolute Differences (PSADBW) đã được

thêm vào để tăng tốc độ tìm kiếm chuyển động trong mã hóa video.

Để tiết kiệm silicon, Intel sử dụng một thủ thuật thông minh để thực thi

PSADBW. Lệnh được đưa ra thành ba µop: µop đầu tiên tính toán hiệu số (A i–Bi) và

13

Page 14: Tiểu Luận Pentium III FINAL

carry-outs (Ci) của mỗi yếu tố byte trong hai toán hạng nguồn, µop thứ hai tính giá trị

tuyệt đối (|Ai–Bi|) của các kết quả trung gian và µop thứ ba tính tổng tám giá trị tuyệt

đối (Σi = 0... 7 |Ai–Bi|). Thủ thuật là sử dụng cây Wallace trong phép nhân SIMD để thực

thi tổng cuối cùng. Với phương pháp này, PSADBW chỉ thêm 2% vào miền đơn vị số

nguyên SIMD.

Hình 5: Kiến trúc SSE

Kiến trúc SSE bao gồm các lệnh mới về dấu chấm động SIMD, các lệnh số

nguyên SIMD và các lệnh luồng bộ nhớ. Các lệnh dấu chấm động SIMD tính toán trên

một vector bốn phần tử gồm các giá trị chính xác đơn IEEE-754 trong một file đăng ký

14

Page 15: Tiểu Luận Pentium III FINAL

tám mục 128 -bit. Các lệnh SIMD -FP cũng có một dạng vô hướng mà chỉ tính toán

trên thành phần phải nhất của các vectơ. Intel gọi là các lệnh số nguyên SIMD là các

lệnh truyền thông mới. Các phép nhân SIMD -FP được gửi đến cổng 0, cho phép

chúng được lưu hành song song với các phép cộng SIMD -FP, được gửi đến cổng 1.

Hầu hết các lệnh truyền thông mới có thể được gửi đến một trong hai cổng 0 hoặc 1

(ký hiệu là 0,1). *PSADBW yêu cầu ba μops, hai μop đầu tiên có thể thực thi trên

cổng 0 hoặc 1, trong khi μop thứ ba yêu cầu port 0. Các lệnh tải (load instructions) sử

dụng cổng 2, trong khi các lệnh lưu trữ (store instructions) yêu cầu cả hai cổng 3 và 4

(ký hiệu là 3/4). Độ trễ lệnh được thể hiện trong chu kỳ và thông lượng trong chu kỳ

theo mỗi lệnh. Trong dạng vô hướng, độ trễ lệnh dấu chấm động ngắn hơn là thể hiện

3.9 Các tùy chọn gói xử lý- Processor Package Options

Các bộ xử lý Intel Pentium III hiện nay đã có sẵn với nhiều tùy chọn gói khác

nhau: Single Edge Contact Cartridge 2 (S.E.C.C.2), Flip-Chip Pin Grid Array (FC-

PGA) và Flip-Chip Pin Grid Array 2 (FC-PGA2). Các gói FC-PGA và FC-PGA2 được

thiết kế cho những PC kiểu dáng đẹp, mạnh mẽ, nhỏ gọn.

15

Page 16: Tiểu Luận Pentium III FINAL

KẾT LUẬN

Bộ xử lý Intel Pentium III tích hợp kiến trúc vi xử lý linh hoạt P6, kiến trúc bus

độc lập kép DIB (Dual Independent Bus) gồm bus hệ thống đa dịch chuyển và công

nghệ cải tiến truyền thông Intel MMX. Thêm vào đó, Intel Pentium III cung cấp SSE

(Streaming SIMD Extensions), chứa 70 lệnh tăng hiệu suất hoạt động của bộ vi xử lý

trong các chức năng xử lý hình ảnh, âm thanh, video 3D, và nhận dạng giọng nói phục

vụ các trải nghiệm Internet nâng cao. Các phiên bản cũng bao gồm các công nghệ

Advanced Transfer Cache và Advanced System Buffering để đáp ứng các yêu cầu về

băng thông dữ liệu lớn hơn của môi trường hiện nay. Với hiệu năng tuyệt vời dành cho

Internet, các nhà kết nối và các môi trường đa nhiệm, Intel Pentium III nhắm tới phạm

vi chính là người tiêu dùng và doanh nghiệp. Bộ xử lý cũng đáp ứng được yêu cầu của

các máy trạm và máy chủ mức sơ cấp.

Pentium III giúp tăng hiệu suất hoạt động của bộ xử lý trong các tác vụ xử lý

hình ảnh, audio, video và nhận dạng giọng nói (bằng cách bổ sung thêm các tập lệnh

mới), và bộ vi xử lý này bao gồm các tên mã Katmai, Coppermine và Tualatin. Trong

đó:

Katmai sử dụng công nghệ 0,25 µm, 9,5 triệu transistor, bộ nhớ đệm L1 32KB,

L2 512KB, đế cắm Slot 1 SECC2 (Single Edge Contact cartridge 2), tốc độ 450, 500,

550, 533 và 600 MHz (bus 100 MHz), 533, 600 MHz (bus 133 MHz).

Coppermine sử dụng công nghệ 0,18 µm, 28,1 triệu transistor, bộ nhớ đệm L2

256 KB được tích hợp bên trong nhằm tăng tốc độ xử lý. Đế cắm Slot 1 SECC2 hoặc

socket 370 FC-PGA (Flip-chip pin grid array), có các tốc độ như 500, 550, 600, 650,

700, 750, 800, 850 MHz (bus 100MHz), 533, 600, 667, 733, 800, 866, 933, 1000,

1100 và 1133 MHz (bus 133MHz).

Tualatin áp dụng công nghệ 0,13 µm có 28,1 triệu transistor, bộ nhớ đệm L1

32KB, L2 256 KB hoặc 512 KB tích hợp bên trong BXL, socket 370 FC-PGA (Flip-

chip pin grid array), bus hệ thống 133 MHz. Có các tốc độ như 1133, 1200, 1266,

1333, 1400 MHz.

Celeron Coppermine (năm 2000) được “rút gọn” từ kiến trúc BXL Pentium III

Coppermine, còn gọi là Celeron II, được bổ sung 70 lệnh SSE. Sử dụng công nghệ

0,18 µm có 28,1 triệu transistor, bộ nhớ đệm L1 32KB, L2 256 KB tích hợp bên trong

BXL, socket 370 FC-PGA, Có các tốc độ như 533, 566, 600, 633, 667, 700, 733, 766,

800 MHz (bus 66 MHz), 850, 900, 950, 1000, 1100, 1200, 1300 MHz (bus 100 MHz).

16

Page 17: Tiểu Luận Pentium III FINAL

Tualatin Celeron (Celeron S) (năm 2000) được “rút gọn” từ kiến trúc BXL

Pentium III Tualatin, áp dụng công nghệ 0,13 µm, bộ nhớ đệm L1 32KB, L2 256 KB

tích hợp, socket 370 FC-PGA, bus hệ thống 100 MHz, gồm các tốc độ 1.0, 1.1, 1.2, 1.3

và 1.4 GHz.

Pentium

Processor

Pentium Pro

Processor

Pentium II

Processor

Pentium III

Processor

Pentium 4

Processor

Introduced 03/23/93 11/01/95 05/07/97 02/26/99 11/20/00

Operations

Per Clock

Cycle

2 3 3 5 6

Max Clock

Speed

60MHz

system bus:

150MHz

66MHz

system bus:

200MHz

60MHz

system bus:

180MHz

66MHz

system bus:

200MHz

66MHz

system bus:

333MHz

100MHz

system bus:

450MHz

100MHz

system bus:

1.0GHz

133MHz

system bus:

1.4GHz

400MHz

system bus:

2.40GHz

533MHz

system bus:

2.53GHz

Bus

Frequency 60MHz,

66MHz

60MHz,

66MHz

66MHz,

100MHz

100MHz,

133MHz

400MHz

(100 * 4),

533MHz

(133 * 4)

Number of

Transistors3,100,000

(0.8 micron)

5,500,000

(0.35

micron)

7,500,000

(0.35 micron)

24,000,000

(0.13 micron)

42,000,000

(0.13 micron)

L1 Cache16KB 16KB 32KB 32KB

12k µop +

8KB Data

L2 Cache-

1MB

(on chip)

512KB

(off chip)

512KB

(on chip)

512KB

(on chip)

Addressable

Memory4GB 64GB 64GB 64GB 64GB

Integer

Pipelines2 2 2 2 4

Floating

Point

1 1 1 1 2

17

Page 18: Tiểu Luận Pentium III FINAL

Pipelines

Brief

Description

Superscalar

architecture

brought 5X

the

performance

of the

33MHz

Intel486 DX

processor

Intel’s first

true server /

workstation

chip

Dual

independent

bus, dynamic

execution,

Intel MMX

technology

Data Prefetch

Logic, Level

2 Advanced

Transfer

Cache

Capable of

delivering

4.2GB of

data-per-

second into

and out of

the processor

18

Page 19: Tiểu Luận Pentium III FINAL

TÀI LIỆU THAM KHẢO

[1] Hồ Khánh Lâm, Giáo trình kỹ thuật vi xử lý, Học viện Công nghệ Bưu chính Viễn

thông, NXB Bưu điện 2007, Tập 1

[2] Intel Corporation (2002). “Intel Pentium III Processor Product Overview” URL:

http://www.intel.com/design/PentiumIII/prodbref/index.htm

[3] “ Intel Pentium III processor families” URL:

http://www.cpu-world.com/CPUs/Pentium-III/

[4] Tim Barto, “Intel-Pentium-Series”, CS 585: Computer Architecture, Summer 2002.

[5] D. Kroft, “Lockup-free instruction fetch/prefetch cache organization”, page 81-

87, EEE Computer Society Press Los Alamitos, CA, USA ©1981.

[6] Tien Fu Chen & Jean Loup Baer, “Reducing Memory Latency via Non-blocking

and Prefetching Caches”, page 51-61 ACM, New york, USA, 1992.

19