Trong vòng vài tháng gần đây thì Raja Koduri – kiến trúc sư trưởng kiêm phó chủ tịch cấp cao mảng đồ họa rời của Intel – đã dần dần vén bức màn bí mật của kiến trúc đồ họa Xe và các dòng sản phẩm ứng dụng nó. Kiến trúc này sẽ trải dài từ các giải pháp đồ họa tích hợp tiết kiệm điện và đồ họa thuộc phân khúc bình dân, cho đến các giải pháp đa chip (multi-chip) với thiết kế chồng die (die stacking) dành cho các trung tâm dữ liệu. Và trong khuôn khổ bài viết này sẽ tập trung vào cái thứ nhì.
Kiến trúc đồ họa Intel Xe-HP sẽ có 3 phiên bản. Phiên bản gốc (base model) đã từng được hé lộ vài lần và nó sẽ có 1 tile với 512 Execution Unit cùng 2 khối HMB2e. Intel vẫn chưa xác nhận thông số chính thức nhưng họ có cho biết hiệu năng của các phiên bản 1-tile, 2-tile, và 4-tile trong các tác vụ tính toán.
Khi tỷ lệ hiệu năng khi tăng lên 2-tile, 4-tile có vẻ quá lý tưởng, nhưng cũng cần lưu ý rằng đây không phải là tác vụ đồ họa theo thời gian thực. Những công nghệ chạy đa card màn hình như SLI của NVIDIA hay CrossFire của AMD thường cũng chỉ tăng hiệu năng từ 50-80% là hết cỡ. Còn trong trường hợp xử lý các tác vụ tính toán như trên thì hiệu năng thường tăng theo tỷ lệ lý tưởng hơn nhiều.
Phòng trường hợp có người không tin là GPU 4-tile có tồn tại, chỉ là chiêu trò marketing, thì Raja cũng đã cầm trên tay một con chip rất to và đưa ra trước ống kính trong buổi sự kiện Hot Chips vừa mới diễn ra. Nói không chừng đây là con chip lớn nhất trong những con chip mà anh em từng được nhìn thấy luôn ấy chứ. Còn chuyện phiên bản Xe-HP 4-tile này có được đưa vào sản xuất hay không thì là một câu chuyện khác nhé.
Xe-HP chỉ sử dụng EMIB để mở rộng cấu hình nhiều tile. Xe-HPC (Ponte Vecchio) thì sẽ có thêm tile Rambo Cache, công nghệ chồng die Foveros, và Co-EMIB cùng với một số cải tiến. Ponte Vecchio dự kiến sẽ được trang bị cho siêu máy tính Aurora và nó sẽ được sản xuất dựa trên dây chuyền 7nm của Intel. Trong lúc đó, Intel sẽ có Xe-HP 1-tile, 2-tile, và 4-tile; và vì sử dụng liên kết EMIB nên 2 phiên bản 2-tile và 4-tile sẽ có kích thước bự gấp đôi và gấp 4 lần (theo thứ tự) so với bản 1-tile. Do đó, những con GPU này sẽ cần đến 3 socket khác nhau.
Phiên bản Xe-HP 4-tile có hiệu năng tính toán FP32 vào khoảng 42 TFLOPS. Tuy nhiên, đây vẫn chưa phải là hiệu năng tối đa mà nó có thể đạt được. Raja cho biết nó có thể đạt mức petaflops (hoặc hơn 1000 TFLOPS) nhờ có các nhân tensor. Cũng như kiến trúc NVIDIA A100 và Google TPUv4, Xe-HP hỗ trợ nhân tensor. Tuy nhiên, chúng ta vẫn chưa thể biết chính xác cấu hình của nó là như thế nào.
Nguồn: tom’s HARDWARE