Vừa rồi, NVIDIA đã công bố chip A100 “Ampere” có đến 54 tỷ bóng bán dẫn và tất cả được nhét vào duy nhất một die tiến trình 7nm (không bao gồm số lượng bóng bán dẫn của bộ nhớ HBM2E). NVIDIA cho biết nó sẽ có hiệu năng cao hơn gấp 20 lần trong tác vụ suy luận (inference) AI và FP32 so với Tesla V100 (kiến trúc Volta). Ngoài ra thì hiệu năng FP64 cũng cao hơn 2,5 lần so với GPU Volta. Đồng thời, NVIDIA cũng tạo ra định dạng số mới cho việc tính toán AI, gọi là TF32 (tensor float 32), và hiệu năng TF32 của chip A100 Ampere cũng cao hơn 20 lần so với Volta.
Ngoài ra thì NVIDIA còn trang bị cho A100 tính năng “multi-instance GPU”, cho phép người dùng thiết lập 1 GPU thành nhiều GPU ảo, và phân bố nó cho từng ứng dụng khác nhau; từ đó đảm bảo các phần mềm chỉ “ăn” đúng phần GPU ảo được chỉ định, không làm ảnh hưởng đến các phần mềm khác. Hệ thống DGX-A100 sẽ có hiệu năng tính toán lên đến 5 petaflops trong một node duy nhất, và sẽ có giá từ 199.000USD.
Nguồn: TechPowerUp