OCI Supercluster dẫn đầu trong số các nhà cung cấp dịch vụ đám mây với khả năng hỗ trợ tới 16.384 GPU AMD Instinct MI300X trong một cấu trúc mạng siêu nhanh duy nhất

AMD thông báo rằng Oracle Cloud Infrastructure (OCI) đã chọn bộ tăng tốc AMD Instinct™ MI300X với phần mềm mở ROCm™ để cung cấp sức mạnh cho phiên bản OCI Compute Supercluster mới nhất của mình có tên là BM.GPU.MI300X.8. Đối với các mô hình AI có thể bao gồm hàng trăm tỷ tham số, OCI Supercluster với AMD MI300X hỗ trợ tới 16.384 GPU trong một cụm duy nhất bằng cách khai thác cùng một công nghệ mạng lưới siêu nhanh được các bộ tăng tốc khác sử dụng trên OCI. Được thiết kế để chạy các khối lượng công việc AI đòi hỏi khắt khe bao gồm suy luận và đào tạo mô hình ngôn ngữ lớn (LLM) đòi hỏi thông lượng cao với dung lượng bộ nhớ và băng thông hàng đầu, các phiên bản OCI bare metal này đã được các công ty bao gồm cả Fireworks AI áp dụng.

AMD Instinct MI300X

Mang lại hiệu suất đáng tin cậy và lựa chọn mở cho đào tạo và suy luận AI

AMD Instinct MI300X đã trải qua quá trình thử nghiệm mở rộng được OCI xác thực, qua đó nhấn mạnh khả năng suy luận và đào tạo AI để phục vụ các trường hợp sử dụng tối ưu về độ trễ, ngay cả với kích thước lô lớn hơn và khả năng phù hợp với các mô hình LLM lớn nhất trong một nút duy nhất. Những kết quả về hiệu suất của Instinct MI300X này đã thu hút sự chú ý của các nhà phát triển mô hình AI.

Fireworks AI cung cấp một nền tảng nhanh được thiết kế để xây dựng và triển khai AI tạo sinh. Với hơn 100 mô hình, Fireworks AI đang tận dụng lợi ích của hiệu suất được tìm thấy trong OCI bằng cách sử dụng AMD Instinct MI300X.

Mời các bạn tham khảo thêm một số thông tin liên quan tại GVN 360 như:


Mời các bạn theo dõi fanpage của chúng mình theo đường link dưới đây để cập nhật những tin tức về game, công nghệ và nhiều thông tin thú vị khác nữa nhé!

GVN 360