Titan V vs 1080 Ti - Cuộc chiến đối đầu của GPU máy tính để bàn tốt nhất trên CNN. Titan V có đáng không? 110 TFLOPS! không có trí tuệ, phải không?

NVIDIA NVIDIA Titan V là GPU GPU máy tính để bàn mới nhất của thang máy được xây dựng dựa trên kiến ​​trúc Volta tự hào với 110 TFLOPS học sâu sâu trong bảng thông số kỹ thuật. Đó là một con số đáng kinh ngạc. So sánh với 1080 Ti, vị vua hiện tại của GPU máy tính để bàn, đưa ra 11 TFLOPS bình thường, với 11GB bộ nhớ GDDR5 với mức giá rất hợp lý là $ 699.

Trong khi lời hứa của Titan V nghe có vẻ rất thú vị, thì mức giá $ 2999 hơi khó nuốt. Nhưng với 10 TFLOPS, bạn có nên mua Titan V không? Có phải giống như nhận được 10 1080 Ti? Hay bạn nên mua 4 1080 Ti, với cùng một số tiền?

Bên cạnh đó, Trạm DGX hiện đang được bán với giá $ 49900 (thường có giá $ 69900). Nó đi kèm với 4 Tesla V100 cấp máy chủ được tưới nước, có thông số tốt hơn một chút so với Titan V cấp máy tính để bàn (mặc dù tòa tháp trông BOSS và tôi đoán nó có hỗ trợ và SLA.) Nhưng hầu hết chúng ta (heck, Tôi cá là rất nhiều phòng thí nghiệm nghiên cứu AI và đại học) không có loại tiền đó để ném. Ngay cả khi bạn đã làm, không chắc chắn nếu nó có ý nghĩa kinh tế nhiều. BTW, nếu bạn đang vận hành một trung tâm dữ liệu, NVIDIA gần đây đã cập nhật EULA của họ để cấm các GPU GeForce và Titan loại máy tính để bàn của máy tính để bàn được sử dụng trong các trung tâm dữ liệu.

Vì vậy, câu hỏi là, Titan V có đáng không nếu bạn đang muốn xây dựng giàn GPU của riêng mình?

Hãy để tôi bắt đầu bằng cách nói rằng Titan V và người anh lớn Tesla V100 của nó là khá mới. V100 ra mắt vào tháng 5 năm 2017 và Titan V vừa ra mắt trong tháng này (tháng 12 năm 2017.) Hầu hết các khung học sâu đã gấp rút bổ sung hỗ trợ của Volta để đảm bảo rằng tất cả hiệu suất tiềm năng có thể được khai thác.

Ví dụ, PyTorch chỉ mới xuất hiện gần đây với phiên bản 0.3.0 bổ sung hỗ trợ cho GPU CUDA 9 và Volta. Tôi đã chơi xung quanh với thiết lập này và cộng đồng PyTorch thật tuyệt vời (đặc biệt là Soumith Chintala - cảm ơn anh bạn!) Khi giúp tôi ra ngoài. Bây giờ tôi có thể chạy PyTorch trên Titan V, tôi đã viết một số mã điểm chuẩn để chứng minh sự khác biệt về hiệu suất. Cho đến nay, kết quả chỉ bao gồm các kết quả của PyTorch 0.3.0 nhưng tôi cũng đang lên kế hoạch thêm kết quả cho các khung khác (EDIT: hiện tại kết quả điểm chuẩn cũng chứa các số từ TensorFlow 1.4.0 và Caffe2 0.8.1 - xem liên kết để biết thêm chi tiết), tất cả trên CUDA 9.0.176 và CuDNN 7.0.0.5, thậm chí ngoài sân chơi.

So sánh hiệu suất của Titan V vs 1080 Ti

Vì vậy, hãy để LỊCH kiểm tra kết quả trên.
Titan V và 1080 Ti được so sánh trực tiếp với cùng các cài đặt (ngoài ra, các thẻ này đều nằm trên các khe PCIE 16x trên cùng một máy tính.)

Các số thời gian được hiển thị ở trên là dành cho chuyển tiếp qua CNN (Thời gian di chuyển trực tiếp) và vượt qua và chuyển tiếp (tốc độ tàu lửa), được đo bằng mili giây. Đó là những con số trung bình được tính trên 20 lượt sau khi chạy khởi động. Tôi đã chạy nó nhiều lần và những con số này khá ổn định.

Những điểm thú vị cần lưu ý:

  • Rõ ràng, Titan V nhanh hơn 1080 Ti. Tuy nhiên, nếu bạn chỉ đơn giản so sánh các lần chạy 32 bit (độ chính xác của đơn lẻ), Titan V chỉ nhanh hơn ~ 20% so với 1080 Ti.
  • Các lần chạy Titan Viên 16-bit (độ chính xác nửa góc) có tốc độ nhanh hơn so với các đối tác 32-bit. 1080 Ti được hưởng lợi từ việc đi chính xác một nửa, nhưng hiệu suất đạt được khá khiêm tốn so với Titan V.

Những con số này không thực sự hét lên OH OH TITAN TỐT CỦA TÔI V LÀ KHÔNG CÓ NGƯỜI YÊU CẦU.

NVIDIA có nói dối về TFLOPS 10 lần không? Tôi chắc chắn rằng những người tiếp thị của họ là những người trung thực tốt, nhưng có nhiều yếu tố chơi ở đây. Một, tôi chắc chắn rằng vẫn còn chỗ để cải tiến từ phía phần mềm để trích xuất từng bit của lõi Tenor siêu nhanh của Volta. Nhưng ngay cả khi đó, nếu hầu hết các đường dẫn mã không tuân thủ các điều kiện cho phép thực hiện tối đa về mặt lý thuyết (xem A FUL RULES trong chương trình Tenor lập trình trong CUDA 9 của NVIDIA), thì bạn chỉ có thể làm được rất nhiều. Thời gian sẽ cho biết chúng ta sẽ thấy được bao nhiêu cải tiến ở cấp độ khung / CUDA / CuDNN để khai thác các khả năng của GPU Volta nhiều nhất có thể, nhưng những con số ban đầu mà tôi đã quan sát được trên CNN phổ biến (tôi làm công cụ thị giác máy tính chủ yếu là do tôi tập trung trên CNN) dường như không biện minh cho việc nhận Titan V, đặc biệt là nếu bạn muốn có ngay bây giờ khi phần mềm chơi bắt kịp.

Mặc dù thật thú vị khi chơi xung quanh với công nghệ mới nhất và là người tiếp nhận sớm, nếu bạn tập trung vào nghiên cứu AI hoặc xây dựng sản phẩm trên giàn GPU cá nhân của mình một cách kinh tế, tôi sẽ khuyên bạn nên mua 1080 Ti ngay khi viết bài này (cho đến khi NVIDIA ra mắt với một sự thay thế thậm chí còn tốt hơn trong tương lai gần, họ có xu hướng làm chúng ta ngạc nhiên với các bản phát hành mới.) Cũng xem xét rằng một Titan V duy nhất chỉ có 12GB bộ nhớ trong khi 1080 Ti có bộ nhớ nhỏ hơn một chút ở mức 11GB. Nhưng nếu bạn mua 4 trong số chúng với cùng một số tiền (ít nhất là trên GPU, bạn cũng cần nguồn cung cấp năng lượng mạnh hơn, bo mạch chủ có thể hỗ trợ 4 GPU, nhiều RAM hơn và làm mát tốt hơn), bạn sẽ kết thúc với nhiều GPU hơn bộ nhớ (44GB so với 12GB.) Đã nói rằng tôi nghĩ rằng một điều thiết thực hơn để làm, nếu bạn muốn có nhiều hơn một GPU, là nhận được 2x 1080 Ti. Bằng cách này, các GPU không phải được xếp chồng lên nhau (luồng khí khác để làm mát - khi các thẻ tiết lưu nhiệt này, bạn có thể mất hiệu suất đáng kể, bạn có thể làm mát bằng nước nhưng điều đó làm tăng đáng kể chi phí, công sức và một số rủi ro.) Cũng chỉ với hai thẻ, mức tiêu thụ năng lượng là 250Wx2 từ GPU để bạn có thể thoát khỏi việc có nguồn cung cấp năng lượng rẻ hơn. Ở mức độ nào, tôi thấy cực kỳ có giá trị khi có nhiều GPU và phân chia các thử nghiệm trên chúng để tôi có thể lặp lại nhanh chóng, vì vậy đây là điều tôi muốn giới thiệu như một sự thỏa hiệp tốt.
Một tùy chọn khác để giải quyết vấn đề nhiệt của GPU xếp chồng, làm mát bằng không khí, nếu bạn phải có 3 con4, không muốn làm mát và không quan tâm đến thẩm mỹ hoặc tiếng ồn, là lấy một số bộ mở rộng PCIE / riser và làm những gì Kaggler chiến thắng này đã làm:

Một cỗ máy 4x 1080 Ti của Vladimir Iglovikov, một trong những thành viên chiến thắng của Thử thách che giấu hình ảnh Carvana

Tôi hy vọng bạn tìm thấy bài viết này hữu ích. Vui lòng cho tôi biết nếu có bất kỳ kết quả cụ thể nào bạn muốn xem trên Titan V hoặc 1080 Ti. Cảm ơn bạn đã đọc!