Tổng quan
Sự ra mắt của kiến trúc Pascal NVIDIA, ngoài việc cải thiện hiệu năng cho game, thì các lĩnh vực chuyên nghiệp như kiến trúc, sản xuất, thiết kế có thể thấy được lợi ích to lớn từ việc tăng tốc bởi GPUs. Và không nằm ngoài dự kiến, Kiến trúc Pascal đã được trang bị trên dòng card đồ họa chuyên nghiệp NVIDIA Quadro.
So sánh thông số giữa Quadro P2000, Quadro P4000, Quadro P5000, Radeon Pro Duo
Chúng tôi sẽ có bảng so sánh thông số kỹ thuật giữa các dòng card Quadro và AMD về khả năng tính toán, tiêu thụ điện năng và giá bán tham khảo.
| Radeon Pro Duo | |||
Process | 16nm | 16nm | 16nm | 28nm |
Code Name | GP106 | GP104 | GP104 | Fiji XT x 2 |
Shaders | 1024 | 1792 | 2560 | 8192 |
Rated Clock Speed | 1470 MHz (Boost) | 1480 MHz (Boost) | 1730 MHz (Boost) | up to 1000 MHz |
Memory Width | 160-bit | 256-bit | 256-bit | 4096-bit (HBM) x 2 |
Compute Perf (FP32) | 3.0 TFLOPS | 5.3 TFLOPS | 8.9 TFLOPS | 16.38 TFLOPS |
Compute Perf (FP64) | 1/32 FP32 | 1/32 FP32 | 1/32 FP 32 | 1/16 FP32 |
Frame Buffer | 5GB | 8GB | 16GB | 8GB (4GB x 2) |
TDP | 75W | 105W | 180W | 350W |
Street Price | $599 | $900 | $2000 | $800 |
Những độc giả tinh tế sẽ nhận thấy những điểm tương đồng với dòng sản phẩm NVIDIA GeForce khi họ xem xét các thông số kỹ thuật này.
Dựa trên GPU GP106, Quadro P2000 gần tương đối so với GTX 1060. So sánh số nhân (Shaders) P2000 với GTX 1060 3GB, chúng ta thấy rằng nó ít hơn 128 đơn vị và tốc độ đồng hồ thấp hơn một chút, nhưng có nhiều bộ nhớ hơn. Tương tự, Quadro P4000 có thể được so sánh với GTX 1070 ít hơn 128 đơn vị và tốc độ đồng hồ thấp hơn.
Tuy nhiên, Quadro P5000 có tốc độ đồng bộ và tốc độ đồng hồ giống hệt như GTX 1080 nhưng với dung lượng bộ nhớ gấp đôi, điển hình của card đồ họa chuyên nghiệp thường làm việc với bộ dữ liệu lớn hơn.
Nhìn vào cách bố trí vật lý của các card Quadro, chúng ta thấy chúng khác nhau rõ rệt.
Quadro P5000 trong một hình dáng quen thuộc. Có lẽ bạn sẽ nhận ra sự tương đồng giữa thiết kế của Quadro P5000 và GTX 1080. Vì chúng có cùng GPU, điều này không có gì đáng ngạc nhiên. Tuy nhiên, đầu ra video được tinh chỉnh từ người tiêu dùng GPU. Tại đây bạn sẽ thấy 4 đầu nối DisplayPort và một đầu nối DVI Dual-Link.
Hiệu suất tính toán tổng quát – SPECviewperf12
SPECviewperf 12 là một ứng dụng đo điểm chuẩn tập trung quanh hiệu năng đồ hoạ máy trạm. Cả hai tính năng OpenGL và DirectX được đo bằng khối lượng công việc khác nhau hoặc “khung cảnh”. Điều quan trọng cần lưu ý là AMD Radeon Pro Duo dường như đang chạy trong chế độ GPU đơn cho những thử nghiệm này. SPECviewperf không cung cấp bất kỳ kiểm soát nào để nhắm mục tiêu GPU bổ sung.
CATIA Viewset (Catia-04)
Catia-04 viewset được tạo ra từ mô phỏng của khối lượng công việc đồ họa tạo ra bởi ứng dụng CATIA V6 R2012 từ Dassault Systemes. Kích thước mô hình dao động từ 5,1 đến 21 triệu đỉnh.
Chế độ xem này bao gồm nhiều chế độ hiển thị được hỗ trợ bởi ứng dụng, bao gồm: wireframe, anti-aliasing, shaded, shaded with edges, depth of field, và ambient occlusion.
Với khung nhìn CATA của SPECviewperf 12, chúng ta thấy có sự phân chia rõ ràng giữa các sản phẩm khác nhau trong dòng sản phẩm Quadro. Radeon Pro Duo chạy trong chế độ Single GPU đấu tranh để cạnh tranh với Quadro P2000 cấp thấp.
Energy Viewset (Energy -01)
Energy-01 viewset là đại diện của một ứng dụng rendering khối lượng điển hình trong lĩnh vực địa chấn và mỏ dầu. Tương tự như hình ảnh y khoa như MRI hoặc CT, các cuộc khảo sát địa vật lý tạo ra các lát hình ảnh thông qua bề mặt ngầm được xây dựng trong lưới 3D. Khối lượng hiển thị cung cấp một phép chiếu 2D của lưới điện thể tích 3D để phân tích và giải thích thêm.
Ở mỗi khung hình, tùy thuộc vào vị trí của người xem, một loạt các phiến đồng phẳng tương ứng với góc nhìn được tính trên CPU và sau đó được gửi tới phần cứng đồ họa để tính toán và tính toán thêm như tra cứu chức năng chuyển đổi, ánh sáng và cắt để tiết lộ các cấu trúc bên trong . Cuối cùng, các lát được trộn với nhau trước khi hình ảnh được hiển thị.
Trong khối lượng công việc năng lượng chúng ta thấy một câu chuyện tương tự. Hiệu suất giữa các lựa chọn Quadro quy mô như bạn mong đợi, trong khi Radeon Pro Duo đến nơi cuối cùng mặc dù có Fiji XT GPU mạnh mẽ.
Medical Viewset (Medical-01)
The medical-01 là đại diện của một ứng dụng hiển thị khối lượng điển hình cho phép chiếu 2D của lưới điện thể tích 3D. Một lưới 3D điển hình trong khung nhìn này là một nhóm các lát cắt 3D thu được bởi máy quét (như CT hoặc MRI).
Ở mỗi khung hình, tùy thuộc vào vị trí của người xem, một loạt các bản sao coplanar thẳng hàng với góc nhìn được tính trên CPU và sau đó được gửi đến phần cứng đồ họa để tính toán và tính toán thêm, chẳng hạn như tra cứu chức năng chuyển đổi, ánh sáng và cắt để hiển thị nội bộ cấu trúc. Cuối cùng, các lát được trộn với nhau trước khi hình ảnh được hiển thị.
Đối với ứng dụng dựng hình của Medical viewset, hiệu năng lại được cân bằng với Quadro GPUs trong khi card AMD kết thúc cuối cùng.
Showcase Viewset (showcase-01)
Showcase-01 đã được tạo ra từ mô phỏng của ứng dụng Autodesk’s Showcase 2013. Mô hình được sử dụng trong khung nhìn bao gồm 8 triệu đỉnh.
Chế độ xem là khung nhìn đầu tiên trong SPECviewperf để tính năng vẽ DX. Các chế độ hiển thị được bao gồm trong khung nhìn bao gồm shading, projected shadows, and self-shadows.
Bằng cách sử dụng DirectX chuẩn để dựng hình, chúng ta thấy rằng khung nhìn Showcase là bài kiểm tra đầu tiên cho đến nay phá vỡ tính ưu việt của Quadro. Radeon Pro Duo trong chế độ GPU đơn và rất cạnh tranh với P4000 trong bài kiểm tra này.
Siemens NX (snx-02)
Snx-02 viewet đã được tạo ra từ mô phỏng của khối lượng công việc đồ họa được tạo ra bởi các ứng dụng NX 8.0 từ Siemens PLM. Kích thước mô hình dao động từ 7,15 đến 8,45 triệu đỉnh.
Trong thử nghiệm với khung nhìn Siemens NX, Radeon Pro Duo đạt được điểm số rất thấp so với đối thủ Quadro. Điều này có thể cho thấy một số vấn đề với khối lượng công việc này và GPU của AMD trái ngược với các mức thực hiện tương đối thực tế của Radeon Pro Duo.
Maya viewset (maya-04)
Maya viewset (maya-04) được tạo ra từ mô phỏng khối lượng công việc đồ họa được tạo bởi ứng dụng Maya 2013 từ Autodesk. Kích thước mô hình là 727.500 đỉnh.
Chế độ xem bao gồm nhiều chế độ hiển thị được ứng dụng hỗ trợ, bao gồm: shaded mode, ambient occlusion, multi-sample anti aliasing, and transparency.
Trong Maya viewset, chúng ta thấy rằng Quadro P4000 và P5000 đạt được kết quả tương tự mặc dù khoảng cách hiệu suất gần 4 TFLOPs. Thử nghiệm này sử dụng Maya 2013, vì vậy nó có thể không được tối ưu hóa cho GPU công suất cao ngày nay.
3DS Max Viewset (3dsmax-05)
Hình ảnh 3dsmax-05 được tạo ra từ mô phỏng của khối lượng công việc đồ họa được tạo ra bởi 3ds Max 2016 bằng trình điều khiển Nitrous DX11 mặc định.
Các mô hình của khung nhìn này đến từ tiêu chuẩn SPECapc for 3ds Max 2015 và các nguồn khác. Để sử dụng tốt nhất các trường hợp sử dụng trong thế giới thực, một số thử nghiệm kết hợp nhiều chế độ xem trên màn hình, mỗi màn đều sử dụng một phương pháp hiển thị khác. Các kiểu hiển thị trong khung nhìn phản ánh những hình ảnh được sử dụng phổ biến nhất ở các thị trường lớn, bao gồm thực tế, bóng mờ và khung dây. Một số chế độ rendering ít được sử dụng nhưng thú vị như các mặt, graphite và đất sét cũng được kết hợp. Các hình ảnh động trong khung nhìn là sự kết hợp của mô hình spin và camera fly-through, tùy thuộc vào mô hình.
Trong 3ds Max sử dụng trình render Nitrous DX11, Radeon Pro Duo trong chế độ GPU đơn lẻ chỉ đạt được một nửa số điểm mà chúng ta nhìn thấy từ Quadro P5000 bất chấp những điểm tương đồng trong tính toán GPU thô của hai sản phẩm này.
Solidworks viewset (sw-03)
Các sw-03 viewset được tạo ra từ mô phỏng của ứng dụng SolidWorks 2013 SP1 của Dassault Systemes. Các mô hình được sử dụng trong phạm vi khung cảnh có kích thước từ 2,1 đến 21 triệu đỉnh.
Chế độ xem bao gồm nhiều chế độ hiển thị được hỗ trợ bởi ứng dụng, bao gồm chế độ bóng mờ, được tô bóng với các cạnh, che khuất xung quanh, trình chiếu bóng và bản đồ môi trường.
Một lần nữa, Radeon Pro Duo hoàn toàn cách xa so với Quadro P2000 cấp thấp trong thành phần Solidworks của SPECviewperf 12.
Hiệu suất Rendering – OpenCL và CUDA
LuxMark 3.1
Hiệu suất tính toán GPGPU là một phần lớn trong thiết kế GPU hiện đại, đặc biệt là trong môi trường máy trạm. LuxMark là một chuẩn OpenCL lâu đời, dựa trên công cụ LuxRender và cung cấp một cái nhìn tốt về các kiến trúc GPU khác nhau như thế nào so với khối lượng công việc OpenCL điển hình. Hôm nay chúng tôi đang kiểm tra lĩnh vực của chúng tôi về card đồ họa trong các cảnh tính toán chuyên sâu nhất, khách sạn.
Nhìn vào cảnh Khách sạn của LuxMark, chúng tôi sẽ có kết quả cạnh tranh hơn mong đợi. Trong khi GPU của AMD theo truyền thống có lợi thế hơn các tùy chọn của NVIDIA trong OpenCL, ở đây chúng ta thấy một biểu đồ dựa trên hiệu suất tính toán GPU được đánh giá cao. Khoảng 8,5 TFLOPS của một GPU Fiji XT của AMD là ngang ngửa với P5000 có 8,5 TLOPS.
OpenCL có khả năng cân bằng với nhiều thiết bị tính toán, có nghĩa là một điểm số rất ấn tượng cho Radeon Pro Duo khi cả hai GPU đang được sử dụng.
Blender 2.78b
Blender là một dự án mã nguồn mở phổ biến cho mô hình hóa và hoạt hình 3D. Blender hỗ trợ cả hai đường ống OpenCL và CUDA, cho phép so sánh thú vị giữa các nhà cung cấp GPU.
Điều quan trọng cần lưu ý là chúng tôi đã thử nghiệm Blender với cài đặt mặc định. Điều này có nghĩa là kích thước gạch không nhất thiết phải được tối ưu hóa cho GPU cụ thể mà chúng tôi đang thử nghiệm. Hiệu suất bổ sung nên có thể bằng cách thử nghiệm với kích thước gạch cho mỗi GPU cụ thể.
Nhìn vào kết quả, dường như đường nhân CUDA mang lại lợi thế trên đường dẫn mã OpenCL. Sử dụng OpenCL, Radeon Pro Duo chỉ cung cấp một cải tiến khiêm tốn với 16,38 TFLOPS hiệu suất tính toán trong GPU kép so với một Quadro P5000.
3DS Max (NVIDIA Iray +)
3DS Max là một mô hình 3D, hoạt hình và hiển thị hình ảnh chuyên nghiệp. Do tính phổ biến của nó, có rất nhiều công cụ hiển thị có sẵn để sử dụng trong 3ds Max. Trong bài kiểm tra này, chúng tôi đang xem xét công cụ Iray + đã được NVIDIA phát triển. Ứng dụng dựng hình này sử dụng CUDA, và không thể chạy trên AMD Radeon Pro Duo (nó có thể chạy độc quyền trên CPU trên các máy tính có GPU của AMD).
Chúng tôi muốn thử nghiệm Iray để có được một ý tưởng về hiệu suất tương đối giữa các tùy chọn Quadro đang tìm kiếm nó trong một ứng dụng thế giới thực. Như bạn thấy, ngay cả Quadro P2000 dưới 400 USD cung cấp một cải tiến hiệu năng lớn hơn việc dò tìm tia X trên CPU Intel Core i7-5960X 8 nhân.
Trong khi Quadro P4000 làm cho cảnh nhanh hơn 59% so với P2000, hiệu suất tăng lên đến P5000 chỉ là 15%. Mặc dù những kết quả này sẽ khác nhau tùy thuộc vào khối lượng công việc, nhưng nó cho thấy lợi nhuận giảm dần có thể khi bạn tăng công suất GPU.
Giá cả và Kết luận
Giá thị trường hiện tại cho các card đồ họa chúng tôi so sánh trong kết quả đánh giá này khá rộng:
Quadro P2000 – 459 USD cho CDW
Quadro P4000 – 876 USD Amazon
Quadro P5000 – 2.000 USD trên Amazon
Radeon Pro Duo – 800 USD trên Amazon
Đối với độc giả sử dụng cho thị trường đồ họa người tiêu dùng, những mức giá này có vẻ rất cao. Một điều quan trọng cần nhớ là, trong khi họ có thể chia sẻ cùng một phần cứng vật lý, phía phần mềm cho card đồ họa chuyên nghiệp là khác nhau.
Đối với các ứng dụng chuyên nghiệp, sự ổn định và tính tương thích là chìa khóa. Công việc bổ sung được đưa vào trình điều khiển cho card đồ họa chuyên nghiệp để đảm bảo rằng họ sẽ thực hiện mỗi ngày ra cho người dùng đang kiếm sống từ các ứng dụng mà họ đang giúp đẩy nhanh. Và đối với những người tiêu dùng này, việc tăng giá là đáng giá.
Như bạn đã thấy từ kết quả benchmark của chúng tôi, trong thị trường đồ hoạ chuyên nghiệp, sự lựa chọn card đồ họa giảm xuống những ứng dụng bạn đang sử dụng.
Những điều quan trọng cần xem xét là những gì API thực hiện các ứng dụng mà bạn sử dụng thường xuyên nhất (OpenCL, CUDA, OpenGL, …), khả năng của các ứng dụng này tận dụng nhiều thiết bị tính toán, cũng như các yêu cầu hệ thống mục tiêu (như tiêu thụ năng lượng và hình dạng vật lý).
Rõ ràng là nếu bạn đang sử dụng các ứng dụng tập trung hoàn toàn vào OpenCL, AMD cung cấp các lựa chọn hấp dẫn trên thị trường card đồ hoạ máy trạm. Mặc dù giá khởi điểm 1500 USD cho Radeon Pro Duo rất khó nuốt về mức hiệu năng mà nó cung cấp, nhưng giá hiện tại 800 đô la rất hấp dẫn đối với người dùng đang tìm kiếm khả năng hiển thị OpenCL rất cao, miễn là ứng dụng của bạn sẽ hỗ trợ Nhiều mục tiêu thiết bị OpenCL.
Đối với các ứng dụng sử dụng CUDA ngoài hoặc thay vì OpenCL, GPU Quadro của NVIDIA không làm bạn thất vọng. Trong Blender, nơi chúng tôi có thể kiểm tra OpenCL và CUDA, rõ ràng rằng CUDA cung cấp một lợi thế về hiệu năng khi kết hợp với một trong những Pascal Quadro chúng tôi đã thử nghiệm. Trong khi Quadro P5000 có thể không phải là người chiến thắng tuyệt đối, nó đã rất gần với Radeon Pro Duo trong khi chỉ chạy trên một GPU vật lý.
Chúng tôi rất vui mừng khi thấy các sản phẩm FirePro cuối cùng của AMD có tính năng Vega GPU cao cấp, nhưng bây giờ, NVIDIA cung cấp card đồ họa máy trạm hiệu suất cao nhất với các sản phẩm Quadro mới nhất của họ. Kiến trúc Pascal cung cấp một nền tảng mà NVIDIA có thể xây dựng các card đồ họa hiệu quả hơn cho người dùng chuyên nghiệp, những người có ý thức về kích cỡ, sức mạnh và nhiệt độ cao hơn ở bàn làm việc. Người dùng đang đẩy các giới hạn của rendering và tính toán sẽ làm tốt với một trong những card đồ họa này.
Tổng hợp: pcper.com