Đánh giá máy chủ tháp Dell PowerEdge T560
Máy chủ dạng tháp Dell PowerEdge T560 được xây dựng chuyên biệt cho hạ tầng IT tại chỗ, ảo hóa, quản trị cơ sở dữ liệu, suy luận AI, đám mây riêng và hơn thế nữa. Nó được vận hành bởi bộ vi xử lý Intel Xeon Scalable thế hệ thứ tư và hỗ trợ tối đa 24 ổ lưu trữ.

Thông số kỹ thuật Máy chủ Tháp Dell PowerEdge T560
Máy chủ dạng rack không phải lúc nào cũng phù hợp cho mọi doanh nghiệp, đặc biệt nếu bạn không có trung tâm dữ liệu. Điều này càng đúng tại các điểm biên (edge), nơi khái niệm về một phòng máy chủ truyền thống là không tồn tại. Đó là lý do máy chủ tháp PowerEdge T560 ra đời, với thiết kế thân thiện với văn phòng (độ ồn thấp). Thân máy lớn hơn cũng cho phép một số cấu hình độc đáo vốn không thể thực hiện trên các máy chủ gắn rack, chẳng hạn như kết hợp các khay ổ đĩa 2.5″ với 3.5″ trên bảng mạch kết nối phía trước.
T560 hỗ trợ hai bộ xử lý Intel Xeon Scalable thế hệ thứ tư lên đến 32 lõi (“Sapphire Rapids”), bộ nhớ 1TB (16 khe RDIMM) và nhiều sự kết hợp ổ đĩa có thể có. Theo nghĩa đó, đây không phải là một tòa tháp nhỏ, nó tương đương với kích thước 4.5U trong tủ rack và hỗ trợ tám quạt làm mát.
Chiếc tháp này cũng có khả năng mở rộng cực lớn với sáu khe cắm PCIe, hai trong số đó là x16 Gen5. Nó có thể lắp vừa hai GPU 300 watt độ rộng kép hoặc sáu GPU 75 watt đơn khe cắm.
Thông số kỹ thuật đầy đủ của PowerEdge T560 như sau:
| Processor | Up to two 4th generation Intel Xeon Scalable processors, up to 32 cores per socket |
| Memory |
|
| Storage Controllers |
|
| Drive Bays | Front Bays:
|
| Power Supplies |
|
| Fans | Up to eight Standard (STD) fans or High performance (HPR) fans |
| Dimensions | Height — 464.0 mm (18.26 inches) (with feet)
Width — 200.0 mm (7.87 inches)
|
| Form Factor | 4.5U tower server |
| Embedded Management |
|
| OpenManage Software |
|
| Mobility | OpenManage Mobile |
| OpenManage Integrations |
|
| Security |
|
| Embedded NIC | 2 x 1GbE LOM on Planar |
| Network Options | 1 x OCP x8 card 3.0
Note: The system allows both LOM on planar and OCP card to be installed on the system |
| GPU Options | Up to 2 x 300 W DW or 6 x 75 W SW |
| Ports | Front:
Rear:
Internal:
|
| PCIe | Up to six PCIe slots:
|
| Operating System and Hypervisors |
|
Cấu trúc và Thiết kế Máy chủ Tháp Dell PowerEdge T560
Máy chủ tháp hiếm khi có kích thước nhỏ và PowerEdge T560 chắc chắn cũng không ngoại lệ, với kích thước 18,3 x 7,9 x 26,7 inch (Cao x Rộng x Sâu). Chiếc tháp kích cỡ 4.5U này gây ấn tượng từ mọi góc nhìn, bắt đầu từ mặt trước với các khay ổ cắm nóng (hot-swap). Phiên bản của chúng tôi có tám khay 2.5 inch và tám khay 3.5 inch, cùng với hai ổ BOSS dự phòng hỗ trợ RAID chuẩn M.2 ở phía bên phải.
Các cổng kết nối phía trước bao gồm một cổng USB 2.0, một cổng USB 3.0 và một cổng iDRAC Direct (Micro-AB USB).

Bên phải của các khay ổ đĩa 3.5 inch là các ổ khởi động NVMe M.2.

Ở mặt sau, chiếc tháp này có một cổng USB 2.0, một cổng USB 3.0, một cổng nối tiếp tùy chọn, một cổng 1GbE dành cho iDRAC, một cổng VGA, hai cổng Ethernet và khe cắm OCP. Một cổng USB 3.0 khác là tùy chọn.

Cửa hông của tháp được tháo ra để truy cập vào bên trong; bố cục trông rất giống một máy chủ tiêu chuẩn được đặt nằm nghiêng. Hầu hết không gian bên trong được che phủ bởi một tấm dẫn luồng không khí khổng lồ.

Tám quạt cắm nóng được bố trí dọc theo đường trung tâm; bóp các lẫy màu cam cho phép tháo chúng ra dễ dàng.

Mỗi bộ xử lý Xeon đều có một bộ tản nhiệt dạng tháp khổng lồ và được bao quanh bởi tám khe cắm DIMM. T560 hỗ trợ tổng dung lượng RAM lên đến 1TB.

Đây là các góc nhìn phía sau các khay ổ đĩa, bao gồm card NVMe RAID, có một card thứ hai trong cấu hình này dành cho các ổ HDD.


Chúng tôi có một cấu hình đặc biệt với năm GPU NVIDIA L4, biến nó trở thành một nền tảng suy luận lý tưởng.

Nằm kẹp giữa các GPU là một tấm chắn luồng không khí nhỏ khác dành cho card mạng OCP NIC.

Bộ đôi nguồn điện cắm nóng nằm ở phía trên cùng.

Hiệu suất máy chủ tháp Dell PowerEdge T560
Thiết bị đánh giá của chúng tôi có cấu hình như sau:
- 2x Intel Xeon Gold 6448Y (mỗi bộ xử lý có 32 lõi/64 luồng, TDP 225-watt, xung nhịp 2.1-4.1GHz)
- 8x SSD Solidigm P5520 1.6TB kèm card RAID PERC 12
- 5x GPU NVIDIA L4
- 8x RDIMM 64GB
Để kiểm tra lưu trữ, chúng tôi đã tận dụng các ổ SSD kết nối với card RAID PERC 12 ở cấu hình JBOD và RAID 6. Điều này khác với việc sử dụng NVMe gốc, nơi mỗi ổ SSD sẽ có kết nối x4 riêng tới bo mạch chủ.
Phân tích Khối lượng công việc VDBench
Khi thực hiện đo điểm chuẩn (benchmarking) các thiết bị lưu trữ, kiểm thử ứng dụng là tốt nhất, và kiểm thử tổng hợp đứng ở vị trí thứ hai. Mặc dù không đại diện hoàn hảo cho các khối lượng công việc thực tế, các bài kiểm tra tổng hợp giúp thiết lập mức cơ sở cho các thiết bị lưu trữ với hệ số lặp lại, giúp dễ dàng so sánh trực tiếp giữa các giải pháp cạnh tranh. Các khối lượng công việc này cung cấp một loạt các hồ sơ kiểm thử, từ các bài kiểm tra “bốn góc” (four corners) và các bài kiểm tra kích thước truyền tải cơ sở dữ liệu phổ biến, cho đến việc chụp lại dấu vết (trace captures) từ các môi trường VDI khác nhau.
Tất cả các bài kiểm tra này đều tận dụng trình tạo khối lượng công việc VDBench phổ biến, cùng một công cụ kịch bản để tự động hóa và thu thập kết quả trên một cụm kiểm thử tính toán lớn. Điều này cho phép chúng tôi lặp lại cùng một khối lượng công việc trên nhiều loại thiết bị lưu trữ, bao gồm cả mảng flash và các thiết bị lưu trữ riêng lẻ. Quy trình kiểm thử của chúng tôi cho các điểm chuẩn này là lấp đầy toàn bộ bề mặt ổ đĩa bằng dữ liệu, sau đó phân vùng một phần ổ đĩa tương đương với 25% dung lượng để mô phỏng cách ổ đĩa phản hồi với các khối lượng công việc của ứng dụng. Điều này khác với các bài kiểm tra entropy toàn phần (full entropy), vốn sử dụng 100% ổ đĩa và đưa chúng vào trạng thái ổn định (steady state). Do đó, các số liệu này sẽ phản ánh tốc độ ghi duy trì cao hơn.
Hồ sơ (Profiles):
- Đọc ngẫu nhiên 4K: 100% Đọc, 128 luồng, 0-120% tỷ lệ iorate
- Ghi ngẫu nhiên 4K: 100% Ghi, 128 luồng, 0-120% tỷ lệ iorate
- Đọc tuần tự 64K: 100% Đọc, 32 luồng, 0-120% tỷ lệ iorate
- Ghi tuần tự 64K: 100% Ghi, 16 luồng, 0-120% tỷ lệ iorate
- Đọc ngẫu nhiên 64K: 100% Đọc, 32 luồng, 0-120% tỷ lệ iorate
- Ghi ngẫu nhiên 64K: 100% Ghi, 16 luồng, 0-120% tỷ lệ iorate
- Cơ sở dữ liệu tổng hợp: SQL và Oracle
- Dấu vết VDI Full Clone và Linked Clone
Bắt đầu với bài đọc ngẫu nhiên 4K, chúng tôi thấy T560 đạt 1,79 triệu IOPS ở cấu hình RAID6 và 4,86 triệu IOPS ở cấu hình JBOD. Độ trễ được kiểm soát tốt ngoại trừ giai đoạn cuối của kết quả JBOD, nơi chúng tôi thấy một mức tăng đột biến nhỏ.

Ghi ngẫu nhiên 4K cho thấy một mức tăng đột biến mạnh đối với mảng RAID6; nó không vượt quá 415.000 IOPS. Ngược lại, cấu hình JBOD đạt tới 3,9 triệu IOPS trước khi xuất hiện sự mất ổn định nhỏ. Tuy nhiên, một lần nữa, chúng ta thấy độ trễ tương đối ổn định cho đến khi xảy ra các mức tăng đột biến.

Tiếp theo là bài đọc tuần tự 64k; mảng RAID6 của T560 đạt tốc độ 8,2GB/s trong khi cấu hình JBOD đạt gần 23GB/s. Các đường biểu đồ không cho thấy sự mất ổn định nào.

Chúng tôi đã thấy một mức tăng đột biến mạnh khác đối với mảng RAID6 của T560 trong bài kiểm tra ghi tuần tự 64k, nơi nó bị giới hạn ở mức khoảng 4GB/s. Cấu hình JBOD đã đạt tới mức khoảng 16,5GB/s, với một số hiện tượng mất ổn định sau khi vượt quá ngưỡng 14GB/s.

Bài kiểm tra hỗn hợp 70/30 8K của chúng tôi cho thấy các đường biểu diễn tương đối mượt mà; mảng RAID6 đạt khoảng 670.000 IOPS và mảng JBOD đạt 1,93 triệu IOPS. Độ trễ trong cả hai trường hợp đều được duy trì ở mức kiểm soát tốt.

Các bài kiểm tra tiếp theo là về khối lượng công việc SQL của chúng tôi. Chúng tôi tiếp tục nhận thấy độ trễ ổn định và ở đây không xuất hiện các mức tăng đột biến nào. Mảng RAID6 đạt đỉnh ngay sau ngưỡng 4 triệu IOPS, trong khi cấu hình JBOD đã vượt mức 14 triệu IOPS.

Chúng tôi cũng đã thực hiện bài kiểm tra khối lượng công việc Oracle SQL với kết quả tương tự: mảng RAID6 lần này đã vượt xa ngưỡng 4 triệu IOPS, còn cấu hình JBOD thì nhích nhẹ lên trên mức 14 triệu IOPS.

Điểm chuẩn Hiệu suất trên Windows Server 2022
Để so sánh, chúng tôi đã chọn mẫu máy chủ R760 được kiểm thử trước đó. Dưới đây là phần so sánh giữa các bộ xử lý (CPU). Cả hai đều có cùng số lõi, mặc dù CPU Xeon 6448Y bên trong T560 có lợi thế về tốc độ xung nhịp tổng thể so với Xeon 6430 bên trong R760.
| Dell PowerEdge T560 – Intel Xeon 6448Y | Dell PowerEdge R760 – Intel Xeon 6430 | |
| Total Cores | 32 | 32 |
| Total Threads | 64 | 64 |
| Max Turbo Frequency | 4.10 GHz | 3.40 GHz |
| Processor Base Frequency | 2.10 GHz | 2.10 GHz |
Cinebench R23 và R24
Cinebench R23 của Maxon là một bài kiểm tra hiệu năng dựng hình của CPU, tận dụng tất cả các lõi và luồng của CPU. Chúng tôi đã thực hiện cả bài kiểm tra đa nhân và đơn nhân. Điểm số càng cao càng tốt.
Với phiên bản 24 vừa được phát hành gần đây, nó đã giới thiệu một hệ thống tính điểm mới và khả năng chạy trên nhiều GPU.
| Test | Dell PowerEdge T560 (2x Xeon Gold 6448Y) |
| Cinebench R23 Multi | 73,622 |
| Cinebench R23 Single | 1186 |
| Cinebench R24 GPU | 97,984 |
| Cinebench R24 CPU Multi | 3,976 |
| Cinebench R24 CPU Single | 3,976 |
Blender CLI
Điểm chuẩn Blender đo lường hiệu suất dựng hình 3D của CPU hoặc GPU bằng cách dựng một cảnh 3D trong phần mềm Blender. Nó cung cấp một số điểm có thể được sử dụng để so sánh hiệu suất của các hệ thống và thành phần khác nhau. Các con số được tính bằng mẫu trên phút (samples per minute).
| Test | Dell PowerEdge T560 (2x Xeon Gold 6448Y, 5x NVIDIA L4) | Dell PowerEdge R760 (2x Xeon Gold 6430, 1x NVIDIA A2) |
| CPU Blender CLI – Monster | 582.085675 | 576.928413 |
| CPU Blender CLI – Junkshop | 383.546707 | 376.557690 |
| CPU Blender CLI – Classroom | 275.857847 | 281.536442 |
| GPU Blender CLI – Monster | 2,547.287378 | 479.238127 |
| GPU Blender CLI – Junkshop | 1,348.087892 | 302.355378 |
| GPU Blender CLI – Classroom | 1,229.122455 | 248.540754 |
Geekbench 6
Geekbench là một bài kiểm tra hiệu năng đa nền tảng. Chúng tôi sử dụng bài kiểm tra CPU, bao gồm nhiều khối lượng công việc để mô phỏng các tác vụ và ứng dụng trong thế giới thực.
| Test | Dell PowerEdge T560 (2x Xeon Gold 6448Y) | Dell PowerEdge R760 (2x Xeon Gold 6430) |
| Geekbench 6 CPU Multi Score | 18,572 | 12,971 |
| Geekbench 6 CPU Single Score | 1,734 | 12,971 |
| Geekbench 6 GPU dGPU Score – OpenCL | 157,380 | Untested |
y-cruncher
y-cruncher là một chương trình đa luồng và có khả năng mở rộng, có thể tính toán số Pi và các hằng số toán học khác tới hàng nghìn tỷ chữ số. Kể từ khi ra mắt vào năm 2009, nó đã trở thành một ứng dụng đo điểm chuẩn và kiểm tra áp lực (stress-test) phổ biến đối với những người đam mê ép xung và phần cứng. Tại đây, một lần nữa chúng ta thấy rằng các chip Xeon Gold của PowerEdge R760 có lợi thế nhẹ về hiệu suất.
| Test | Dell PowerEdge T560 (2x Xeon Gold 6448Y) | Dell PowerEdge R760 (2x Xeon Gold 6430) |
| y-cruncher 1b Compute Time | 7.332 | 7.306 |
| y-cruncher 2.5b Compute Time | 20.102 | |
| y-cruncher 10b Compute Time | 97.32 | 91.435 |
GPUPI
GPUPI 3.3.3 là một phiên bản của công cụ đo điểm chuẩn nhẹ được thiết kế để tính toán số (pi) tới hàng tỷ chữ số thập phân bằng cách sử dụng tăng tốc phần cứng thông qua GPU và CPU. Nó tận dụng sức mạnh tính toán của OpenCL và CUDA, bao gồm cả đơn vị xử lý trung tâm và đơn vị xử lý đồ họa. Chúng tôi đã chạy CUDA trên 5 card đồ họa L4.
| Application | Dell PowerEdge T560 (2x Xeon Gold 6448Y) with 5X NVIDIA L4 |
| GPUPI v3.3 – 1B | 0sec 850ms |
| GPUPI v3.3 – 32B | 50sec 361ms |
UL Procyon AI Inference (CPU)
Bộ công cụ đo điểm chuẩn Procyon AI Inference của UL kiểm tra hiệu suất của các công cụ suy luận AI khác nhau khi sử dụng các mạng thần kinh tiên tiến nhất. Chúng tôi chỉ chạy các bài kiểm tra này trên CPU. Các con số bên dưới là thời gian suy luận trung bình; điểm tổng thể nằm ở hàng cuối cùng.
| Test | Dell PowerEdge T560 (2x Xeon Gold 6448Y) | Dell PowerEdge R760 (2x Xeon Gold 6430) |
| MobileNet V3 | 2.60 | 3.05 |
| ResNet 50 | 6.12 | 6.79 |
| Inception V4 | 19.59 | 20.55 |
| DeepLab V3 | 23.68 | 31.27 |
| YOLO V3 | 29.63 | 32.58 |
| REAL-ESRGAN | 1468.64 | 1498.36 |
| Overall Score | 191 | 169 |
GROMACS CUDA trên Máy chủ Tháp Dell T560
Để khai thác tối đa tiềm năng của máy chủ tháp Dell T560 được trang bị 5 GPU NVIDIA L4, chúng tôi đã biên dịch GROMACS — một phần mềm động lực học phân tử — từ mã nguồn dành riêng cho CUDA. Việc biên dịch tùy chỉnh này nhằm tận dụng khả năng xử lý song song của 5 GPU NVIDIA L4, điều thiết yếu để tăng tốc các mô phỏng tính toán.
Quy trình này bao gồm việc sử dụng nvcc, trình biên dịch CUDA của NVIDIA, cùng với nhiều lần thử nghiệm các cờ tối ưu hóa (optimization flags) phù hợp để đảm bảo rằng các tệp nhị phân được tinh chỉnh chính xác cho kiến trúc của máy chủ. Việc tích hợp hỗ trợ CUDA trong bản biên dịch GROMACS cho phép phần mềm giao tiếp trực tiếp với phần cứng GPU, giúp cải thiện đáng kể thời gian tính toán cho các mô phỏng phức tạp.
Bài kiểm tra: Tương tác Protein tùy chỉnh trong Gromacs
Tận dụng tệp đầu vào do cộng đồng cung cấp từ nhóm Discord đa dạng của chúng tôi, tệp này chứa các tham số và cấu trúc được tinh chỉnh cho một nghiên cứu tương tác protein cụ thể, chúng tôi đã bắt đầu một mô phỏng động lực học phân tử. Kết quả đạt được rất đáng kinh ngạc — hệ thống đã đạt tốc độ mô phỏng là 170,268 nan giây mỗi ngày.
| GPU | System | ns/day | core time (s) |
| NVIDIA A4000 | Whitebox AMD Ryzen 5950x | 84.415 | 163,763 |
| RTX NVIDIA 4070 | Whitebox AMD Ryzen 7950x3d | 131.85 | 209,692.3 |
| 5x NVIDIA L4 | Dell T560 w/ 2x Intel Xeon Gold 6448Y | 170.268 | 608,912.7 |
Ý nghĩa của tốc độ mô phỏng
Tốc độ thực hiện các mô phỏng phân tử đóng vai trò then chốt trong nhiều ngành công nghiệp khác nhau. Ví dụ, trong ngành dược phẩm, khả năng mô phỏng nhanh có thể đẩy nhanh đáng kể quá trình tìm kiếm thuốc mới bằng cách cho phép các nhà nghiên cứu lặp lại nhanh chóng các thiết kế và tương tác phân tử.
Trong khoa học vật liệu, nó có thể thúc đẩy việc phát triển các vật liệu mới với những đặc tính mong muốn. Tốc độ 170,268 ns/ngày đồng nghĩa với việc các mô phỏng vốn phải mất gần hai tuần trên các máy chủ đời cũ thì nay có thể hoàn thành chỉ trong một ngày trên Dell T560 được trang bị dòng card NVIDIA L4 khiêm tốn. Điều này không chỉ nâng cao năng suất mà còn mở ra những ranh giới mới trong việc phân tích dữ liệu và ra quyết định theo thời gian thực

Tác động đến nghiên cứu khoa học
Một cuộc trao đổi với một phòng thí nghiệm hiện đang chạy các mô phỏng tương tự trên phần cứng đã 10 năm tuổi đã mang lại một sự tương phản rõ rệt. Thiết lập hiện tại của họ mất 24 giờ để hoàn thành những gì Dell T560 có thể đạt được chỉ trong vài phút. Sự so sánh này không chỉ làm nổi bật những tiến bộ của các bộ vi xử lý hiện đại mà còn cho thấy giá trị mà phần cứng hiện nay có thể mang lại cho nghiên cứu khoa học.

Với máy chủ tháp Dell T560, các nhà nghiên cứu có thể thực hiện nhiều thử nghiệm hơn trong khung thời gian ngắn hơn, cải thiện chu trình lặp lại giữa giả thuyết và thử nghiệm vốn là trọng tâm của tiến bộ khoa học. Điều này có nghĩa là các thử nghiệm tính toán từng được coi là quá tốn kém tài nguyên để thăm dò thường xuyên thì nay đã trở nên khả thi.
Ứng dụng AI của hiệu suất tính toán
Hiệu suất tính toán được thể hiện bởi Dell T560 có những tác động sâu rộng trong lĩnh vực nghiên cứu. Nó không chỉ đơn thuần là về tốc độ mà còn về độ phức tạp và quy mô của các vấn đề hiện có thể giải quyết được. Các mô phỏng quy mô lớn mô hình hóa toàn bộ hệ sinh thái sinh học, các phản ứng hóa học phức tạp hoặc thậm chí là các mô hình sinh thái trở nên khả thi hơn với loại sức mạnh tính toán này.
Với sự ra đời của AI và học máy, thông lượng cao của các mô phỏng động lực học phân tử cho phép tạo ra các tập dữ liệu khổng lồ cần thiết để huấn luyện các mô hình tinh vi. Những mô hình này có thể dẫn đến những đột phá trong sinh học dự đoán, vật liệu mới và hóa học tính toán thế hệ tiếp theo.
Kết luận
Máy chủ tháp Dell PowerEdge T560 mang lại sự linh hoạt đáng kinh ngạc cho nhu cầu sử dụng máy chủ thông thường cũng như các tác vụ nâng cao hoặc chuyên dụng, bao gồm GPU, tính toán và khoa học dữ liệu. Nó tương đương, và ở một số khía cạnh còn vượt trội hơn các máy chủ dạng rack về khả năng mở rộng và sức mạnh, với hai bộ xử lý Intel Xeon Scalable “Sapphire Rapids”, 1TB RAM, nhiều cấu hình ổ lưu trữ và hỗ trợ đa GPU, nhưng thiết kế dạng tháp của nó lại không yêu cầu một trung tâm dữ liệu. Mặc dù rõ ràng là không hoàn toàn im lặng tùy thuộc vào khối lượng công việc, nhưng quạt của máy đủ yên tĩnh để có thể sử dụng trong môi trường văn phòng.

Quá trình thử nghiệm của chúng tôi đã chạm đến mọi khía cạnh khả năng của PowerEdge T560; nó cho thấy những con số vững chắc trong các bài kiểm tra lưu trữ và CPU, đồng thời phô diễn sức mạnh trong các bài kiểm tra GPU với cấu hình đặc biệt gồm năm GPU NVIDIA L4. Chúng tôi cũng đánh giá cao khả năng bảo trì đơn giản của dòng máy tháp này. Với khả năng mở rộng đáng khen ngợi và khả năng thích ứng ngay cả với những khối lượng công việc AI khắt khe nhất.
560 được xây dựng chuyên biệt cho hạ tầng IT tại chỗ, ảo hóa, quản trị cơ sở dữ liệu, suy luận AI, đám mây riêng và hơn thế nữa. Nó được vận hành bởi bộ vi xử lý Intel Xeon Scalable thế hệ thứ tư và hỗ trợ tối đa 24 ổ lưu trữ.

Thông số kỹ thuật Máy chủ Tháp Dell PowerEdge T560
Máy chủ dạng rack không phải lúc nào cũng phù hợp cho mọi doanh nghiệp, đặc biệt nếu bạn không có trung tâm dữ liệu. Điều này càng đúng tại các điểm biên (edge), nơi khái niệm về một phòng máy chủ truyền thống là không tồn tại. Đó là lý do máy chủ tháp PowerEdge T560 ra đời, với thiết kế thân thiện với văn phòng (độ ồn thấp). Thân máy lớn hơn cũng cho phép một số cấu hình độc đáo vốn không thể thực hiện trên các máy chủ gắn rack, chẳng hạn như kết hợp các khay ổ đĩa 2.5″ với 3.5″ trên bảng mạch kết nối phía trước.
T560 hỗ trợ hai bộ xử lý Intel Xeon Scalable thế hệ thứ tư lên đến 32 lõi (“Sapphire Rapids”), bộ nhớ 1TB (16 khe RDIMM) và nhiều sự kết hợp ổ đĩa có thể có. Theo nghĩa đó, đây không phải là một tòa tháp nhỏ, nó tương đương với kích thước 4.5U trong tủ rack và hỗ trợ tám quạt làm mát.
Chiếc tháp này cũng có khả năng mở rộng cực lớn với sáu khe cắm PCIe, hai trong số đó là x16 Gen5. Nó có thể lắp vừa hai GPU 300 watt độ rộng kép hoặc sáu GPU 75 watt đơn khe cắm.
Thông số kỹ thuật đầy đủ của PowerEdge T560 như sau:
| Processor | Up to two 4th generation Intel Xeon Scalable processors, up to 32 cores per socket |
| Memory |
|
| Storage Controllers |
|
| Drive Bays | Front Bays:
|
| Power Supplies |
|
| Fans | Up to eight Standard (STD) fans or High performance (HPR) fans |
| Dimensions | Height — 464.0 mm (18.26 inches) (with feet)
Width — 200.0 mm (7.87 inches)
|
| Form Factor | 4.5U tower server |
| Embedded Management |
|
| OpenManage Software |
|
| Mobility | OpenManage Mobile |
| OpenManage Integrations |
|
| Security |
|
| Embedded NIC | 2 x 1GbE LOM on Planar |
| Network Options | 1 x OCP x8 card 3.0
Note: The system allows both LOM on planar and OCP card to be installed on the system |
| GPU Options | Up to 2 x 300 W DW or 6 x 75 W SW |
| Ports | Front:
Rear:
Internal:
|
| PCIe | Up to six PCIe slots:
|
| Operating System and Hypervisors |
|
Cấu trúc và Thiết kế Máy chủ Tháp Dell PowerEdge T560
Máy chủ tháp hiếm khi có kích thước nhỏ và PowerEdge T560 chắc chắn cũng không ngoại lệ, với kích thước 18,3 x 7,9 x 26,7 inch (Cao x Rộng x Sâu). Chiếc tháp kích cỡ 4.5U này gây ấn tượng từ mọi góc nhìn, bắt đầu từ mặt trước với các khay ổ cắm nóng (hot-swap). Phiên bản của chúng tôi có tám khay 2.5 inch và tám khay 3.5 inch, cùng với hai ổ BOSS dự phòng hỗ trợ RAID chuẩn M.2 ở phía bên phải.
Các cổng kết nối phía trước bao gồm một cổng USB 2.0, một cổng USB 3.0 và một cổng iDRAC Direct (Micro-AB USB).

Bên phải của các khay ổ đĩa 3.5 inch là các ổ khởi động NVMe M.2.

Ở mặt sau, chiếc tháp này có một cổng USB 2.0, một cổng USB 3.0, một cổng nối tiếp tùy chọn, một cổng 1GbE dành cho iDRAC, một cổng VGA, hai cổng Ethernet và khe cắm OCP. Một cổng USB 3.0 khác là tùy chọn.

Cửa hông của tháp được tháo ra để truy cập vào bên trong; bố cục trông rất giống một máy chủ tiêu chuẩn được đặt nằm nghiêng. Hầu hết không gian bên trong được che phủ bởi một tấm dẫn luồng không khí khổng lồ.

Tám quạt cắm nóng được bố trí dọc theo đường trung tâm; bóp các lẫy màu cam cho phép tháo chúng ra dễ dàng.

Mỗi bộ xử lý Xeon đều có một bộ tản nhiệt dạng tháp khổng lồ và được bao quanh bởi tám khe cắm DIMM. T560 hỗ trợ tổng dung lượng RAM lên đến 1TB.

Đây là các góc nhìn phía sau các khay ổ đĩa, bao gồm card NVMe RAID, có một card thứ hai trong cấu hình này dành cho các ổ HDD.


Chúng tôi có một cấu hình đặc biệt với năm GPU NVIDIA L4, biến nó trở thành một nền tảng suy luận lý tưởng.

Nằm kẹp giữa các GPU là một tấm chắn luồng không khí nhỏ khác dành cho card mạng OCP NIC.

Bộ đôi nguồn điện cắm nóng nằm ở phía trên cùng.

Hiệu suất máy chủ tháp Dell PowerEdge T560
Thiết bị đánh giá của chúng tôi có cấu hình như sau:
- 2x Intel Xeon Gold 6448Y (mỗi bộ xử lý có 32 lõi/64 luồng, TDP 225-watt, xung nhịp 2.1-4.1GHz)
- 8x SSD Solidigm P5520 1.6TB kèm card RAID PERC 12
- 5x GPU NVIDIA L4
- 8x RDIMM 64GB
Để kiểm tra lưu trữ, chúng tôi đã tận dụng các ổ SSD kết nối với card RAID PERC 12 ở cấu hình JBOD và RAID 6. Điều này khác với việc sử dụng NVMe gốc, nơi mỗi ổ SSD sẽ có kết nối x4 riêng tới bo mạch chủ.
Phân tích Khối lượng công việc VDBench
Khi thực hiện đo điểm chuẩn (benchmarking) các thiết bị lưu trữ, kiểm thử ứng dụng là tốt nhất, và kiểm thử tổng hợp đứng ở vị trí thứ hai. Mặc dù không đại diện hoàn hảo cho các khối lượng công việc thực tế, các bài kiểm tra tổng hợp giúp thiết lập mức cơ sở cho các thiết bị lưu trữ với hệ số lặp lại, giúp dễ dàng so sánh trực tiếp giữa các giải pháp cạnh tranh. Các khối lượng công việc này cung cấp một loạt các hồ sơ kiểm thử, từ các bài kiểm tra “bốn góc” (four corners) và các bài kiểm tra kích thước truyền tải cơ sở dữ liệu phổ biến, cho đến việc chụp lại dấu vết (trace captures) từ các môi trường VDI khác nhau.
Tất cả các bài kiểm tra này đều tận dụng trình tạo khối lượng công việc VDBench phổ biến, cùng một công cụ kịch bản để tự động hóa và thu thập kết quả trên một cụm kiểm thử tính toán lớn. Điều này cho phép chúng tôi lặp lại cùng một khối lượng công việc trên nhiều loại thiết bị lưu trữ, bao gồm cả mảng flash và các thiết bị lưu trữ riêng lẻ. Quy trình kiểm thử của chúng tôi cho các điểm chuẩn này là lấp đầy toàn bộ bề mặt ổ đĩa bằng dữ liệu, sau đó phân vùng một phần ổ đĩa tương đương với 25% dung lượng để mô phỏng cách ổ đĩa phản hồi với các khối lượng công việc của ứng dụng. Điều này khác với các bài kiểm tra entropy toàn phần (full entropy), vốn sử dụng 100% ổ đĩa và đưa chúng vào trạng thái ổn định (steady state). Do đó, các số liệu này sẽ phản ánh tốc độ ghi duy trì cao hơn.
Hồ sơ (Profiles):
- Đọc ngẫu nhiên 4K: 100% Đọc, 128 luồng, 0-120% tỷ lệ iorate
- Ghi ngẫu nhiên 4K: 100% Ghi, 128 luồng, 0-120% tỷ lệ iorate
- Đọc tuần tự 64K: 100% Đọc, 32 luồng, 0-120% tỷ lệ iorate
- Ghi tuần tự 64K: 100% Ghi, 16 luồng, 0-120% tỷ lệ iorate
- Đọc ngẫu nhiên 64K: 100% Đọc, 32 luồng, 0-120% tỷ lệ iorate
- Ghi ngẫu nhiên 64K: 100% Ghi, 16 luồng, 0-120% tỷ lệ iorate
- Cơ sở dữ liệu tổng hợp: SQL và Oracle
- Dấu vết VDI Full Clone và Linked Clone
Bắt đầu với bài đọc ngẫu nhiên 4K, chúng tôi thấy T560 đạt 1,79 triệu IOPS ở cấu hình RAID6 và 4,86 triệu IOPS ở cấu hình JBOD. Độ trễ được kiểm soát tốt ngoại trừ giai đoạn cuối của kết quả JBOD, nơi chúng tôi thấy một mức tăng đột biến nhỏ.

Ghi ngẫu nhiên 4K cho thấy một mức tăng đột biến mạnh đối với mảng RAID6; nó không vượt quá 415.000 IOPS. Ngược lại, cấu hình JBOD đạt tới 3,9 triệu IOPS trước khi xuất hiện sự mất ổn định nhỏ. Tuy nhiên, một lần nữa, chúng ta thấy độ trễ tương đối ổn định cho đến khi xảy ra các mức tăng đột biến.

Tiếp theo là bài đọc tuần tự 64k; mảng RAID6 của T560 đạt tốc độ 8,2GB/s trong khi cấu hình JBOD đạt gần 23GB/s. Các đường biểu đồ không cho thấy sự mất ổn định nào.

Chúng tôi đã thấy một mức tăng đột biến mạnh khác đối với mảng RAID6 của T560 trong bài kiểm tra ghi tuần tự 64k, nơi nó bị giới hạn ở mức khoảng 4GB/s. Cấu hình JBOD đã đạt tới mức khoảng 16,5GB/s, với một số hiện tượng mất ổn định sau khi vượt quá ngưỡng 14GB/s.

Bài kiểm tra hỗn hợp 70/30 8K của chúng tôi cho thấy các đường biểu diễn tương đối mượt mà; mảng RAID6 đạt khoảng 670.000 IOPS và mảng JBOD đạt 1,93 triệu IOPS. Độ trễ trong cả hai trường hợp đều được duy trì ở mức kiểm soát tốt.

Các bài kiểm tra tiếp theo là về khối lượng công việc SQL của chúng tôi. Chúng tôi tiếp tục nhận thấy độ trễ ổn định và ở đây không xuất hiện các mức tăng đột biến nào. Mảng RAID6 đạt đỉnh ngay sau ngưỡng 4 triệu IOPS, trong khi cấu hình JBOD đã vượt mức 14 triệu IOPS.

Chúng tôi cũng đã thực hiện bài kiểm tra khối lượng công việc Oracle SQL với kết quả tương tự: mảng RAID6 lần này đã vượt xa ngưỡng 4 triệu IOPS, còn cấu hình JBOD thì nhích nhẹ lên trên mức 14 triệu IOPS.

Điểm chuẩn Hiệu suất trên Windows Server 2022
Để so sánh, chúng tôi đã chọn mẫu máy chủ R760 được kiểm thử trước đó. Dưới đây là phần so sánh giữa các bộ xử lý (CPU). Cả hai đều có cùng số lõi, mặc dù CPU Xeon 6448Y bên trong T560 có lợi thế về tốc độ xung nhịp tổng thể so với Xeon 6430 bên trong R760.
| Dell PowerEdge T560 – Intel Xeon 6448Y | Dell PowerEdge R760 – Intel Xeon 6430 | |
| Total Cores | 32 | 32 |
| Total Threads | 64 | 64 |
| Max Turbo Frequency | 4.10 GHz | 3.40 GHz |
| Processor Base Frequency | 2.10 GHz | 2.10 GHz |
Cinebench R23 và R24
Cinebench R23 của Maxon là một bài kiểm tra hiệu năng dựng hình của CPU, tận dụng tất cả các lõi và luồng của CPU. Chúng tôi đã thực hiện cả bài kiểm tra đa nhân và đơn nhân. Điểm số càng cao càng tốt.
Với phiên bản 24 vừa được phát hành gần đây, nó đã giới thiệu một hệ thống tính điểm mới và khả năng chạy trên nhiều GPU.
| Test | Dell PowerEdge T560 (2x Xeon Gold 6448Y) |
| Cinebench R23 Multi | 73,622 |
| Cinebench R23 Single | 1186 |
| Cinebench R24 GPU | 97,984 |
| Cinebench R24 CPU Multi | 3,976 |
| Cinebench R24 CPU Single | 3,976 |
Blender CLI
Điểm chuẩn Blender đo lường hiệu suất dựng hình 3D của CPU hoặc GPU bằng cách dựng một cảnh 3D trong phần mềm Blender. Nó cung cấp một số điểm có thể được sử dụng để so sánh hiệu suất của các hệ thống và thành phần khác nhau. Các con số được tính bằng mẫu trên phút (samples per minute).
| Test | Dell PowerEdge T560 (2x Xeon Gold 6448Y, 5x NVIDIA L4) | Dell PowerEdge R760 (2x Xeon Gold 6430, 1x NVIDIA A2) |
| CPU Blender CLI – Monster | 582.085675 | 576.928413 |
| CPU Blender CLI – Junkshop | 383.546707 | 376.557690 |
| CPU Blender CLI – Classroom | 275.857847 | 281.536442 |
| GPU Blender CLI – Monster | 2,547.287378 | 479.238127 |
| GPU Blender CLI – Junkshop | 1,348.087892 | 302.355378 |
| GPU Blender CLI – Classroom | 1,229.122455 | 248.540754 |
Geekbench 6
Geekbench là một bài kiểm tra hiệu năng đa nền tảng. Chúng tôi sử dụng bài kiểm tra CPU, bao gồm nhiều khối lượng công việc để mô phỏng các tác vụ và ứng dụng trong thế giới thực.
| Test | Dell PowerEdge T560 (2x Xeon Gold 6448Y) | Dell PowerEdge R760 (2x Xeon Gold 6430) |
| Geekbench 6 CPU Multi Score | 18,572 | 12,971 |
| Geekbench 6 CPU Single Score | 1,734 | 12,971 |
| Geekbench 6 GPU dGPU Score – OpenCL | 157,380 | Untested |
y-cruncher
y-cruncher là một chương trình đa luồng và có khả năng mở rộng, có thể tính toán số Pi và các hằng số toán học khác tới hàng nghìn tỷ chữ số. Kể từ khi ra mắt vào năm 2009, nó đã trở thành một ứng dụng đo điểm chuẩn và kiểm tra áp lực (stress-test) phổ biến đối với những người đam mê ép xung và phần cứng. Tại đây, một lần nữa chúng ta thấy rằng các chip Xeon Gold của PowerEdge R760 có lợi thế nhẹ về hiệu suất.
| Test | Dell PowerEdge T560 (2x Xeon Gold 6448Y) | Dell PowerEdge R760 (2x Xeon Gold 6430) |
| y-cruncher 1b Compute Time | 7.332 | 7.306 |
| y-cruncher 2.5b Compute Time | 20.102 | |
| y-cruncher 10b Compute Time | 97.32 | 91.435 |
GPUPI
GPUPI 3.3.3 là một phiên bản của công cụ đo điểm chuẩn nhẹ được thiết kế để tính toán số (pi) tới hàng tỷ chữ số thập phân bằng cách sử dụng tăng tốc phần cứng thông qua GPU và CPU. Nó tận dụng sức mạnh tính toán của OpenCL và CUDA, bao gồm cả đơn vị xử lý trung tâm và đơn vị xử lý đồ họa. Chúng tôi đã chạy CUDA trên 5 card đồ họa L4.
| Application | Dell PowerEdge T560 (2x Xeon Gold 6448Y) with 5X NVIDIA L4 |
| GPUPI v3.3 – 1B | 0sec 850ms |
| GPUPI v3.3 – 32B | 50sec 361ms |
UL Procyon AI Inference (CPU)
Bộ công cụ đo điểm chuẩn Procyon AI Inference của UL kiểm tra hiệu suất của các công cụ suy luận AI khác nhau khi sử dụng các mạng thần kinh tiên tiến nhất. Chúng tôi chỉ chạy các bài kiểm tra này trên CPU. Các con số bên dưới là thời gian suy luận trung bình; điểm tổng thể nằm ở hàng cuối cùng.
| Test | Dell PowerEdge T560 (2x Xeon Gold 6448Y) | Dell PowerEdge R760 (2x Xeon Gold 6430) |
| MobileNet V3 | 2.60 | 3.05 |
| ResNet 50 | 6.12 | 6.79 |
| Inception V4 | 19.59 | 20.55 |
| DeepLab V3 | 23.68 | 31.27 |
| YOLO V3 | 29.63 | 32.58 |
| REAL-ESRGAN | 1468.64 | 1498.36 |
| Overall Score | 191 | 169 |
GROMACS CUDA trên Máy chủ Tháp Dell T560
Để khai thác tối đa tiềm năng của máy chủ tháp Dell T560 được trang bị 5 GPU NVIDIA L4, chúng tôi đã biên dịch GROMACS — một phần mềm động lực học phân tử — từ mã nguồn dành riêng cho CUDA. Việc biên dịch tùy chỉnh này nhằm tận dụng khả năng xử lý song song của 5 GPU NVIDIA L4, điều thiết yếu để tăng tốc các mô phỏng tính toán.
Quy trình này bao gồm việc sử dụng nvcc, trình biên dịch CUDA của NVIDIA, cùng với nhiều lần thử nghiệm các cờ tối ưu hóa (optimization flags) phù hợp để đảm bảo rằng các tệp nhị phân được tinh chỉnh chính xác cho kiến trúc của máy chủ. Việc tích hợp hỗ trợ CUDA trong bản biên dịch GROMACS cho phép phần mềm giao tiếp trực tiếp với phần cứng GPU, giúp cải thiện đáng kể thời gian tính toán cho các mô phỏng phức tạp.
Bài kiểm tra: Tương tác Protein tùy chỉnh trong Gromacs
Tận dụng tệp đầu vào do cộng đồng cung cấp từ nhóm Discord đa dạng của chúng tôi, tệp này chứa các tham số và cấu trúc được tinh chỉnh cho một nghiên cứu tương tác protein cụ thể, chúng tôi đã bắt đầu một mô phỏng động lực học phân tử. Kết quả đạt được rất đáng kinh ngạc — hệ thống đã đạt tốc độ mô phỏng là 170,268 nan giây mỗi ngày.
| GPU | System | ns/day | core time (s) |
| NVIDIA A4000 | Whitebox AMD Ryzen 5950x | 84.415 | 163,763 |
| RTX NVIDIA 4070 | Whitebox AMD Ryzen 7950x3d | 131.85 | 209,692.3 |
| 5x NVIDIA L4 | Dell T560 w/ 2x Intel Xeon Gold 6448Y | 170.268 | 608,912.7 |
Ý nghĩa của tốc độ mô phỏng
Tốc độ thực hiện các mô phỏng phân tử đóng vai trò then chốt trong nhiều ngành công nghiệp khác nhau. Ví dụ, trong ngành dược phẩm, khả năng mô phỏng nhanh có thể đẩy nhanh đáng kể quá trình tìm kiếm thuốc mới bằng cách cho phép các nhà nghiên cứu lặp lại nhanh chóng các thiết kế và tương tác phân tử.
Trong khoa học vật liệu, nó có thể thúc đẩy việc phát triển các vật liệu mới với những đặc tính mong muốn. Tốc độ 170,268 ns/ngày đồng nghĩa với việc các mô phỏng vốn phải mất gần hai tuần trên các máy chủ đời cũ thì nay có thể hoàn thành chỉ trong một ngày trên Dell T560 được trang bị dòng card NVIDIA L4 khiêm tốn. Điều này không chỉ nâng cao năng suất mà còn mở ra những ranh giới mới trong việc phân tích dữ liệu và ra quyết định theo thời gian thực

Tác động đến nghiên cứu khoa học
Một cuộc trao đổi với một phòng thí nghiệm hiện đang chạy các mô phỏng tương tự trên phần cứng đã 10 năm tuổi đã mang lại một sự tương phản rõ rệt. Thiết lập hiện tại của họ mất 24 giờ để hoàn thành những gì Dell T560 có thể đạt được chỉ trong vài phút. Sự so sánh này không chỉ làm nổi bật những tiến bộ của các bộ vi xử lý hiện đại mà còn cho thấy giá trị mà phần cứng hiện nay có thể mang lại cho nghiên cứu khoa học.

Với máy chủ tháp Dell T560, các nhà nghiên cứu có thể thực hiện nhiều thử nghiệm hơn trong khung thời gian ngắn hơn, cải thiện chu trình lặp lại giữa giả thuyết và thử nghiệm vốn là trọng tâm của tiến bộ khoa học. Điều này có nghĩa là các thử nghiệm tính toán từng được coi là quá tốn kém tài nguyên để thăm dò thường xuyên thì nay đã trở nên khả thi.
Ứng dụng AI của hiệu suất tính toán
Hiệu suất tính toán được thể hiện bởi Dell T560 có những tác động sâu rộng trong lĩnh vực nghiên cứu. Nó không chỉ đơn thuần là về tốc độ mà còn về độ phức tạp và quy mô của các vấn đề hiện có thể giải quyết được. Các mô phỏng quy mô lớn mô hình hóa toàn bộ hệ sinh thái sinh học, các phản ứng hóa học phức tạp hoặc thậm chí là các mô hình sinh thái trở nên khả thi hơn với loại sức mạnh tính toán này.
Với sự ra đời của AI và học máy, thông lượng cao của các mô phỏng động lực học phân tử cho phép tạo ra các tập dữ liệu khổng lồ cần thiết để huấn luyện các mô hình tinh vi. Những mô hình này có thể dẫn đến những đột phá trong sinh học dự đoán, vật liệu mới và hóa học tính toán thế hệ tiếp theo.
Kết luận
Máy chủ tháp Dell PowerEdge T560 mang lại sự linh hoạt đáng kinh ngạc cho nhu cầu sử dụng máy chủ thông thường cũng như các tác vụ nâng cao hoặc chuyên dụng, bao gồm GPU, tính toán và khoa học dữ liệu. Nó tương đương, và ở một số khía cạnh còn vượt trội hơn các máy chủ dạng rack về khả năng mở rộng và sức mạnh, với hai bộ xử lý Intel Xeon Scalable “Sapphire Rapids”, 1TB RAM, nhiều cấu hình ổ lưu trữ và hỗ trợ đa GPU, nhưng thiết kế dạng tháp của nó lại không yêu cầu một trung tâm dữ liệu. Mặc dù rõ ràng là không hoàn toàn im lặng tùy thuộc vào khối lượng công việc, nhưng quạt của máy đủ yên tĩnh để có thể sử dụng trong môi trường văn phòng.

Quá trình thử nghiệm của chúng tôi đã chạm đến mọi khía cạnh khả năng của PowerEdge T560; nó cho thấy những con số vững chắc trong các bài kiểm tra lưu trữ và CPU, đồng thời phô diễn sức mạnh trong các bài kiểm tra GPU với cấu hình đặc biệt gồm năm GPU NVIDIA L4. Chúng tôi cũng đánh giá cao khả năng bảo trì đơn giản của dòng máy tháp này. Với khả năng mở rộng đáng khen ngợi và khả năng thích ứng ngay cả với những khối lượng công việc AI khắt khe nhất.
__________________________________________________
📞 Liên hệ Megacore để được tư vấn cấu hình phù hợp và giải pháp hạ tầng cho doanh nghiệp – hoàn toàn miễn phí
🌐 Website: megacore.net
📧 Email: [email protected]
📲 Hotline: 0345 888 868
Cảm ơn bạn đã tin tưởng và lựa chọn sản phẩm của Megacore. Chúng tôi cam kết mang đến cho bạn những sản phẩm chất lượng và dịch vụ tốt nhất!




