Bài viết

Đánh giá máy chủ tháp Dell PowerEdge T560

Đánh giá máy chủ tháp Dell PowerEdge T560

Máy chủ dạng tháp Dell PowerEdge T560 được xây dựng chuyên biệt cho hạ tầng IT tại chỗ, ảo hóa, quản trị cơ sở dữ liệu, suy luận AI, đám mây riêng và hơn thế nữa. Nó được vận hành bởi bộ vi xử lý Intel Xeon Scalable thế hệ thứ tư và hỗ trợ tối đa 24 ổ lưu trữ.

Thông số kỹ thuật Máy chủ Tháp Dell PowerEdge T560

Máy chủ dạng rack không phải lúc nào cũng phù hợp cho mọi doanh nghiệp, đặc biệt nếu bạn không có trung tâm dữ liệu. Điều này càng đúng tại các điểm biên (edge), nơi khái niệm về một phòng máy chủ truyền thống là không tồn tại. Đó là lý do máy chủ tháp PowerEdge T560 ra đời, với thiết kế thân thiện với văn phòng (độ ồn thấp). Thân máy lớn hơn cũng cho phép một số cấu hình độc đáo vốn không thể thực hiện trên các máy chủ gắn rack, chẳng hạn như kết hợp các khay ổ đĩa 2.5″ với 3.5″ trên bảng mạch kết nối phía trước.

T560 hỗ trợ hai bộ xử lý Intel Xeon Scalable thế hệ thứ tư lên đến 32 lõi (“Sapphire Rapids”), bộ nhớ 1TB (16 khe RDIMM) và nhiều sự kết hợp ổ đĩa có thể có. Theo nghĩa đó, đây không phải là một tòa tháp nhỏ, nó tương đương với kích thước 4.5U trong tủ rack và hỗ trợ tám quạt làm mát.

Chiếc tháp này cũng có khả năng mở rộng cực lớn với sáu khe cắm PCIe, hai trong số đó là x16 Gen5. Nó có thể lắp vừa hai GPU 300 watt độ rộng kép hoặc sáu GPU 75 watt đơn khe cắm.

Thông số kỹ thuật đầy đủ của PowerEdge T560 như sau:

Processor Up to two 4th generation Intel Xeon Scalable processors, up to 32 cores per socket
Memory
  • 16 DDR5 DIMM slots, 1TB max
  • Registered ECC DDR5 DIMMs only
Storage Controllers
  • Internal PERC: fPERC H965i, fPERC H755N, fPERC H755, fPERC H355, fPERC HBA355i
  • Internal Boot: Boot Optimized Storage Subsystem (BOSS-N1): HWRAID 2 x M.2 NVMe SSD drives, or USB
  • External HBA (non-RAID): PERC HBA355e
  • Software RAID: S160 (for NVMe drives only)
Drive Bays Front Bays:

  • Internal PERC: fPERC H965i, fPERC H755N, fPERC H755, fPERC H355, fPERC HBA355i
  • Internal Boot: Boot Optimized Storage Subsystem (BOSS-N1): HWRAID 2 x M.2 NVMe SSD drives, or USB
  • External HBA (non-RAID): PERC HBA355e
  • Software RAID: S160 (for NVMe drives only)
Power Supplies
  • 2400 W Platinum 100—240 VAC or 2400 W 240 VDC, hot swap redundant
  • 1800 W Titanium 200—240 VAC or 1800 W 240 VDC, hot swap redundant
  • 1400 W Platinum 100—240 VAC or 1400 W 240 VDC, hot swap redundant
  • 1100 W Titanium 100—240 VAC or 1100 W 240 VDC, hot swap redundant
  • 1100 LVDC -48 — (-60) VDC, hot swap redundant
  • 800 W Platinum 100—240 VAC or 800 W 240 VDC, hot swap redundant
  • 700 W Titanium 200—240 VAC or 700 W 240 VDC, hot swap redundant
  • 600 W Platinum 100—240 VAC or 600 W 240 VDC, hot swap redundant
Fans Up to eight Standard (STD) fans or High performance (HPR) fans
Dimensions Height — 464.0 mm (18.26 inches) (with feet)

  •  508.8 mm (20.03 inches) (with caster wheels)
  •  446.0 mm (17.60 inches) (without feet)

Width — 200.0 mm (7.87 inches)

  • Depth — 678.2 mm (26.70 inches) (with bezel)
  •  660.6 mm (26 inches) (without bezel)
Form Factor 4.5U tower server
Embedded Management
  • iDRAC9
  • iDRAC Direct
  • iDRAC RESTful API with Redfish
  • iDRAC Service Module
  • Quick Sync 2 wireless module
OpenManage Software
  • OpenManage Enterprise
  • OpenManage Power Manager plugin
  • OpenManage Service plugin
  • OpenManage Update Manager plugin
  • CloudIQ for PowerEdge plug in
  • OpenManage Enterprise Integration for VMware vCenter
  • OpenManage Integration for Microsoft System Center
  • OpenManage Integration with Windows Admin Center
Mobility OpenManage Mobile
OpenManage Integrations
  • BMC Truesight
  • Microsoft System Center
  • OpenManage Integration with ServiceNow
  • Red Hat Ansible Modules
  • Terraform Providers
  • VMware vCenter and vRealize Operations Manage
Security
  • Cryptographically signed firmware
  • Data at Rest Encryption (SEDs with local or external key mgmt)
  • Secure Boot
  • Secure Erase
  • Secured Component Verification (Hardware integrity check)
  • Silicon Root of Trust
  • System Lockdown (requires iDRAC9 Enterprise or Datacenter)
  • TPM 2.0 FIPS, CC-TCG certified, TPM 2.0 China NationZ
Embedded NIC 2 x 1GbE LOM on Planar
Network Options 1 x OCP x8 card 3.0

Note: The system allows both LOM on planar and OCP card to be installed on the system

GPU Options Up to 2 x 300 W DW or 6 x 75 W SW
Ports Front:

  • 1 x USB 2.0
  • 1 x USB 3.0
  • 1 x iDRAC Direct (Micro-AB USB) port

Rear:

  • 1 x USB 2.0
  • 1 x USB 3.0
  • 1 x Serial port (optional)
  • 1 x Dedicated iDRAC (RJ45) port
  • 1 x VGA port
  • 2 x Ethernet ports

Internal:

  • USB 3.0 (optional)
PCIe Up to six PCIe slots:

  • Slot 1: x16 Gen5 Full height, Full length
  • Slot 2: x16 Gen5 Full height, Full length
  • Slot 3: x16 Gen4 Full height, Half length
  • Slot 4: x16 Gen4 Full height, Half length
  • Slot 5: x16 (x8 lanes) Gen4 Full height, Half length
  • Slot 6: x16 Gen4 Full height, Half length
Operating System and Hypervisors
  • Canonical Ubuntu Server LTS
  • Microsoft Windows Server with Hyper-V
  • Red Hat Enterprise Linux
  • SUSE Linux Enterprise Server
  • VMware ESXi
  • For specifications and interoperability details, see Dell.com/OSsupport

Cấu trúc và Thiết kế Máy chủ Tháp Dell PowerEdge T560

Máy chủ tháp hiếm khi có kích thước nhỏ và PowerEdge T560 chắc chắn cũng không ngoại lệ, với kích thước 18,3 x 7,9 x 26,7 inch (Cao x Rộng x Sâu). Chiếc tháp kích cỡ 4.5U này gây ấn tượng từ mọi góc nhìn, bắt đầu từ mặt trước với các khay ổ cắm nóng (hot-swap). Phiên bản của chúng tôi có tám khay 2.5 inch và tám khay 3.5 inch, cùng với hai ổ BOSS dự phòng hỗ trợ RAID chuẩn M.2 ở phía bên phải.

Các cổng kết nối phía trước bao gồm một cổng USB 2.0, một cổng USB 3.0 và một cổng iDRAC Direct (Micro-AB USB).

Bên phải của các khay ổ đĩa 3.5 inch là các ổ khởi động NVMe M.2.

Dell PowerEdge T560 Tower - M.2 Boot Drives

Ở mặt sau, chiếc tháp này có một cổng USB 2.0, một cổng USB 3.0, một cổng nối tiếp tùy chọn, một cổng 1GbE dành cho iDRAC, một cổng VGA, hai cổng Ethernet và khe cắm OCP. Một cổng USB 3.0 khác là tùy chọn.

Cửa hông của tháp được tháo ra để truy cập vào bên trong; bố cục trông rất giống một máy chủ tiêu chuẩn được đặt nằm nghiêng. Hầu hết không gian bên trong được che phủ bởi một tấm dẫn luồng không khí khổng lồ.

Dell PowerEdge T560 Tower - Interior

Tám quạt cắm nóng được bố trí dọc theo đường trung tâm; bóp các lẫy màu cam cho phép tháo chúng ra dễ dàng.

Dell PowerEdge T560 Tower - Fans

Mỗi bộ xử lý Xeon đều có một bộ tản nhiệt dạng tháp khổng lồ và được bao quanh bởi tám khe cắm DIMM. T560 hỗ trợ tổng dung lượng RAM lên đến 1TB.

Dell PowerEdge T560 Tower - CPUs

Đây là các góc nhìn phía sau các khay ổ đĩa, bao gồm card NVMe RAID, có một card thứ hai trong cấu hình này dành cho các ổ HDD.

Dell PowerEdge T560 Tower - Drive Bays

Dell PowerEdge T560 Tower - RAID Card

Chúng tôi có một cấu hình đặc biệt với năm GPU NVIDIA L4, biến nó trở thành một nền tảng suy luận lý tưởng.

Dell PowerEdge T560 Tower - Nvidia L4s

Nằm kẹp giữa các GPU là một tấm chắn luồng không khí nhỏ khác dành cho card mạng OCP NIC.

Dell PowerEdge T560 Tower - OCP NIC

Bộ đôi nguồn điện cắm nóng nằm ở phía trên cùng.

Hiệu suất máy chủ tháp Dell PowerEdge T560

Thiết bị đánh giá của chúng tôi có cấu hình như sau:

  • 2x Intel Xeon Gold 6448Y (mỗi bộ xử lý có 32 lõi/64 luồng, TDP 225-watt, xung nhịp 2.1-4.1GHz)
  • 8x SSD Solidigm P5520 1.6TB kèm card RAID PERC 12
  • 5x GPU NVIDIA L4
  • 8x RDIMM 64GB

Để kiểm tra lưu trữ, chúng tôi đã tận dụng các ổ SSD kết nối với card RAID PERC 12 ở cấu hình JBOD và RAID 6. Điều này khác với việc sử dụng NVMe gốc, nơi mỗi ổ SSD sẽ có kết nối x4 riêng tới bo mạch chủ.

Phân tích Khối lượng công việc VDBench

Khi thực hiện đo điểm chuẩn (benchmarking) các thiết bị lưu trữ, kiểm thử ứng dụng là tốt nhất, và kiểm thử tổng hợp đứng ở vị trí thứ hai. Mặc dù không đại diện hoàn hảo cho các khối lượng công việc thực tế, các bài kiểm tra tổng hợp giúp thiết lập mức cơ sở cho các thiết bị lưu trữ với hệ số lặp lại, giúp dễ dàng so sánh trực tiếp giữa các giải pháp cạnh tranh. Các khối lượng công việc này cung cấp một loạt các hồ sơ kiểm thử, từ các bài kiểm tra “bốn góc” (four corners) và các bài kiểm tra kích thước truyền tải cơ sở dữ liệu phổ biến, cho đến việc chụp lại dấu vết (trace captures) từ các môi trường VDI khác nhau.

Tất cả các bài kiểm tra này đều tận dụng trình tạo khối lượng công việc VDBench phổ biến, cùng một công cụ kịch bản để tự động hóa và thu thập kết quả trên một cụm kiểm thử tính toán lớn. Điều này cho phép chúng tôi lặp lại cùng một khối lượng công việc trên nhiều loại thiết bị lưu trữ, bao gồm cả mảng flash và các thiết bị lưu trữ riêng lẻ. Quy trình kiểm thử của chúng tôi cho các điểm chuẩn này là lấp đầy toàn bộ bề mặt ổ đĩa bằng dữ liệu, sau đó phân vùng một phần ổ đĩa tương đương với 25% dung lượng để mô phỏng cách ổ đĩa phản hồi với các khối lượng công việc của ứng dụng. Điều này khác với các bài kiểm tra entropy toàn phần (full entropy), vốn sử dụng 100% ổ đĩa và đưa chúng vào trạng thái ổn định (steady state). Do đó, các số liệu này sẽ phản ánh tốc độ ghi duy trì cao hơn.

Hồ sơ (Profiles):

  • Đọc ngẫu nhiên 4K: 100% Đọc, 128 luồng, 0-120% tỷ lệ iorate
  • Ghi ngẫu nhiên 4K: 100% Ghi, 128 luồng, 0-120% tỷ lệ iorate
  • Đọc tuần tự 64K: 100% Đọc, 32 luồng, 0-120% tỷ lệ iorate
  • Ghi tuần tự 64K: 100% Ghi, 16 luồng, 0-120% tỷ lệ iorate
  • Đọc ngẫu nhiên 64K: 100% Đọc, 32 luồng, 0-120% tỷ lệ iorate
  • Ghi ngẫu nhiên 64K: 100% Ghi, 16 luồng, 0-120% tỷ lệ iorate
  • Cơ sở dữ liệu tổng hợp: SQL và Oracle
  • Dấu vết VDI Full Clone và Linked Clone

Bắt đầu với bài đọc ngẫu nhiên 4K, chúng tôi thấy T560 đạt 1,79 triệu IOPS ở cấu hình RAID6 và 4,86 triệu IOPS ở cấu hình JBOD. Độ trễ được kiểm soát tốt ngoại trừ giai đoạn cuối của kết quả JBOD, nơi chúng tôi thấy một mức tăng đột biến nhỏ.

Ghi ngẫu nhiên 4K cho thấy một mức tăng đột biến mạnh đối với mảng RAID6; nó không vượt quá 415.000 IOPS. Ngược lại, cấu hình JBOD đạt tới 3,9 triệu IOPS trước khi xuất hiện sự mất ổn định nhỏ. Tuy nhiên, một lần nữa, chúng ta thấy độ trễ tương đối ổn định cho đến khi xảy ra các mức tăng đột biến.

Tiếp theo là bài đọc tuần tự 64k; mảng RAID6 của T560 đạt tốc độ 8,2GB/s trong khi cấu hình JBOD đạt gần 23GB/s. Các đường biểu đồ không cho thấy sự mất ổn định nào.

Chúng tôi đã thấy một mức tăng đột biến mạnh khác đối với mảng RAID6 của T560 trong bài kiểm tra ghi tuần tự 64k, nơi nó bị giới hạn ở mức khoảng 4GB/s. Cấu hình JBOD đã đạt tới mức khoảng 16,5GB/s, với một số hiện tượng mất ổn định sau khi vượt quá ngưỡng 14GB/s.

Bài kiểm tra hỗn hợp 70/30 8K của chúng tôi cho thấy các đường biểu diễn tương đối mượt mà; mảng RAID6 đạt khoảng 670.000 IOPS và mảng JBOD đạt 1,93 triệu IOPS. Độ trễ trong cả hai trường hợp đều được duy trì ở mức kiểm soát tốt.

Các bài kiểm tra tiếp theo là về khối lượng công việc SQL của chúng tôi. Chúng tôi tiếp tục nhận thấy độ trễ ổn định và ở đây không xuất hiện các mức tăng đột biến nào. Mảng RAID6 đạt đỉnh ngay sau ngưỡng 4 triệu IOPS, trong khi cấu hình JBOD đã vượt mức 14 triệu IOPS.

Chúng tôi cũng đã thực hiện bài kiểm tra khối lượng công việc Oracle SQL với kết quả tương tự: mảng RAID6 lần này đã vượt xa ngưỡng 4 triệu IOPS, còn cấu hình JBOD thì nhích nhẹ lên trên mức 14 triệu IOPS.

Điểm chuẩn Hiệu suất trên Windows Server 2022

Để so sánh, chúng tôi đã chọn mẫu máy chủ R760 được kiểm thử trước đó. Dưới đây là phần so sánh giữa các bộ xử lý (CPU). Cả hai đều có cùng số lõi, mặc dù CPU Xeon 6448Y bên trong T560 có lợi thế về tốc độ xung nhịp tổng thể so với Xeon 6430 bên trong R760.

Dell PowerEdge T560 – Intel Xeon 6448Y Dell PowerEdge R760 – Intel Xeon 6430
Total Cores 32 32
Total Threads 64 64
Max Turbo Frequency 4.10 GHz 3.40 GHz
Processor Base Frequency 2.10 GHz 2.10 GHz

Cinebench R23 và R24

Cinebench R23 của Maxon là một bài kiểm tra hiệu năng dựng hình của CPU, tận dụng tất cả các lõi và luồng của CPU. Chúng tôi đã thực hiện cả bài kiểm tra đa nhân và đơn nhân. Điểm số càng cao càng tốt.

Với phiên bản 24 vừa được phát hành gần đây, nó đã giới thiệu một hệ thống tính điểm mới và khả năng chạy trên nhiều GPU.

Test Dell PowerEdge T560 (2x Xeon Gold 6448Y)
Cinebench R23 Multi 73,622
Cinebench R23 Single 1186
Cinebench R24 GPU 97,984
Cinebench R24 CPU Multi 3,976
Cinebench R24 CPU Single 3,976

Blender CLI

Điểm chuẩn Blender đo lường hiệu suất dựng hình 3D của CPU hoặc GPU bằng cách dựng một cảnh 3D trong phần mềm Blender. Nó cung cấp một số điểm có thể được sử dụng để so sánh hiệu suất của các hệ thống và thành phần khác nhau. Các con số được tính bằng mẫu trên phút (samples per minute).

Test Dell PowerEdge T560 (2x Xeon Gold 6448Y, 5x NVIDIA L4) Dell PowerEdge R760 (2x Xeon Gold 6430, 1x NVIDIA A2)
CPU Blender CLI – Monster 582.085675 576.928413
CPU Blender CLI – Junkshop 383.546707 376.557690
CPU Blender CLI – Classroom 275.857847 281.536442
GPU Blender CLI – Monster 2,547.287378 479.238127
GPU Blender CLI – Junkshop 1,348.087892 302.355378
GPU Blender CLI – Classroom 1,229.122455 248.540754

Geekbench 6

Geekbench là một bài kiểm tra hiệu năng đa nền tảng. Chúng tôi sử dụng bài kiểm tra CPU, bao gồm nhiều khối lượng công việc để mô phỏng các tác vụ và ứng dụng trong thế giới thực.

Test Dell PowerEdge T560 (2x Xeon Gold 6448Y) Dell PowerEdge R760 (2x Xeon Gold 6430)
Geekbench 6 CPU Multi Score 18,572 12,971
Geekbench 6 CPU Single Score 1,734 12,971
Geekbench 6 GPU dGPU Score – OpenCL 157,380 Untested

y-cruncher

y-cruncher là một chương trình đa luồng và có khả năng mở rộng, có thể tính toán số Pi và các hằng số toán học khác tới hàng nghìn tỷ chữ số. Kể từ khi ra mắt vào năm 2009, nó đã trở thành một ứng dụng đo điểm chuẩn và kiểm tra áp lực (stress-test) phổ biến đối với những người đam mê ép xung và phần cứng. Tại đây, một lần nữa chúng ta thấy rằng các chip Xeon Gold của PowerEdge R760 có lợi thế nhẹ về hiệu suất.

Test Dell PowerEdge T560 (2x Xeon Gold 6448Y) Dell PowerEdge R760 (2x Xeon Gold 6430)
y-cruncher 1b Compute Time 7.332 7.306
y-cruncher 2.5b Compute Time 20.102
y-cruncher 10b Compute Time 97.32 91.435

GPUPI

GPUPI 3.3.3 là một phiên bản của công cụ đo điểm chuẩn nhẹ được thiết kế để tính toán số (pi) tới hàng tỷ chữ số thập phân bằng cách sử dụng tăng tốc phần cứng thông qua GPU và CPU. Nó tận dụng sức mạnh tính toán của OpenCL và CUDA, bao gồm cả đơn vị xử lý trung tâm và đơn vị xử lý đồ họa. Chúng tôi đã chạy CUDA trên 5 card đồ họa L4.

Application Dell PowerEdge T560 (2x Xeon Gold 6448Y) with 5X NVIDIA L4
GPUPI v3.3 – 1B 0sec 850ms
GPUPI v3.3 – 32B 50sec 361ms

UL Procyon AI Inference (CPU)

Bộ công cụ đo điểm chuẩn Procyon AI Inference của UL kiểm tra hiệu suất của các công cụ suy luận AI khác nhau khi sử dụng các mạng thần kinh tiên tiến nhất. Chúng tôi chỉ chạy các bài kiểm tra này trên CPU. Các con số bên dưới là thời gian suy luận trung bình; điểm tổng thể nằm ở hàng cuối cùng.

Test Dell PowerEdge T560 (2x Xeon Gold 6448Y) Dell PowerEdge R760 (2x Xeon Gold 6430)
MobileNet V3 2.60 3.05
ResNet 50 6.12 6.79
Inception V4 19.59 20.55
DeepLab V3 23.68 31.27
YOLO V3 29.63 32.58
REAL-ESRGAN 1468.64 1498.36
Overall Score 191 169

GROMACS CUDA trên Máy chủ Tháp Dell T560

Để khai thác tối đa tiềm năng của máy chủ tháp Dell T560 được trang bị 5 GPU NVIDIA L4, chúng tôi đã biên dịch GROMACS — một phần mềm động lực học phân tử — từ mã nguồn dành riêng cho CUDA. Việc biên dịch tùy chỉnh này nhằm tận dụng khả năng xử lý song song của 5 GPU NVIDIA L4, điều thiết yếu để tăng tốc các mô phỏng tính toán.

Quy trình này bao gồm việc sử dụng nvcc, trình biên dịch CUDA của NVIDIA, cùng với nhiều lần thử nghiệm các cờ tối ưu hóa (optimization flags) phù hợp để đảm bảo rằng các tệp nhị phân được tinh chỉnh chính xác cho kiến trúc của máy chủ. Việc tích hợp hỗ trợ CUDA trong bản biên dịch GROMACS cho phép phần mềm giao tiếp trực tiếp với phần cứng GPU, giúp cải thiện đáng kể thời gian tính toán cho các mô phỏng phức tạp.

Bài kiểm tra: Tương tác Protein tùy chỉnh trong Gromacs

Tận dụng tệp đầu vào do cộng đồng cung cấp từ nhóm Discord đa dạng của chúng tôi, tệp này chứa các tham số và cấu trúc được tinh chỉnh cho một nghiên cứu tương tác protein cụ thể, chúng tôi đã bắt đầu một mô phỏng động lực học phân tử. Kết quả đạt được rất đáng kinh ngạc — hệ thống đã đạt tốc độ mô phỏng là 170,268 nan giây mỗi ngày.

GPU System ns/day core time (s)
NVIDIA A4000 Whitebox AMD Ryzen 5950x 84.415 163,763
RTX NVIDIA 4070 Whitebox AMD Ryzen 7950x3d 131.85 209,692.3
5x NVIDIA L4 Dell T560 w/ 2x Intel Xeon Gold 6448Y 170.268 608,912.7

Ý nghĩa của tốc độ mô phỏng

Tốc độ thực hiện các mô phỏng phân tử đóng vai trò then chốt trong nhiều ngành công nghiệp khác nhau. Ví dụ, trong ngành dược phẩm, khả năng mô phỏng nhanh có thể đẩy nhanh đáng kể quá trình tìm kiếm thuốc mới bằng cách cho phép các nhà nghiên cứu lặp lại nhanh chóng các thiết kế và tương tác phân tử.

Trong khoa học vật liệu, nó có thể thúc đẩy việc phát triển các vật liệu mới với những đặc tính mong muốn. Tốc độ 170,268 ns/ngày đồng nghĩa với việc các mô phỏng vốn phải mất gần hai tuần trên các máy chủ đời cũ thì nay có thể hoàn thành chỉ trong một ngày trên Dell T560 được trang bị dòng card NVIDIA L4 khiêm tốn. Điều này không chỉ nâng cao năng suất mà còn mở ra những ranh giới mới trong việc phân tích dữ liệu và ra quyết định theo thời gian thực

Tác động đến nghiên cứu khoa học

Một cuộc trao đổi với một phòng thí nghiệm hiện đang chạy các mô phỏng tương tự trên phần cứng đã 10 năm tuổi đã mang lại một sự tương phản rõ rệt. Thiết lập hiện tại của họ mất 24 giờ để hoàn thành những gì Dell T560 có thể đạt được chỉ trong vài phút. Sự so sánh này không chỉ làm nổi bật những tiến bộ của các bộ vi xử lý hiện đại mà còn cho thấy giá trị mà phần cứng hiện nay có thể mang lại cho nghiên cứu khoa học.

DALL·E 2023-11-03 15.08.18 - Photo depicting a high-powered computational simulation of molecular dynamics with a focus on GROMACS. The image shows a complex 3D molecular structure

Với máy chủ tháp Dell T560, các nhà nghiên cứu có thể thực hiện nhiều thử nghiệm hơn trong khung thời gian ngắn hơn, cải thiện chu trình lặp lại giữa giả thuyết và thử nghiệm vốn là trọng tâm của tiến bộ khoa học. Điều này có nghĩa là các thử nghiệm tính toán từng được coi là quá tốn kém tài nguyên để thăm dò thường xuyên thì nay đã trở nên khả thi.

Ứng dụng AI của hiệu suất tính toán

Hiệu suất tính toán được thể hiện bởi Dell T560 có những tác động sâu rộng trong lĩnh vực nghiên cứu. Nó không chỉ đơn thuần là về tốc độ mà còn về độ phức tạp và quy mô của các vấn đề hiện có thể giải quyết được. Các mô phỏng quy mô lớn mô hình hóa toàn bộ hệ sinh thái sinh học, các phản ứng hóa học phức tạp hoặc thậm chí là các mô hình sinh thái trở nên khả thi hơn với loại sức mạnh tính toán này.

Với sự ra đời của AI và học máy, thông lượng cao của các mô phỏng động lực học phân tử cho phép tạo ra các tập dữ liệu khổng lồ cần thiết để huấn luyện các mô hình tinh vi. Những mô hình này có thể dẫn đến những đột phá trong sinh học dự đoán, vật liệu mới và hóa học tính toán thế hệ tiếp theo.

Kết luận

Máy chủ tháp Dell PowerEdge T560 mang lại sự linh hoạt đáng kinh ngạc cho nhu cầu sử dụng máy chủ thông thường cũng như các tác vụ nâng cao hoặc chuyên dụng, bao gồm GPU, tính toán và khoa học dữ liệu. Nó tương đương, và ở một số khía cạnh còn vượt trội hơn các máy chủ dạng rack về khả năng mở rộng và sức mạnh, với hai bộ xử lý Intel Xeon Scalable “Sapphire Rapids”, 1TB RAM, nhiều cấu hình ổ lưu trữ và hỗ trợ đa GPU, nhưng thiết kế dạng tháp của nó lại không yêu cầu một trung tâm dữ liệu. Mặc dù rõ ràng là không hoàn toàn im lặng tùy thuộc vào khối lượng công việc, nhưng quạt của máy đủ yên tĩnh để có thể sử dụng trong môi trường văn phòng.

Dell PowerEdge T560 Tower - Nvidia L4s

Quá trình thử nghiệm của chúng tôi đã chạm đến mọi khía cạnh khả năng của PowerEdge T560; nó cho thấy những con số vững chắc trong các bài kiểm tra lưu trữ và CPU, đồng thời phô diễn sức mạnh trong các bài kiểm tra GPU với cấu hình đặc biệt gồm năm GPU NVIDIA L4. Chúng tôi cũng đánh giá cao khả năng bảo trì đơn giản của dòng máy tháp này. Với khả năng mở rộng đáng khen ngợi và khả năng thích ứng ngay cả với những khối lượng công việc AI khắt khe nhất.

560 được xây dựng chuyên biệt cho hạ tầng IT tại chỗ, ảo hóa, quản trị cơ sở dữ liệu, suy luận AI, đám mây riêng và hơn thế nữa. Nó được vận hành bởi bộ vi xử lý Intel Xeon Scalable thế hệ thứ tư và hỗ trợ tối đa 24 ổ lưu trữ.

Thông số kỹ thuật Máy chủ Tháp Dell PowerEdge T560

Máy chủ dạng rack không phải lúc nào cũng phù hợp cho mọi doanh nghiệp, đặc biệt nếu bạn không có trung tâm dữ liệu. Điều này càng đúng tại các điểm biên (edge), nơi khái niệm về một phòng máy chủ truyền thống là không tồn tại. Đó là lý do máy chủ tháp PowerEdge T560 ra đời, với thiết kế thân thiện với văn phòng (độ ồn thấp). Thân máy lớn hơn cũng cho phép một số cấu hình độc đáo vốn không thể thực hiện trên các máy chủ gắn rack, chẳng hạn như kết hợp các khay ổ đĩa 2.5″ với 3.5″ trên bảng mạch kết nối phía trước.

T560 hỗ trợ hai bộ xử lý Intel Xeon Scalable thế hệ thứ tư lên đến 32 lõi (“Sapphire Rapids”), bộ nhớ 1TB (16 khe RDIMM) và nhiều sự kết hợp ổ đĩa có thể có. Theo nghĩa đó, đây không phải là một tòa tháp nhỏ, nó tương đương với kích thước 4.5U trong tủ rack và hỗ trợ tám quạt làm mát.

Chiếc tháp này cũng có khả năng mở rộng cực lớn với sáu khe cắm PCIe, hai trong số đó là x16 Gen5. Nó có thể lắp vừa hai GPU 300 watt độ rộng kép hoặc sáu GPU 75 watt đơn khe cắm.

Thông số kỹ thuật đầy đủ của PowerEdge T560 như sau:

Processor Up to two 4th generation Intel Xeon Scalable processors, up to 32 cores per socket
Memory
  • 16 DDR5 DIMM slots, 1TB max
  • Registered ECC DDR5 DIMMs only
Storage Controllers
  • Internal PERC: fPERC H965i, fPERC H755N, fPERC H755, fPERC H355, fPERC HBA355i
  • Internal Boot: Boot Optimized Storage Subsystem (BOSS-N1): HWRAID 2 x M.2 NVMe SSD drives, or USB
  • External HBA (non-RAID): PERC HBA355e
  • Software RAID: S160 (for NVMe drives only)
Drive Bays Front Bays:

  • Internal PERC: fPERC H965i, fPERC H755N, fPERC H755, fPERC H355, fPERC HBA355i
  • Internal Boot: Boot Optimized Storage Subsystem (BOSS-N1): HWRAID 2 x M.2 NVMe SSD drives, or USB
  • External HBA (non-RAID): PERC HBA355e
  • Software RAID: S160 (for NVMe drives only)
Power Supplies
  • 2400 W Platinum 100—240 VAC or 2400 W 240 VDC, hot swap redundant
  • 1800 W Titanium 200—240 VAC or 1800 W 240 VDC, hot swap redundant
  • 1400 W Platinum 100—240 VAC or 1400 W 240 VDC, hot swap redundant
  • 1100 W Titanium 100—240 VAC or 1100 W 240 VDC, hot swap redundant
  • 1100 LVDC -48 — (-60) VDC, hot swap redundant
  • 800 W Platinum 100—240 VAC or 800 W 240 VDC, hot swap redundant
  • 700 W Titanium 200—240 VAC or 700 W 240 VDC, hot swap redundant
  • 600 W Platinum 100—240 VAC or 600 W 240 VDC, hot swap redundant
Fans Up to eight Standard (STD) fans or High performance (HPR) fans
Dimensions Height — 464.0 mm (18.26 inches) (with feet)

  •  508.8 mm (20.03 inches) (with caster wheels)
  •  446.0 mm (17.60 inches) (without feet)

Width — 200.0 mm (7.87 inches)

  • Depth — 678.2 mm (26.70 inches) (with bezel)
  •  660.6 mm (26 inches) (without bezel)
Form Factor 4.5U tower server
Embedded Management
  • iDRAC9
  • iDRAC Direct
  • iDRAC RESTful API with Redfish
  • iDRAC Service Module
  • Quick Sync 2 wireless module
OpenManage Software
  • OpenManage Enterprise
  • OpenManage Power Manager plugin
  • OpenManage Service plugin
  • OpenManage Update Manager plugin
  • CloudIQ for PowerEdge plug in
  • OpenManage Enterprise Integration for VMware vCenter
  • OpenManage Integration for Microsoft System Center
  • OpenManage Integration with Windows Admin Center
Mobility OpenManage Mobile
OpenManage Integrations
  • BMC Truesight
  • Microsoft System Center
  • OpenManage Integration with ServiceNow
  • Red Hat Ansible Modules
  • Terraform Providers
  • VMware vCenter and vRealize Operations Manage
Security
  • Cryptographically signed firmware
  • Data at Rest Encryption (SEDs with local or external key mgmt)
  • Secure Boot
  • Secure Erase
  • Secured Component Verification (Hardware integrity check)
  • Silicon Root of Trust
  • System Lockdown (requires iDRAC9 Enterprise or Datacenter)
  • TPM 2.0 FIPS, CC-TCG certified, TPM 2.0 China NationZ
Embedded NIC 2 x 1GbE LOM on Planar
Network Options 1 x OCP x8 card 3.0

Note: The system allows both LOM on planar and OCP card to be installed on the system

GPU Options Up to 2 x 300 W DW or 6 x 75 W SW
Ports Front:

  • 1 x USB 2.0
  • 1 x USB 3.0
  • 1 x iDRAC Direct (Micro-AB USB) port

Rear:

  • 1 x USB 2.0
  • 1 x USB 3.0
  • 1 x Serial port (optional)
  • 1 x Dedicated iDRAC (RJ45) port
  • 1 x VGA port
  • 2 x Ethernet ports

Internal:

  • USB 3.0 (optional)
PCIe Up to six PCIe slots:

  • Slot 1: x16 Gen5 Full height, Full length
  • Slot 2: x16 Gen5 Full height, Full length
  • Slot 3: x16 Gen4 Full height, Half length
  • Slot 4: x16 Gen4 Full height, Half length
  • Slot 5: x16 (x8 lanes) Gen4 Full height, Half length
  • Slot 6: x16 Gen4 Full height, Half length
Operating System and Hypervisors
  • Canonical Ubuntu Server LTS
  • Microsoft Windows Server with Hyper-V
  • Red Hat Enterprise Linux
  • SUSE Linux Enterprise Server
  • VMware ESXi
  • For specifications and interoperability details, see Dell.com/OSsupport

Cấu trúc và Thiết kế Máy chủ Tháp Dell PowerEdge T560

Máy chủ tháp hiếm khi có kích thước nhỏ và PowerEdge T560 chắc chắn cũng không ngoại lệ, với kích thước 18,3 x 7,9 x 26,7 inch (Cao x Rộng x Sâu). Chiếc tháp kích cỡ 4.5U này gây ấn tượng từ mọi góc nhìn, bắt đầu từ mặt trước với các khay ổ cắm nóng (hot-swap). Phiên bản của chúng tôi có tám khay 2.5 inch và tám khay 3.5 inch, cùng với hai ổ BOSS dự phòng hỗ trợ RAID chuẩn M.2 ở phía bên phải.

Các cổng kết nối phía trước bao gồm một cổng USB 2.0, một cổng USB 3.0 và một cổng iDRAC Direct (Micro-AB USB).

Bên phải của các khay ổ đĩa 3.5 inch là các ổ khởi động NVMe M.2.

Dell PowerEdge T560 Tower - M.2 Boot Drives

Ở mặt sau, chiếc tháp này có một cổng USB 2.0, một cổng USB 3.0, một cổng nối tiếp tùy chọn, một cổng 1GbE dành cho iDRAC, một cổng VGA, hai cổng Ethernet và khe cắm OCP. Một cổng USB 3.0 khác là tùy chọn.

Cửa hông của tháp được tháo ra để truy cập vào bên trong; bố cục trông rất giống một máy chủ tiêu chuẩn được đặt nằm nghiêng. Hầu hết không gian bên trong được che phủ bởi một tấm dẫn luồng không khí khổng lồ.

Dell PowerEdge T560 Tower - Interior

Tám quạt cắm nóng được bố trí dọc theo đường trung tâm; bóp các lẫy màu cam cho phép tháo chúng ra dễ dàng.

Dell PowerEdge T560 Tower - Fans

Mỗi bộ xử lý Xeon đều có một bộ tản nhiệt dạng tháp khổng lồ và được bao quanh bởi tám khe cắm DIMM. T560 hỗ trợ tổng dung lượng RAM lên đến 1TB.

Dell PowerEdge T560 Tower - CPUs

Đây là các góc nhìn phía sau các khay ổ đĩa, bao gồm card NVMe RAID, có một card thứ hai trong cấu hình này dành cho các ổ HDD.

Dell PowerEdge T560 Tower - Drive Bays

Dell PowerEdge T560 Tower - RAID Card

Chúng tôi có một cấu hình đặc biệt với năm GPU NVIDIA L4, biến nó trở thành một nền tảng suy luận lý tưởng.

Dell PowerEdge T560 Tower - Nvidia L4s

Nằm kẹp giữa các GPU là một tấm chắn luồng không khí nhỏ khác dành cho card mạng OCP NIC.

Dell PowerEdge T560 Tower - OCP NIC

Bộ đôi nguồn điện cắm nóng nằm ở phía trên cùng.

Hiệu suất máy chủ tháp Dell PowerEdge T560

Thiết bị đánh giá của chúng tôi có cấu hình như sau:

  • 2x Intel Xeon Gold 6448Y (mỗi bộ xử lý có 32 lõi/64 luồng, TDP 225-watt, xung nhịp 2.1-4.1GHz)
  • 8x SSD Solidigm P5520 1.6TB kèm card RAID PERC 12
  • 5x GPU NVIDIA L4
  • 8x RDIMM 64GB

Để kiểm tra lưu trữ, chúng tôi đã tận dụng các ổ SSD kết nối với card RAID PERC 12 ở cấu hình JBOD và RAID 6. Điều này khác với việc sử dụng NVMe gốc, nơi mỗi ổ SSD sẽ có kết nối x4 riêng tới bo mạch chủ.

Phân tích Khối lượng công việc VDBench

Khi thực hiện đo điểm chuẩn (benchmarking) các thiết bị lưu trữ, kiểm thử ứng dụng là tốt nhất, và kiểm thử tổng hợp đứng ở vị trí thứ hai. Mặc dù không đại diện hoàn hảo cho các khối lượng công việc thực tế, các bài kiểm tra tổng hợp giúp thiết lập mức cơ sở cho các thiết bị lưu trữ với hệ số lặp lại, giúp dễ dàng so sánh trực tiếp giữa các giải pháp cạnh tranh. Các khối lượng công việc này cung cấp một loạt các hồ sơ kiểm thử, từ các bài kiểm tra “bốn góc” (four corners) và các bài kiểm tra kích thước truyền tải cơ sở dữ liệu phổ biến, cho đến việc chụp lại dấu vết (trace captures) từ các môi trường VDI khác nhau.

Tất cả các bài kiểm tra này đều tận dụng trình tạo khối lượng công việc VDBench phổ biến, cùng một công cụ kịch bản để tự động hóa và thu thập kết quả trên một cụm kiểm thử tính toán lớn. Điều này cho phép chúng tôi lặp lại cùng một khối lượng công việc trên nhiều loại thiết bị lưu trữ, bao gồm cả mảng flash và các thiết bị lưu trữ riêng lẻ. Quy trình kiểm thử của chúng tôi cho các điểm chuẩn này là lấp đầy toàn bộ bề mặt ổ đĩa bằng dữ liệu, sau đó phân vùng một phần ổ đĩa tương đương với 25% dung lượng để mô phỏng cách ổ đĩa phản hồi với các khối lượng công việc của ứng dụng. Điều này khác với các bài kiểm tra entropy toàn phần (full entropy), vốn sử dụng 100% ổ đĩa và đưa chúng vào trạng thái ổn định (steady state). Do đó, các số liệu này sẽ phản ánh tốc độ ghi duy trì cao hơn.

Hồ sơ (Profiles):

  • Đọc ngẫu nhiên 4K: 100% Đọc, 128 luồng, 0-120% tỷ lệ iorate
  • Ghi ngẫu nhiên 4K: 100% Ghi, 128 luồng, 0-120% tỷ lệ iorate
  • Đọc tuần tự 64K: 100% Đọc, 32 luồng, 0-120% tỷ lệ iorate
  • Ghi tuần tự 64K: 100% Ghi, 16 luồng, 0-120% tỷ lệ iorate
  • Đọc ngẫu nhiên 64K: 100% Đọc, 32 luồng, 0-120% tỷ lệ iorate
  • Ghi ngẫu nhiên 64K: 100% Ghi, 16 luồng, 0-120% tỷ lệ iorate
  • Cơ sở dữ liệu tổng hợp: SQL và Oracle
  • Dấu vết VDI Full Clone và Linked Clone

Bắt đầu với bài đọc ngẫu nhiên 4K, chúng tôi thấy T560 đạt 1,79 triệu IOPS ở cấu hình RAID6 và 4,86 triệu IOPS ở cấu hình JBOD. Độ trễ được kiểm soát tốt ngoại trừ giai đoạn cuối của kết quả JBOD, nơi chúng tôi thấy một mức tăng đột biến nhỏ.

Ghi ngẫu nhiên 4K cho thấy một mức tăng đột biến mạnh đối với mảng RAID6; nó không vượt quá 415.000 IOPS. Ngược lại, cấu hình JBOD đạt tới 3,9 triệu IOPS trước khi xuất hiện sự mất ổn định nhỏ. Tuy nhiên, một lần nữa, chúng ta thấy độ trễ tương đối ổn định cho đến khi xảy ra các mức tăng đột biến.

Tiếp theo là bài đọc tuần tự 64k; mảng RAID6 của T560 đạt tốc độ 8,2GB/s trong khi cấu hình JBOD đạt gần 23GB/s. Các đường biểu đồ không cho thấy sự mất ổn định nào.

Chúng tôi đã thấy một mức tăng đột biến mạnh khác đối với mảng RAID6 của T560 trong bài kiểm tra ghi tuần tự 64k, nơi nó bị giới hạn ở mức khoảng 4GB/s. Cấu hình JBOD đã đạt tới mức khoảng 16,5GB/s, với một số hiện tượng mất ổn định sau khi vượt quá ngưỡng 14GB/s.

Bài kiểm tra hỗn hợp 70/30 8K của chúng tôi cho thấy các đường biểu diễn tương đối mượt mà; mảng RAID6 đạt khoảng 670.000 IOPS và mảng JBOD đạt 1,93 triệu IOPS. Độ trễ trong cả hai trường hợp đều được duy trì ở mức kiểm soát tốt.

Các bài kiểm tra tiếp theo là về khối lượng công việc SQL của chúng tôi. Chúng tôi tiếp tục nhận thấy độ trễ ổn định và ở đây không xuất hiện các mức tăng đột biến nào. Mảng RAID6 đạt đỉnh ngay sau ngưỡng 4 triệu IOPS, trong khi cấu hình JBOD đã vượt mức 14 triệu IOPS.

Chúng tôi cũng đã thực hiện bài kiểm tra khối lượng công việc Oracle SQL với kết quả tương tự: mảng RAID6 lần này đã vượt xa ngưỡng 4 triệu IOPS, còn cấu hình JBOD thì nhích nhẹ lên trên mức 14 triệu IOPS.

Điểm chuẩn Hiệu suất trên Windows Server 2022

Để so sánh, chúng tôi đã chọn mẫu máy chủ R760 được kiểm thử trước đó. Dưới đây là phần so sánh giữa các bộ xử lý (CPU). Cả hai đều có cùng số lõi, mặc dù CPU Xeon 6448Y bên trong T560 có lợi thế về tốc độ xung nhịp tổng thể so với Xeon 6430 bên trong R760.

Dell PowerEdge T560 – Intel Xeon 6448Y Dell PowerEdge R760 – Intel Xeon 6430
Total Cores 32 32
Total Threads 64 64
Max Turbo Frequency 4.10 GHz 3.40 GHz
Processor Base Frequency 2.10 GHz 2.10 GHz

Cinebench R23 và R24

Cinebench R23 của Maxon là một bài kiểm tra hiệu năng dựng hình của CPU, tận dụng tất cả các lõi và luồng của CPU. Chúng tôi đã thực hiện cả bài kiểm tra đa nhân và đơn nhân. Điểm số càng cao càng tốt.

Với phiên bản 24 vừa được phát hành gần đây, nó đã giới thiệu một hệ thống tính điểm mới và khả năng chạy trên nhiều GPU.

Test Dell PowerEdge T560 (2x Xeon Gold 6448Y)
Cinebench R23 Multi 73,622
Cinebench R23 Single 1186
Cinebench R24 GPU 97,984
Cinebench R24 CPU Multi 3,976
Cinebench R24 CPU Single 3,976

Blender CLI

Điểm chuẩn Blender đo lường hiệu suất dựng hình 3D của CPU hoặc GPU bằng cách dựng một cảnh 3D trong phần mềm Blender. Nó cung cấp một số điểm có thể được sử dụng để so sánh hiệu suất của các hệ thống và thành phần khác nhau. Các con số được tính bằng mẫu trên phút (samples per minute).

Test Dell PowerEdge T560 (2x Xeon Gold 6448Y, 5x NVIDIA L4) Dell PowerEdge R760 (2x Xeon Gold 6430, 1x NVIDIA A2)
CPU Blender CLI – Monster 582.085675 576.928413
CPU Blender CLI – Junkshop 383.546707 376.557690
CPU Blender CLI – Classroom 275.857847 281.536442
GPU Blender CLI – Monster 2,547.287378 479.238127
GPU Blender CLI – Junkshop 1,348.087892 302.355378
GPU Blender CLI – Classroom 1,229.122455 248.540754

Geekbench 6

Geekbench là một bài kiểm tra hiệu năng đa nền tảng. Chúng tôi sử dụng bài kiểm tra CPU, bao gồm nhiều khối lượng công việc để mô phỏng các tác vụ và ứng dụng trong thế giới thực.

Test Dell PowerEdge T560 (2x Xeon Gold 6448Y) Dell PowerEdge R760 (2x Xeon Gold 6430)
Geekbench 6 CPU Multi Score 18,572 12,971
Geekbench 6 CPU Single Score 1,734 12,971
Geekbench 6 GPU dGPU Score – OpenCL 157,380 Untested

y-cruncher

y-cruncher là một chương trình đa luồng và có khả năng mở rộng, có thể tính toán số Pi và các hằng số toán học khác tới hàng nghìn tỷ chữ số. Kể từ khi ra mắt vào năm 2009, nó đã trở thành một ứng dụng đo điểm chuẩn và kiểm tra áp lực (stress-test) phổ biến đối với những người đam mê ép xung và phần cứng. Tại đây, một lần nữa chúng ta thấy rằng các chip Xeon Gold của PowerEdge R760 có lợi thế nhẹ về hiệu suất.

Test Dell PowerEdge T560 (2x Xeon Gold 6448Y) Dell PowerEdge R760 (2x Xeon Gold 6430)
y-cruncher 1b Compute Time 7.332 7.306
y-cruncher 2.5b Compute Time 20.102
y-cruncher 10b Compute Time 97.32 91.435

GPUPI

GPUPI 3.3.3 là một phiên bản của công cụ đo điểm chuẩn nhẹ được thiết kế để tính toán số (pi) tới hàng tỷ chữ số thập phân bằng cách sử dụng tăng tốc phần cứng thông qua GPU và CPU. Nó tận dụng sức mạnh tính toán của OpenCL và CUDA, bao gồm cả đơn vị xử lý trung tâm và đơn vị xử lý đồ họa. Chúng tôi đã chạy CUDA trên 5 card đồ họa L4.

Application Dell PowerEdge T560 (2x Xeon Gold 6448Y) with 5X NVIDIA L4
GPUPI v3.3 – 1B 0sec 850ms
GPUPI v3.3 – 32B 50sec 361ms

UL Procyon AI Inference (CPU)

Bộ công cụ đo điểm chuẩn Procyon AI Inference của UL kiểm tra hiệu suất của các công cụ suy luận AI khác nhau khi sử dụng các mạng thần kinh tiên tiến nhất. Chúng tôi chỉ chạy các bài kiểm tra này trên CPU. Các con số bên dưới là thời gian suy luận trung bình; điểm tổng thể nằm ở hàng cuối cùng.

Test Dell PowerEdge T560 (2x Xeon Gold 6448Y) Dell PowerEdge R760 (2x Xeon Gold 6430)
MobileNet V3 2.60 3.05
ResNet 50 6.12 6.79
Inception V4 19.59 20.55
DeepLab V3 23.68 31.27
YOLO V3 29.63 32.58
REAL-ESRGAN 1468.64 1498.36
Overall Score 191 169

GROMACS CUDA trên Máy chủ Tháp Dell T560

Để khai thác tối đa tiềm năng của máy chủ tháp Dell T560 được trang bị 5 GPU NVIDIA L4, chúng tôi đã biên dịch GROMACS — một phần mềm động lực học phân tử — từ mã nguồn dành riêng cho CUDA. Việc biên dịch tùy chỉnh này nhằm tận dụng khả năng xử lý song song của 5 GPU NVIDIA L4, điều thiết yếu để tăng tốc các mô phỏng tính toán.

Quy trình này bao gồm việc sử dụng nvcc, trình biên dịch CUDA của NVIDIA, cùng với nhiều lần thử nghiệm các cờ tối ưu hóa (optimization flags) phù hợp để đảm bảo rằng các tệp nhị phân được tinh chỉnh chính xác cho kiến trúc của máy chủ. Việc tích hợp hỗ trợ CUDA trong bản biên dịch GROMACS cho phép phần mềm giao tiếp trực tiếp với phần cứng GPU, giúp cải thiện đáng kể thời gian tính toán cho các mô phỏng phức tạp.

Bài kiểm tra: Tương tác Protein tùy chỉnh trong Gromacs

Tận dụng tệp đầu vào do cộng đồng cung cấp từ nhóm Discord đa dạng của chúng tôi, tệp này chứa các tham số và cấu trúc được tinh chỉnh cho một nghiên cứu tương tác protein cụ thể, chúng tôi đã bắt đầu một mô phỏng động lực học phân tử. Kết quả đạt được rất đáng kinh ngạc — hệ thống đã đạt tốc độ mô phỏng là 170,268 nan giây mỗi ngày.

GPU System ns/day core time (s)
NVIDIA A4000 Whitebox AMD Ryzen 5950x 84.415 163,763
RTX NVIDIA 4070 Whitebox AMD Ryzen 7950x3d 131.85 209,692.3
5x NVIDIA L4 Dell T560 w/ 2x Intel Xeon Gold 6448Y 170.268 608,912.7

Ý nghĩa của tốc độ mô phỏng

Tốc độ thực hiện các mô phỏng phân tử đóng vai trò then chốt trong nhiều ngành công nghiệp khác nhau. Ví dụ, trong ngành dược phẩm, khả năng mô phỏng nhanh có thể đẩy nhanh đáng kể quá trình tìm kiếm thuốc mới bằng cách cho phép các nhà nghiên cứu lặp lại nhanh chóng các thiết kế và tương tác phân tử.

Trong khoa học vật liệu, nó có thể thúc đẩy việc phát triển các vật liệu mới với những đặc tính mong muốn. Tốc độ 170,268 ns/ngày đồng nghĩa với việc các mô phỏng vốn phải mất gần hai tuần trên các máy chủ đời cũ thì nay có thể hoàn thành chỉ trong một ngày trên Dell T560 được trang bị dòng card NVIDIA L4 khiêm tốn. Điều này không chỉ nâng cao năng suất mà còn mở ra những ranh giới mới trong việc phân tích dữ liệu và ra quyết định theo thời gian thực

Tác động đến nghiên cứu khoa học

Một cuộc trao đổi với một phòng thí nghiệm hiện đang chạy các mô phỏng tương tự trên phần cứng đã 10 năm tuổi đã mang lại một sự tương phản rõ rệt. Thiết lập hiện tại của họ mất 24 giờ để hoàn thành những gì Dell T560 có thể đạt được chỉ trong vài phút. Sự so sánh này không chỉ làm nổi bật những tiến bộ của các bộ vi xử lý hiện đại mà còn cho thấy giá trị mà phần cứng hiện nay có thể mang lại cho nghiên cứu khoa học.

DALL·E 2023-11-03 15.08.18 - Photo depicting a high-powered computational simulation of molecular dynamics with a focus on GROMACS. The image shows a complex 3D molecular structure

Với máy chủ tháp Dell T560, các nhà nghiên cứu có thể thực hiện nhiều thử nghiệm hơn trong khung thời gian ngắn hơn, cải thiện chu trình lặp lại giữa giả thuyết và thử nghiệm vốn là trọng tâm của tiến bộ khoa học. Điều này có nghĩa là các thử nghiệm tính toán từng được coi là quá tốn kém tài nguyên để thăm dò thường xuyên thì nay đã trở nên khả thi.

Ứng dụng AI của hiệu suất tính toán

Hiệu suất tính toán được thể hiện bởi Dell T560 có những tác động sâu rộng trong lĩnh vực nghiên cứu. Nó không chỉ đơn thuần là về tốc độ mà còn về độ phức tạp và quy mô của các vấn đề hiện có thể giải quyết được. Các mô phỏng quy mô lớn mô hình hóa toàn bộ hệ sinh thái sinh học, các phản ứng hóa học phức tạp hoặc thậm chí là các mô hình sinh thái trở nên khả thi hơn với loại sức mạnh tính toán này.

Với sự ra đời của AI và học máy, thông lượng cao của các mô phỏng động lực học phân tử cho phép tạo ra các tập dữ liệu khổng lồ cần thiết để huấn luyện các mô hình tinh vi. Những mô hình này có thể dẫn đến những đột phá trong sinh học dự đoán, vật liệu mới và hóa học tính toán thế hệ tiếp theo.

Kết luận

Máy chủ tháp Dell PowerEdge T560 mang lại sự linh hoạt đáng kinh ngạc cho nhu cầu sử dụng máy chủ thông thường cũng như các tác vụ nâng cao hoặc chuyên dụng, bao gồm GPU, tính toán và khoa học dữ liệu. Nó tương đương, và ở một số khía cạnh còn vượt trội hơn các máy chủ dạng rack về khả năng mở rộng và sức mạnh, với hai bộ xử lý Intel Xeon Scalable “Sapphire Rapids”, 1TB RAM, nhiều cấu hình ổ lưu trữ và hỗ trợ đa GPU, nhưng thiết kế dạng tháp của nó lại không yêu cầu một trung tâm dữ liệu. Mặc dù rõ ràng là không hoàn toàn im lặng tùy thuộc vào khối lượng công việc, nhưng quạt của máy đủ yên tĩnh để có thể sử dụng trong môi trường văn phòng.

Dell PowerEdge T560 Tower - Nvidia L4s

Quá trình thử nghiệm của chúng tôi đã chạm đến mọi khía cạnh khả năng của PowerEdge T560; nó cho thấy những con số vững chắc trong các bài kiểm tra lưu trữ và CPU, đồng thời phô diễn sức mạnh trong các bài kiểm tra GPU với cấu hình đặc biệt gồm năm GPU NVIDIA L4. Chúng tôi cũng đánh giá cao khả năng bảo trì đơn giản của dòng máy tháp này. Với khả năng mở rộng đáng khen ngợi và khả năng thích ứng ngay cả với những khối lượng công việc AI khắt khe nhất.

__________________________________________________
📞 Liên hệ Megacore để được tư vấn cấu hình phù hợp và giải pháp hạ tầng cho doanh nghiệp – hoàn toàn miễn phí
🌐 Website: megacore.net
📧 Email: [email protected]
📲 Hotline: 0345 888 868
Cảm ơn bạn đã tin tưởng và lựa chọn sản phẩm của Megacore. Chúng tôi cam kết mang đến cho bạn những sản phẩm chất lượng và dịch vụ tốt nhất!

 

Công nghệ đột phá
dễ dàng nâng cấp

Đây là công nghệ cốt lõi được tin dùng bởi các ông lớn công nghệ toàn cầu như IBM, Cisco, Dell, HP, Red Hat … Nhờ đó, dịch vụ thuê VPS tại Megacore luôn đảm bảo hiệu suất cao, ổn định và đáng tin cậy, đáp ứng nhu cầu lưu trữ và vận hành hệ thống của doanh nghiệp mọi quy mô.

Bắt đầu chỉ với
399.000đ/tháng