Phòng tránh các vấn đề trong xây dựng trung tâm dữ liệu

19/10/2019

Lời tòa soạn. Với xu hướng công nghệ phát triển và thay đổi nhanh, việc xây dựng và vận hành một hệ thống lưu trữ và xử lý dữ liệu quy mô lớn, hay còn gọi là trung tâm dữ liệu (TTDL - data center) trước sự bùng nổ dữ liệu hiện nay, là việc vô cùng cần thiết trong các tổ chức, doanh nghiệp, và đặc biệt quan trọng đối các tập đoàn lớn hoạt động trong nhiều lĩnh vực.

Chính từ lý do này, nhiều dự án xây dựng TTDL đã và đang được triển khai, vận hành. Với đặc thù riêng, xây dựng TTDL là công việc phức tạp và đòi hỏi chuyên môn rất cao, về cả công nghệ và quy trình, phương pháp triển khai.

Ban biên tập PC World Vietnam chia sẻ bài dịch của kỹ sư Bùi Tuấn Việt, đang làm việc tại Viettel, đơn vị sở hữu nhiều trung tâm dữ liệu đạt chuẩn quốc tế Tier 3 (như TTDL Bình Dương, TTDL Hòa Lạc, TTDL Hoàng Hoa Thám, TTDL Pháp Vân, TTDL Đà Nẵng của Viettel IDC) - trong việc xây dựng một TTDL, từ khâu tư vấn, thiết kế, triển khai và nghiệm thu.  

Theo kinh nghiệm của Viện Uptime (tổ chức tư vấn độc lập về xây dựng cơ sở hạ tầng cho doanh nghiệp) qua việc kiểm chứng hơn 550 trung tâm dữ liệu tại 65 quốc gia, các vấn đề trong việc xây dựng sẽ gây ra hậu quả về trong vận hành khai thác TTDL kém và có các đặc tính sau:

  • Tích hợp kém trong các hệ thống phức tạp.
  • Thiếu thông tin xuyên suốt hay lịch trình thử nghiệm bị co lại.
  • Thiết kế thay đổi.
  • Sự thay thế của vật liệu hay sản phẩm/thiết bị.

Các vấn đề này tăng lên trong suốt quá trình xây dựng, thử nghiệm và thậm chí ngay cả khi đã đưa vào khai thác và có thể ảnh hưởng đến chi phí, tiến độ triển khai và hoạt động CNTT. Các vấn đề về xây dựng thường xảy ra do quy trình quản lý thay đổi kém, các nhóm dự án không có kinh nghiệm, mục tiêu nhắm tới của các thành viên tham gia không giống nhau, hoặc thiếu đánh giá cẩn trọng của bên thứ 3.

Sai sót trong lập kế hoạch, hoạch định ngân sách và giám sát có thể làm cho hệ thống hạ tầng không đạt đươc mong muốn của chủ đầu tư (CĐT), dẫn tới việc phải kéo dài thêm thời gian triển khai hoặc tăng ngân sách để giải quyết vấn đề.

Chỉ định một đại diện của chủ đầu tư

Thông thường, mục tiêu của CĐT khác nhiều so với mục tiêu của nhà xây dựng (NXD). CĐT muốn việc xây dựng TTDL có mức phù hợp về chi phí, thời gian và nhu cầu khai thác thương mại tổng thể, bao gồm cả độ sẵn sàng của hệ thống. NXD thì muốn đạt được mức phù hợp về ngân sách dự án và yêu cầu về tiến độ trong mức dự phòng chi phí của dự án. Độ sẵn sàng của TTDL và mức vận hành khai thác thường nằm ngoài phạm vi của NXD và thẩm định.

Yêu cầu bắt buộc của CĐT là phải nắm quyền kiểm soát nhằm hạn chế khả năng thay đổi của nhà thầu về chi phí nhân công và vật liệu, thiết bị sẵn có, yêu cầu của địa phương, giúp nhà thầu tiết kiệm tiền và xây dựng theo tiến độ nhưng lại không đạt thỏa hiệp về độ sẵn sàng và độ tin cậy của TTDL .

Chủ đầu tư TTDL phải chỉ định một đại diện có kinh nghiệm để kiểm soát, đánh giá nhà thầu về năng lực, kinh nghiệm, khả năng điều hành và truyền thông, tránh rủi ro về việc không đảm bảo chất lượng và thỏa hiệp trong thiết kế.

Trên thực tế, nhà thầu có thể triển khai dự án bằng cách thực hiện các công việc không theo tuần tự. Hậu quả của cách làm này là thường phải thực hiện lại, làm nặng thêm các vấn đề về tiến độ dự án. Ví dụ như việc lấy sai không gian được cấp phát cho các hệ thống khác nên phải sửa lại.

Không nên thỏa hiệp cho phép cắt ngắn thời gian thử nghiệm vì lý do tiến độ chậm trễ. Tiền phạt cho việc chậm trễ trong xây dựng hợp đồng là một giải pháp nên được cân nhắc.

Đánh giá kỹ thuật

Đánh giá kỹ thuật (Value Engineering - VE) thường được CĐT chấp nhận trong xây dựng thực tế để giảm các chi phí khi xây dựng từ một bản thiết kế hoàn chỉnh. Quy trình VE có lợi nhưng lại có xu hướng chỉ tập trung vào các chi phí ban đầu trong xây dựng (CAPEX). Việc thay đổi thường được dẫn ra bởi nhà thầu. Thực tế có nhiều tiếng xấu bởi nhà thiết kế (NTK) thường dẫn tới sự thay đổi nhằm thỏa hiệp với ý định thiết kế. Các nhà thiết kế khác tin rằng với những nhà xây dựng đã được đánh giá tốt thì VE hay thậm chí VE bên trong các TTDL vẫn có thể tiết kiệm lớn cho Chủ đầu tư mà không ảnh hưởng đến độ tin cậy, độ sẵn sàng hay mức vận hành khai thác của hệ thống.

Hình 1: Ví dụ cho 1 thiết kế được cấp chứng chỉ đạt chuẩn Tier 3

Hình 2: Ví dụ về xây dựng 1 hệ thống đã qua VE. Chú ý chỉ có 1 van giữa các phần tử thay vì 2 van như hình 1


Nếu VE được thực hiện mà thiếu thông tin từ phía vận hành khai thác và đánh giá thiết kế, thì bất cứ sự thay đổi nào từ VE nhằm tiết kiệm chi phí có thể đi quá xa so với việc khắc phục hậu quả để khôi phục các chức năng cần thiết đạt được “Concurrent Maintainability” hay “Fault Tolerance” và tăng chi phí vận hành khai thác trong suốt vòng đời của TTDL.

Ví dụ về sự thay đổi của VE sai:Uptime tin rằng Chủ đầu tư TTDL cần phải lo lắng về các thay đổi từ VE mà làm chệch hướng mục tiêu của dự án hay ý định thiết kế. Tiết kiệm chi phí có thể không cần thiết nếu kết quả thay đổi từ VE làm thay đổi đáng kể thiết kế. Do vậy mỗi thay đổi phải được xem xét kỹ lưỡng và đánh giá ảnh hưởng của nó đến thiết kế. Giữ lại kỹ sư thiết kế ban đầu hay kỹ sư dự án có kinh nghiệm về TTDL sẽ làm giảm sự thay đổi không hợp lý trong suốt quá trình triển khai. Nhà thầu có thể thay đổi các thiết bị có giá thành thấp khác về dung lượng, phương thức điều khiển, độ chính xác hay tiêu chuẩn mà không nhận ra ảnh hưởng đến độ tin cậy.

  • Tối thiểu các van ngắt nước cần thiết cho “Concurrent Maintainability”
  • Giảm số lượng ATS (Automatic Transfer Switches) bằng việc tập trung thiết bị trên 1 ATS.
  • Triển khai trên 1 bảng điện có sẵn thay vì 2 bảng điện để phù hợp với “Fault Tolerence”.
  • Tích hợp các hệ thống giám sát năng lượng và đo hiệu quả năng lượng theo 1 cách sẽ không cho phép đạt mức vận hành khai thác “Concurrent Maintainability” hay “Fault Tolerance”.

Ghi chú:

Đủ thời gian cho vận hành thử nghiệm

Các vướng mắc do chậm trễ trong xây dựng thỉnh thoảng là kết quả việc không đủ thời gian cho quá trình test ở mức 4 và mức 5. Các nhóm xây dựng không có đủ kinh nghiệm rất dễ mắc phải lỗi này.

Không thể nói rằng NXD không đóng góp vào các vấn đề này với kiểu làm việc theo thời hạn chót và thời gian vận hành được dùng như khoảng đệm khi các công việc triển khai trễ hơn dự kiến. Do cả 2 lý do trên nên CĐT và đại diện CĐT phải kiểm soát thời gian biểu một cách chính xác cho thử nghiệm và đảm bảo rằng nhà thầu phải hoàn thành nhanh hơn tiến độ cho thời hạn chót. Đây là việc rất quan trọng.

Hơn nữa, chi phí đầu tư TTDL có thể không phù hợp với các nhóm thiếu kinh nghiệm trong nhiệm vụ ở môi trường khắc nghiệt, phát sinh những yêu cầu làm ảnh hưởng đến ngân sách.

Ví dụ, CĐT và đại diện CĐT phải rà soát các gói thầu xây dựng để đảm bảo có nguồn tiền và thời gian cho:

  • Kiểm tra chứng thực theo điều kiện nhà máy cho các thiết bị quan trọng.
  • Mở rộng thử nghiệm đưa vào khai thác mức 4 và mức 5 kèm theo hỗ trợ từ nhà cung cấp.
  • Thử tải giả lập ở mức đầy tải định mức trong môi trường khắc nghiệt.
  • Thử dầu diesel và đánh giá hệ thống các máy phát điện.

Các ví dụ về lỗi trong xây dựng TTDL

Các lỗi nghiêm trọng có thể xảy ra bất cứ lúc nào trong quá trình xây dựng, bao gồm cả quá trình đấu thầu. Ví dụ, chủ đầu tư cố gắng giảm chi phí tốt đa cho UPS nhưng lại không thành công trong việc đặt hàng thanh dẫn và các phần tử khác kết nối đến UPS.

Một ví dụ khác: cân nhắc việc một nhà cung cấp trúng thầu dựa trên chi phí vận chuyển máy phát điện đã lắp đặt hoàn thiện xa hơn 800 dặm (1.287,5km). Khi nhà cung cấp đe dọa không hỗ trợ bảo hành sản phẩm, nhà thầu đã buộc phải thêm 1 khoản chi phí đáng kể để vận chuyển máy phát điện theo cách thông thường. Trong trường hợp này, chủ đầu tư có thể phải khôn khéo theo dõi chặt chẽ khi nhà thầu cố gắng bù lại chi phí bằng thay đổi thiết kế hoặc các thiết bị quan trọng khác.

Trong trường hợp khác, một nhà thầu ở Mỹ La-tinh đã không muốn làm theo điều khoản của hợp đồng. Nhà thầu đã thực hiện thay đổi không được sự phê chuẩn chính thức nhưng lại được phê duyệt bởi kỹ sư địa phương. Cho đến khi một kỹ sư dự án có kinh nghiệm được thuê bởi CĐT chỉ ra sự khác nhau thì mới đấu tranh bắt nhà thầu thực hiện sửa lỗi.

Trong việc này, kỹ sư dự án đã không biết nhượng bộ nhà thầu, nhưng do thiếu kinh nghiệm anh ta đã đệ trình gói thầu có mức ứng dụng thực tế thấp tại địa phương.

Phòng tránh các vấn đề trong xây dựng

Một khi thiết kế đã được quyết định và phù hợp với yêu cầu cho dự án của chủ đầu tư, các quy trình điều khiển thay đổi (change control processes) là cần thiết nhằm quản lý hiệu quả và giảm rủi ro trong quá trình xây dựng. Do nhiều nguyên nhân, nhiều NXD, và thậm chí chủ đầu tư, có thể không quen với điều khiển quy trình thay đổi quan trọng (important change process control) khi nó liên quan tới dự án TTDL. Không có dự án nào hoàn toàn không có lỗi; tuy nhiên quy trình và tài liệu tốt sẽ giảm số lượng lỗi nghiêm trọng và có mắc lỗi thì cũng dễ dàng xử lý hơn. Uptime khuyến nghị bất cứ dự án TTDL cũng cần làm các bước sau để tránh xảy ra lỗi và các vấn đề phát sinh trong quá trình xây dựng.

Tập hợp nhóm thiết kế, xây dựng, và quản lý dự án có kinh nghiệm về TTDL. Nếu cần, hãy thuê chuyên gia bên ngoài vào làm để tập trung vào yêu cầu cho dự án của chủ đầu tư. Hãy nhớ rằng nhóm CNTT có thể không hiểu rủi ro về tiến độ thời gian hay tính phức tạp của dự án. Các nhóm có kinh nghiệm có thể sẽ lùi tiến độ kế hoạch thời gian hay đề nghị VE không phù hợp với yêu cầu cho dự án, nhưng điều này tránh rủi ro và đảm bảo cho khả năng khai thác sau này, có có lợi cho chủ đầu tư. Chi phí ban đầu có thể cao hơn nhưng các sẽ mang lại hiệu quả thu hồi vốn (ROI- Return of Investment) cao hơn.

Do các nhóm có kinh nghiệm hiểu được sự quan trọng của Cx (commissioning agency) riêng biệt, nhân viên thử nghiệm đưa vào sử dụng sẽ làm việc có hiệu quả hơn rất sớm trong quy trình, cài đặt trạng thái để chuyển giao cho khai thác. Các yêu cầu về Cx và tập trung trên chức năng sẽ rõ ràng ngay lúc ban đầu.

Thêm nữa, nhóm khai thác nên tham gia cùng nhóm thiết kế và xây dựng TTDL ngay khi bắt đầu dự án. Đưa cả khai thác vào quản lý thay đổi (change management) sẽ giúp họ cơ hội chia sẻ thông tin, học được cách TTDL sẽ vận hành như thế nào, các điểm cần đặt ra chính yếu, luân chuyển thiết bị, quản lý thay đổi, đào tạo, và quản lý thiết bị/vật tư dự phòng – đây là nhu cầu cần thiết hằng ngày cho khai thác và xử lý khi có sự cố.

Cuối cùng, nhà cung cấp nên có nhân sự trong nhóm xây dựng TTDL, nhưng hầu như chỉ trên định nghĩa giấy tờ vì các mối quan tâm của họ và của chủ đầu tư sẽ không cùng 1 hướng.

Kết hợp nhóm kinh nghiệm chỉ mang lại lợi ích khi họ làm việc như một nhóm. Chủ đầu tư và đại diện CĐT có thể khuyến khích sự phối hợp giữa các thành viên trong nhóm có các mối quan tâm khác nhau, đóng góp ý kiến với NTK, kỹ thuật dự án, và NXD để đạt mức tối ưu cho dự án. Nhiều chuyên gia về TTDL thấy rằng quy trình thiết kế - xây dựng hay thiết kế - thầu – xây dựng sử dụng giá an toàn tối đa (GMP – Guaranteed Maximum Price) và chia sẻ chi phí tiết kiệm của hợp đồng được dùng để phát triển một nhóm chuyên môn khi như mong muốn.

Đánh giá của đơn vị thứ 3 có thể đảm bảo với CĐT là dự án được chuyển giao đúng với yêu cầu. Uptime có bằng chứng việc đánh giá của đơn vị thứ 3 sẽ đảm bảo khả năng làm việc của nhà thầu tốt hơn,có lẽ bởi việc đánh giá tăng khả năng tìm thấy các điểm thiếu hay bị cắt bỏ và sửa đổi cho chi phí của nhà thầu. Uptime không cho rằng tất cả nhà thầu đều tham gia vào từng công việc nhưng xét về logic thì việc đánh giá này có thể làm các nhà thầu chú ý hơn về “thông dịch ngôn ngữ hợp đồng” và làm những thay đổi mà những kỹ sư dự án không có kinh nghiệm và đại diện nhà thầu không phát hiện ra.

Chứng nhận và kiểm tra chỉ hiệu quả khi không có thiên vị, từ một đơn vị không liên quan đến nhà thầu. Nhiều chứng nhận trên thương trường không đạt được yêu cầu này. Một vài quy trình chứng nhận và kiểm tra chỉ có giá trị hơn một chút so với con dấu đóng đã kiểm tra chất lượng. Những cái còn lại chỉ là kiểu kiểm tra danh mục mà không có thực nghiệm kiểm tra lỗi.

Ví dụ như nhân viên thử nghiệm cần hoạt động độc lập và không phải là NTK hay kỹ sư dự án. Hơn nữa nhóm Cx nên có kinh nghiệm nhiều về TTDL. Nhân viên thử nghiệm nên tập trung vào thiết kế và lắp đặt theo như dự án, chỉ nên chuyên sâu đúng mức vào chức năng kiểm tra và chứng nhận. Cũng nên lưu ý rằng, nếu lỗi trong quá trình thử nghiệm không được chỉ ra và định rõ, nó sẽ có khả năng lặp lại trong quá trình khai thác.

Kiểm tra và chứng nhận của đơn vị thứ 3 được đánh giá ngang hàng về thay đổi thiết kế và VE.

Lấy chứng nhận Tier sai thời gian để tìm ra lỗi

Theo Uptime, quy trình lấy chứng chỉ Tier không phải là thời gian phù hợp để tìm ra lỗi trong thiết kế và xây dựng hay tìm ra hạ tầng không đạt “Concurrently Maintainable” hay “Fault Tolerant”. Thực tế đã cảnh báo rằng trong quy trình lấy chứng chỉ Tier, việc sửa lỗi là tốn chi phí nhất.

Trong vấn đề này, số lượng lỗi được phát hiện trong quá trình thử nghiệm và chứng nhận Tier chỉ ra được giá trị của việc đánh giá của bên thứ 3 về thiết kế và xây dựng hạ tầng. Bằng việc tìm ra các vấn đề, đánh giá của bên thứ 3 cứu cho công ty những sự cố tiềm tàng.

Hơn nữa, Uptime tin rằng quy trình xây dựng được tổ chức tốt, bao gồm thử nghiệm đưa vào khai thác mức 4 và mức 5 độc lập và chứng nhận Tier, kiểm tra và tìm lỗi ở mức sớm nhất có thể và tối thiểu việc nhà thầu giải trình hay tối thiểu nhu cầu cho việc sửa lỗi khi xây dựng lệch so với thiết kế ban đầu.

Hình ảnh bên trong một trung tâm dữ liệu xây dựng theo tiêu chuẩn Tier 3 tại Viettel IDC

Bùi Tuấn Việt – ATD – Uptime – SE – VTNet
tuanviet.bui@gmail.com
Lược dịch theo tạp chí Uptime Institue Volume 5: Design and Technology

 

Tin liên quan

16/04/2024

Viettel khai trương trung tâm dữ liệu lớn nhất Việt Nam, triển khai công nghệ xanh, sẵn sàng cho phát triển AI

Tập đoàn Công nghiệp – Viễn thông Quân đội (Viettel) khai trương Trung tâm dữ liệu Viettel Hoà Lạc với công suất 30MW, lớn nhất tại Việt Nam.

07/04/2024

SQL Injection là gì? Tìm hiểu chi tiết về mối đe dọa tiềm ẩn của mọi website

Việc hiểu biết rõ về SQL Injection là gì cũng như nắm bắt được các biện pháp phòng ngừa, cách thức khắc phục là vô cùng quan trọng để bảo vệ trang web và dữ liệu của bạn khỏi những mối đe dọa này.

15/04/2024

Bật mí 5 giải pháp tăng cường sức mạnh chống Ransomware cho doanh nghiệp

Để bảo vệ dữ liệu và hệ thống an toàn, sẵn sàng trước những sự cố tấn công dữ liệu bất ngờ có thể xảy ra, hãy cùng Viettel IDC điểm qua 5 giải pháp phòng chống Ransomware đáng lưu tâm cho doanh nghiệp với bài viết sau.

01/04/2024

Generative AI: Cách mạng mới của trí tuệ nhân tạo

Trí tuệ nhân tạo (AI) đã trở thành một trong những chủ đề nóng hổi nhất được quan tâm và nghiên cứu hiện nay. Tuy nhiên, không phải ai cũng biết về một nhánh con của AI có tên là Generative AI, còn gọi là trí tuệ nhân tạo tạo sinh. Trong bài viết này, Viettel IDC sẽ giúp bạn hiểu rõ hơn về AI tạo sinh, tại sao giải pháp lại quan trọng và những ứng dụng tiềm năng trong thực tế.

03/04/2024

Những ứng dụng tiềm năng của mạng 5G trong tương lai

Với khả năng kết nối hàng tỷ thiết bị, truyền tải lượng dữ liệu khổng lồ, mạng 5G mở ra tiềm năng cho vô số ứng dụng mới và cách mạng nhiều ngành công nghiệp khác nhau.

08/04/2024

Bí quyết phòng chống tấn công Ransomware hiệu quả cho doanh nghiệp

Tấn công Ransomware đang diễn biến nhanh chóng, phức tạp với các phương thức ngày càng tinh vi và mức độ thiệt hại cũng ngày càng lớn. Chính vì thế, doanh nghiệp cần chủ động và thực hiện các biện pháp phòng chống ransomware toàn diện để bảo vệ dữ liệu quan trọng, ngăn chặn gián đoạn hoạt động và duy trì lòng tin của khách hàng.

07/01/2024

XSS là gì? Cách kiểm tra và ngăn chặn các đợt tấn công XSS hiệu quả

XSS là gì? XSS (Cross-site Scripting) là một lỗ hổng bảo mật cho phép kẻ tấn công chèn mã độc hại vào các ứng dụng website.

18/11/2023

Ransomware là gì? Khám phá chi tiết về giải pháp phòng chống mã độc chuyên dụng

Phương pháp ẩn mình của ransomware thường liên quan đến các email độc hại, trang web giả mạo hoặc lợi dụng các lỗ hổng bảo mật. Bất kỳ ai cũng đều có thể trở thành nạn nhân của vấn nạn này. Do đó, việc tăng cường biện pháp an ninh và nâng cao nhận thức về an toàn thông tin sẽ rất quan trọng. Hãy cùng Viettel IDC khám phá thêm thông tin trong bài viết này.

31/03/2024

Dịch vụ sao lưu dữ liệu đám mây của Viettel IDC: Lựa chọn tối ưu cho doanh nghiệp

Mất dữ liệu có thể gây ra những hậu quả nghiêm trọng, bao gồm tổn thất về tài chính, danh tiếng và sự tin tưởng của khách hàng. Để đối phó với những rủi ro này, dịch vụ sao lưu dữ liệu đám mây của Viettel IDC là lựa chọn đáng tin cậy hàng đầu cho mọi doanh nghiệp.

10/11/2023

Tấn công DDoS là gì? Cách phát hiện và ứng phó với cuộc tấn công DDoS

Trong thời đại công nghệ hiện nay, mạng xã hội kỹ thuật số đã mở ra nhiều cơ hội nhưng cũng hình thành những rủi ro, trong đó có thể kể đến tấn công DDoS.

DMCA.com Protection Status
// doi link