Phòng tránh các vấn đề trong xây dựng trung tâm dữ liệu

Lời tòa soạn. Với xu hướng công nghệ phát triển và thay đổi nhanh, việc xây dựng và vận hành một hệ thống lưu trữ và xử lý dữ liệu quy mô lớn, hay còn gọi là trung tâm dữ liệu (TTDL - data center) trước sự bùng nổ dữ liệu hiện nay, là việc vô cùng cần thiết trong các tổ chức, doanh nghiệp, và đặc biệt quan trọng đối các tập đoàn lớn hoạt động trong nhiều lĩnh vực.

Chính từ lý do này, nhiều dự án xây dựng TTDL đã và đang được triển khai, vận hành. Với đặc thù riêng, xây dựng TTDL là công việc phức tạp và đòi hỏi chuyên môn rất cao, về cả công nghệ và quy trình, phương pháp triển khai.

Ban biên tập PC World Vietnam chia sẻ bài dịch của kỹ sư Bùi Tuấn Việt, đang làm việc tại Viettel, đơn vị sở hữu nhiều trung tâm dữ liệu đạt chuẩn quốc tế Tier 3 (như TTDL Bình Dương, TTDL Hòa Lạc, TTDL Hoàng Hoa Thám, TTDL Pháp Vân, TTDL Đà Nẵng của Viettel IDC) - trong việc xây dựng một TTDL, từ khâu tư vấn, thiết kế, triển khai và nghiệm thu.  

Theo kinh nghiệm của Viện Uptime (tổ chức tư vấn độc lập về xây dựng cơ sở hạ tầng cho doanh nghiệp) qua việc kiểm chứng hơn 550 trung tâm dữ liệu tại 65 quốc gia, các vấn đề trong việc xây dựng sẽ gây ra hậu quả về trong vận hành khai thác TTDL kém và có các đặc tính sau:

  • Tích hợp kém trong các hệ thống phức tạp.
  • Thiếu thông tin xuyên suốt hay lịch trình thử nghiệm bị co lại.
  • Thiết kế thay đổi.
  • Sự thay thế của vật liệu hay sản phẩm/thiết bị.

Các vấn đề này tăng lên trong suốt quá trình xây dựng, thử nghiệm và thậm chí ngay cả khi đã đưa vào khai thác và có thể ảnh hưởng đến chi phí, tiến độ triển khai và hoạt động CNTT. Các vấn đề về xây dựng thường xảy ra do quy trình quản lý thay đổi kém, các nhóm dự án không có kinh nghiệm, mục tiêu nhắm tới của các thành viên tham gia không giống nhau, hoặc thiếu đánh giá cẩn trọng của bên thứ 3.

Sai sót trong lập kế hoạch, hoạch định ngân sách và giám sát có thể làm cho hệ thống hạ tầng không đạt đươc mong muốn của chủ đầu tư (CĐT), dẫn tới việc phải kéo dài thêm thời gian triển khai hoặc tăng ngân sách để giải quyết vấn đề.

Chỉ định một đại diện của chủ đầu tư

Thông thường, mục tiêu của CĐT khác nhiều so với mục tiêu của nhà xây dựng (NXD). CĐT muốn việc xây dựng TTDL có mức phù hợp về chi phí, thời gian và nhu cầu khai thác thương mại tổng thể, bao gồm cả độ sẵn sàng của hệ thống. NXD thì muốn đạt được mức phù hợp về ngân sách dự án và yêu cầu về tiến độ trong mức dự phòng chi phí của dự án. Độ sẵn sàng của TTDL và mức vận hành khai thác thường nằm ngoài phạm vi của NXD và thẩm định.

Yêu cầu bắt buộc của CĐT là phải nắm quyền kiểm soát nhằm hạn chế khả năng thay đổi của nhà thầu về chi phí nhân công và vật liệu, thiết bị sẵn có, yêu cầu của địa phương, giúp nhà thầu tiết kiệm tiền và xây dựng theo tiến độ nhưng lại không đạt thỏa hiệp về độ sẵn sàng và độ tin cậy của TTDL .

Chủ đầu tư TTDL phải chỉ định một đại diện có kinh nghiệm để kiểm soát, đánh giá nhà thầu về năng lực, kinh nghiệm, khả năng điều hành và truyền thông, tránh rủi ro về việc không đảm bảo chất lượng và thỏa hiệp trong thiết kế.

Trên thực tế, nhà thầu có thể triển khai dự án bằng cách thực hiện các công việc không theo tuần tự. Hậu quả của cách làm này là thường phải thực hiện lại, làm nặng thêm các vấn đề về tiến độ dự án. Ví dụ như việc lấy sai không gian được cấp phát cho các hệ thống khác nên phải sửa lại.

Không nên thỏa hiệp cho phép cắt ngắn thời gian thử nghiệm vì lý do tiến độ chậm trễ. Tiền phạt cho việc chậm trễ trong xây dựng hợp đồng là một giải pháp nên được cân nhắc.

Đánh giá kỹ thuật

Đánh giá kỹ thuật (Value Engineering - VE) thường được CĐT chấp nhận trong xây dựng thực tế để giảm các chi phí khi xây dựng từ một bản thiết kế hoàn chỉnh. Quy trình VE có lợi nhưng lại có xu hướng chỉ tập trung vào các chi phí ban đầu trong xây dựng (CAPEX). Việc thay đổi thường được dẫn ra bởi nhà thầu. Thực tế có nhiều tiếng xấu bởi nhà thiết kế (NTK) thường dẫn tới sự thay đổi nhằm thỏa hiệp với ý định thiết kế. Các nhà thiết kế khác tin rằng với những nhà xây dựng đã được đánh giá tốt thì VE hay thậm chí VE bên trong các TTDL vẫn có thể tiết kiệm lớn cho Chủ đầu tư mà không ảnh hưởng đến độ tin cậy, độ sẵn sàng hay mức vận hành khai thác của hệ thống.

Hình 1: Ví dụ cho 1 thiết kế được cấp chứng chỉ đạt chuẩn Tier 3

Hình 2: Ví dụ về xây dựng 1 hệ thống đã qua VE. Chú ý chỉ có 1 van giữa các phần tử thay vì 2 van như hình 1


Nếu VE được thực hiện mà thiếu thông tin từ phía vận hành khai thác và đánh giá thiết kế, thì bất cứ sự thay đổi nào từ VE nhằm tiết kiệm chi phí có thể đi quá xa so với việc khắc phục hậu quả để khôi phục các chức năng cần thiết đạt được “Concurrent Maintainability” hay “Fault Tolerance” và tăng chi phí vận hành khai thác trong suốt vòng đời của TTDL.

Ví dụ về sự thay đổi của VE sai:Uptime tin rằng Chủ đầu tư TTDL cần phải lo lắng về các thay đổi từ VE mà làm chệch hướng mục tiêu của dự án hay ý định thiết kế. Tiết kiệm chi phí có thể không cần thiết nếu kết quả thay đổi từ VE làm thay đổi đáng kể thiết kế. Do vậy mỗi thay đổi phải được xem xét kỹ lưỡng và đánh giá ảnh hưởng của nó đến thiết kế. Giữ lại kỹ sư thiết kế ban đầu hay kỹ sư dự án có kinh nghiệm về TTDL sẽ làm giảm sự thay đổi không hợp lý trong suốt quá trình triển khai. Nhà thầu có thể thay đổi các thiết bị có giá thành thấp khác về dung lượng, phương thức điều khiển, độ chính xác hay tiêu chuẩn mà không nhận ra ảnh hưởng đến độ tin cậy.

  • Tối thiểu các van ngắt nước cần thiết cho “Concurrent Maintainability”
  • Giảm số lượng ATS (Automatic Transfer Switches) bằng việc tập trung thiết bị trên 1 ATS.
  • Triển khai trên 1 bảng điện có sẵn thay vì 2 bảng điện để phù hợp với “Fault Tolerence”.
  • Tích hợp các hệ thống giám sát năng lượng và đo hiệu quả năng lượng theo 1 cách sẽ không cho phép đạt mức vận hành khai thác “Concurrent Maintainability” hay “Fault Tolerance”.

Ghi chú:

Đủ thời gian cho vận hành thử nghiệm

Các vướng mắc do chậm trễ trong xây dựng thỉnh thoảng là kết quả việc không đủ thời gian cho quá trình test ở mức 4 và mức 5. Các nhóm xây dựng không có đủ kinh nghiệm rất dễ mắc phải lỗi này.

Không thể nói rằng NXD không đóng góp vào các vấn đề này với kiểu làm việc theo thời hạn chót và thời gian vận hành được dùng như khoảng đệm khi các công việc triển khai trễ hơn dự kiến. Do cả 2 lý do trên nên CĐT và đại diện CĐT phải kiểm soát thời gian biểu một cách chính xác cho thử nghiệm và đảm bảo rằng nhà thầu phải hoàn thành nhanh hơn tiến độ cho thời hạn chót. Đây là việc rất quan trọng.

Hơn nữa, chi phí đầu tư TTDL có thể không phù hợp với các nhóm thiếu kinh nghiệm trong nhiệm vụ ở môi trường khắc nghiệt, phát sinh những yêu cầu làm ảnh hưởng đến ngân sách.

Ví dụ, CĐT và đại diện CĐT phải rà soát các gói thầu xây dựng để đảm bảo có nguồn tiền và thời gian cho:

  • Kiểm tra chứng thực theo điều kiện nhà máy cho các thiết bị quan trọng.
  • Mở rộng thử nghiệm đưa vào khai thác mức 4 và mức 5 kèm theo hỗ trợ từ nhà cung cấp.
  • Thử tải giả lập ở mức đầy tải định mức trong môi trường khắc nghiệt.
  • Thử dầu diesel và đánh giá hệ thống các máy phát điện.

Các ví dụ về lỗi trong xây dựng TTDL

Các lỗi nghiêm trọng có thể xảy ra bất cứ lúc nào trong quá trình xây dựng, bao gồm cả quá trình đấu thầu. Ví dụ, chủ đầu tư cố gắng giảm chi phí tốt đa cho UPS nhưng lại không thành công trong việc đặt hàng thanh dẫn và các phần tử khác kết nối đến UPS.

Một ví dụ khác: cân nhắc việc một nhà cung cấp trúng thầu dựa trên chi phí vận chuyển máy phát điện đã lắp đặt hoàn thiện xa hơn 800 dặm (1.287,5km). Khi nhà cung cấp đe dọa không hỗ trợ bảo hành sản phẩm, nhà thầu đã buộc phải thêm 1 khoản chi phí đáng kể để vận chuyển máy phát điện theo cách thông thường. Trong trường hợp này, chủ đầu tư có thể phải khôn khéo theo dõi chặt chẽ khi nhà thầu cố gắng bù lại chi phí bằng thay đổi thiết kế hoặc các thiết bị quan trọng khác.

Trong trường hợp khác, một nhà thầu ở Mỹ La-tinh đã không muốn làm theo điều khoản của hợp đồng. Nhà thầu đã thực hiện thay đổi không được sự phê chuẩn chính thức nhưng lại được phê duyệt bởi kỹ sư địa phương. Cho đến khi một kỹ sư dự án có kinh nghiệm được thuê bởi CĐT chỉ ra sự khác nhau thì mới đấu tranh bắt nhà thầu thực hiện sửa lỗi.

Trong việc này, kỹ sư dự án đã không biết nhượng bộ nhà thầu, nhưng do thiếu kinh nghiệm anh ta đã đệ trình gói thầu có mức ứng dụng thực tế thấp tại địa phương.

Phòng tránh các vấn đề trong xây dựng

Một khi thiết kế đã được quyết định và phù hợp với yêu cầu cho dự án của chủ đầu tư, các quy trình điều khiển thay đổi (change control processes) là cần thiết nhằm quản lý hiệu quả và giảm rủi ro trong quá trình xây dựng. Do nhiều nguyên nhân, nhiều NXD, và thậm chí chủ đầu tư, có thể không quen với điều khiển quy trình thay đổi quan trọng (important change process control) khi nó liên quan tới dự án TTDL. Không có dự án nào hoàn toàn không có lỗi; tuy nhiên quy trình và tài liệu tốt sẽ giảm số lượng lỗi nghiêm trọng và có mắc lỗi thì cũng dễ dàng xử lý hơn. Uptime khuyến nghị bất cứ dự án TTDL cũng cần làm các bước sau để tránh xảy ra lỗi và các vấn đề phát sinh trong quá trình xây dựng.

Tập hợp nhóm thiết kế, xây dựng, và quản lý dự án có kinh nghiệm về TTDL. Nếu cần, hãy thuê chuyên gia bên ngoài vào làm để tập trung vào yêu cầu cho dự án của chủ đầu tư. Hãy nhớ rằng nhóm CNTT có thể không hiểu rủi ro về tiến độ thời gian hay tính phức tạp của dự án. Các nhóm có kinh nghiệm có thể sẽ lùi tiến độ kế hoạch thời gian hay đề nghị VE không phù hợp với yêu cầu cho dự án, nhưng điều này tránh rủi ro và đảm bảo cho khả năng khai thác sau này, có có lợi cho chủ đầu tư. Chi phí ban đầu có thể cao hơn nhưng các sẽ mang lại hiệu quả thu hồi vốn (ROI- Return of Investment) cao hơn.

Do các nhóm có kinh nghiệm hiểu được sự quan trọng của Cx (commissioning agency) riêng biệt, nhân viên thử nghiệm đưa vào sử dụng sẽ làm việc có hiệu quả hơn rất sớm trong quy trình, cài đặt trạng thái để chuyển giao cho khai thác. Các yêu cầu về Cx và tập trung trên chức năng sẽ rõ ràng ngay lúc ban đầu.

Thêm nữa, nhóm khai thác nên tham gia cùng nhóm thiết kế và xây dựng TTDL ngay khi bắt đầu dự án. Đưa cả khai thác vào quản lý thay đổi (change management) sẽ giúp họ cơ hội chia sẻ thông tin, học được cách TTDL sẽ vận hành như thế nào, các điểm cần đặt ra chính yếu, luân chuyển thiết bị, quản lý thay đổi, đào tạo, và quản lý thiết bị/vật tư dự phòng – đây là nhu cầu cần thiết hằng ngày cho khai thác và xử lý khi có sự cố.

Cuối cùng, nhà cung cấp nên có nhân sự trong nhóm xây dựng TTDL, nhưng hầu như chỉ trên định nghĩa giấy tờ vì các mối quan tâm của họ và của chủ đầu tư sẽ không cùng 1 hướng.

Kết hợp nhóm kinh nghiệm chỉ mang lại lợi ích khi họ làm việc như một nhóm. Chủ đầu tư và đại diện CĐT có thể khuyến khích sự phối hợp giữa các thành viên trong nhóm có các mối quan tâm khác nhau, đóng góp ý kiến với NTK, kỹ thuật dự án, và NXD để đạt mức tối ưu cho dự án. Nhiều chuyên gia về TTDL thấy rằng quy trình thiết kế - xây dựng hay thiết kế - thầu – xây dựng sử dụng giá an toàn tối đa (GMP – Guaranteed Maximum Price) và chia sẻ chi phí tiết kiệm của hợp đồng được dùng để phát triển một nhóm chuyên môn khi như mong muốn.

Đánh giá của đơn vị thứ 3 có thể đảm bảo với CĐT là dự án được chuyển giao đúng với yêu cầu. Uptime có bằng chứng việc đánh giá của đơn vị thứ 3 sẽ đảm bảo khả năng làm việc của nhà thầu tốt hơn,có lẽ bởi việc đánh giá tăng khả năng tìm thấy các điểm thiếu hay bị cắt bỏ và sửa đổi cho chi phí của nhà thầu. Uptime không cho rằng tất cả nhà thầu đều tham gia vào từng công việc nhưng xét về logic thì việc đánh giá này có thể làm các nhà thầu chú ý hơn về “thông dịch ngôn ngữ hợp đồng” và làm những thay đổi mà những kỹ sư dự án không có kinh nghiệm và đại diện nhà thầu không phát hiện ra.

Chứng nhận và kiểm tra chỉ hiệu quả khi không có thiên vị, từ một đơn vị không liên quan đến nhà thầu. Nhiều chứng nhận trên thương trường không đạt được yêu cầu này. Một vài quy trình chứng nhận và kiểm tra chỉ có giá trị hơn một chút so với con dấu đóng đã kiểm tra chất lượng. Những cái còn lại chỉ là kiểu kiểm tra danh mục mà không có thực nghiệm kiểm tra lỗi.

Ví dụ như nhân viên thử nghiệm cần hoạt động độc lập và không phải là NTK hay kỹ sư dự án. Hơn nữa nhóm Cx nên có kinh nghiệm nhiều về TTDL. Nhân viên thử nghiệm nên tập trung vào thiết kế và lắp đặt theo như dự án, chỉ nên chuyên sâu đúng mức vào chức năng kiểm tra và chứng nhận. Cũng nên lưu ý rằng, nếu lỗi trong quá trình thử nghiệm không được chỉ ra và định rõ, nó sẽ có khả năng lặp lại trong quá trình khai thác.

Kiểm tra và chứng nhận của đơn vị thứ 3 được đánh giá ngang hàng về thay đổi thiết kế và VE.

Lấy chứng nhận Tier sai thời gian để tìm ra lỗi

Theo Uptime, quy trình lấy chứng chỉ Tier không phải là thời gian phù hợp để tìm ra lỗi trong thiết kế và xây dựng hay tìm ra hạ tầng không đạt “Concurrently Maintainable” hay “Fault Tolerant”. Thực tế đã cảnh báo rằng trong quy trình lấy chứng chỉ Tier, việc sửa lỗi là tốn chi phí nhất.

Trong vấn đề này, số lượng lỗi được phát hiện trong quá trình thử nghiệm và chứng nhận Tier chỉ ra được giá trị của việc đánh giá của bên thứ 3 về thiết kế và xây dựng hạ tầng. Bằng việc tìm ra các vấn đề, đánh giá của bên thứ 3 cứu cho công ty những sự cố tiềm tàng.

Hơn nữa, Uptime tin rằng quy trình xây dựng được tổ chức tốt, bao gồm thử nghiệm đưa vào khai thác mức 4 và mức 5 độc lập và chứng nhận Tier, kiểm tra và tìm lỗi ở mức sớm nhất có thể và tối thiểu việc nhà thầu giải trình hay tối thiểu nhu cầu cho việc sửa lỗi khi xây dựng lệch so với thiết kế ban đầu.

Hình ảnh bên trong một trung tâm dữ liệu xây dựng theo tiêu chuẩn Tier 3 tại Viettel IDC

Bùi Tuấn Việt – ATD – Uptime – SE – VTNet
tuanviet.bui@gmail.com
Lược dịch theo tạp chí Uptime Institue Volume 5: Design and Technology

 

Tin liên quan

30/11/2019

Ưu, nhược điểm của dịch vụ VPS là gì? Nhóm khách hàng nào nên sử dụng VPS?

Dịch vụ VPS – Virtual Private Server được tạo thành từ phương pháp phân chia một máy chủ vật lý thành nhiều máy chủ ảo dựa trên công nghệ ảo hóa. Một VPS có vai trò tương đương với đầy đủ các chức năng quản trị và cấu hình như một máy chủ vật lý, nên sẽ có những nhóm đối tượng khách hàng cụ thể nên sử dụng dịch vụ VPS.

29/11/2019

Tại sao doanh nghiệp nên chuyển từ VPS sang thuê Cloud Server để sử dụng?

Bài viết sau sẽ đi sâu vào nghiên cứu lý do tại sao Cloud Server đang trở thành lựa chọn nền tảng tối ưu hơn VPS, qua đó doanh nghiệp sẽ có được cái nhìn bao quát hơn trước khi dịch chuyển lên đám mây.

29/11/2019

Giải đáp các câu hỏi thường gặp của khách hàng khi thuê Cloud Server

Thuê Cloud Server là việc thuê máy chủ ảo được khởi tạo từ một hạ tầng ảo hoá có năng lực xử lý và bảo mật cao. Hạ tầng này gồm nhiều server vật lý liên kết với nhau, mỗi server (hoặc nhóm server) đóng một chức năng riêng biệt: tính toán, lưu trữ, tường lửa, cân bằng tải, dự phòng, sao lưu dữ liệu,…

28/11/2019

5 yếu tố cần lưu ý giúp bạn mua được VPS giá rẻ với chất lượng tốt

Hiện tại, có nhiều giải pháp lưu trữ như hosting, VPS, máy chủ riêng,… Với shared hosting, website sẽ không đảm bảo hiệu suất khi phải chia sẻ tài nguyên máy chủ với người dùng khác. Trong khi đó, sẽ rất tốn kém tài nguyên nếu bạn mua cả một server riêng nhưng không dùng hết. VPS giá rẻ sẽ giúp chúng ta giải quyết vấn đề này.

27/11/2019

Tìm hiểu những điểm khác nhau nổi trội giữa dịch vụ VPS và Cloud Server

Khi bắt đầu vào hành trình tạo ra trang web của riêng mình, bạn sẽ phải đối mặt với rất nhiều lựa chọn và quyết định. Mỗi quyết định và lựa chọn này sẽ tạo ra sự khác biệt trong hiệu suất và thành công của trang web. Khi này có thể bạn sẽ phải băn khoăn nên lựa chọn sử dụng cloud hay virtual private server (VPS) làm nền tảng cho website?

27/11/2019

Những tiêu chí cốt lõi cần phải đánh giá khi thuê Cloud Server

Hiện nay, hầu hết các doanh nghiệp đều nhận thức được những ưu điểm có được từ việc sử dụng Cloud Server máy chủ ảo so với hạ tầng công nghệ thông tin truyền thống. Khi chuyển đổi sang Cloud, doanh nghiệp sẽ hưởng lợi trong việc tiết kiệm chi phí, linh hoạt trong triển khai, thay đổi, đơn giản hóa việc quản lý IT.

26/11/2019

Dịch vụ VPS - Ứng dụng thực tế và cách thức quản trị VPS hiệu quả

Dịch vụ máy chủ ảo VPS là gì, có những ứng dụng thực tế nào và đâu là cách thức quản lý VPS tốt nhất là những thắc mắc thường được đặt ra đối với người mới bắt đầu sử dụng dịch vụ này. Cùng tháo gỡ những khúc mắc trong bài viết này nhé!

26/11/2019

Doanh nghiệp nên ứng dụng dịch vụ VPS vào những mục đích nào?

Dịch vụ VPS là gì và cách sử dụng như thế nào? Mọi thông tin chi tiết về dịch vụ VPS sẽ đều được Viettel IDC hướng dẫn chi tiết cách dùng trong bài viết này. Hãy cùng xem ngay nhé.

25/11/2019

5 lý do chứng minh hiệu quả vượt trội của Cloud VPS so với VPS truyền thống

Không ít khách hàng mặc dù đang sử dụng VPS nhưng đã biết đến Cloud VPS và đang có ý định chuyển từ VPS lên Cloud VPS. Bài viết dưới đây sẽ chỉ ra 5 lý do vì sao Cloud VPS lại tốt hơn VPS truyền thống

23/11/2019

Vì sao sử dụng Cloud VPS của Viettel IDC là lựa chọn đáng tin cậy nhất?

Cloud VPS là một giải pháp lưu trữ web vô cùng tối ưu giúp máy chủ web có thể uptime 99,99% thời gian hoạt động với hệ thống dự phòng đầy đủ và khả năng mở rộng cao.