Disaster Recovery Site (DR Site)

  • Thursday 11/01/2024

Disaster Recovery Site (DR Site)

Disaster Recovery là thuật ngữ được nhắc đến nhiều trong các dịch vụ liên quan đến dữ liệu. Vậy Disaster Recovery là gì và gồm những yếu tố nào?

Disaster Recovery

Disaster Recovery là gì?

Disaster Recovery thường được viết tắt là DR có nghĩa là phục hồi sau thảm họa. Đây thuật ngữ nói về giải pháp có khả năng khôi phục dữ liệu và đưa dữ liệu tiếp tục sử dụng ở các cơ sở hạ tầng công nghệ sau các thảm họa. Thông thường các dữ liệu được phục hồi từ các trung tâm lưu trữ dự phòng để thay thế cho dữ liệu chính đã bị phá hủy. Các thảm họa có thể đến từ tự nhiên, các biến động về an ninh xã hội, tấn công của mã độc/hacker. Ngoài ra còn có các lý do ngăn cản việc tiếp cận cơ sở hạ tầng ở phạm vi vật lý như các lệnh cấm, các đại dịch…
Lưu trữ bản sao dữ liệu ở nhiều vị trí địa lý cách xa nhau là điểm tiên quyết của DR. Trường hợp xảy ra thiên tai, lũ lụt, đánh bom, khủng bố, làm sập nơi chứa dữ liệu gốc thì các dữ liệu ở những nơi khác vẫn được đảm bảo an toàn. Khi sự cố chấm dứt, các bản sao dữ liệu ngay lập tức được đưa vào hệ thống để phục vụ cho việc khai thác, thao tác với dữ liệu.

Disaster Recovery

Giải pháp Disaster Recovery gồm những gì?

Giải pháp Disaster Recovery xoay quanh dữ liệu của khách hàng, được tổ chức bởi các thành phần sau đây:

  • Hệ thống lưu trữ dữ liệu: Là hệ thống các thiết bị máy chủ, máy trạm, thiết bị lưu trữ, các thiết bị sao lưu, hệ thống mạng (LAN/WAN) đang sử dụng các dữ liệu. Đây là nơi phát sinh, lưu trữ các dữ liệu gốc từ các thiết bị hoặc phần mềm mà khách hàng sử dụng hàng ngày.
  • Hệ thống lưu trữ dữ liệu dự phòng hay là các trung tâm lưu trữ bản backup dữ liệu. Các bản backup của dữ liệu chính được update liên tục, đảm bảo tín nguyên vẹn của dữ liệu. Các dữ liệu này sẽ được sử dụng khi các dữ liệu gốc gặp vấn đề trục trặc hoặc bị hư hại.
  • Kênh truyền dữ liệu giữa 2 site: Các giải pháp, công cụ để kết nối 2 site với nhau. Có khả năng đồng bộ dữ liệu một cách nhanh chóng khi cần thiết.
  • Hệ thống phần mềm quản lý và điều hành: Là giải pháp, giao diện để thực hiện các thao tác liên quan đến dữ liệu. Phục vụ cho việc quản lý điều hành, đồng bộ dữ liệu giữa hai site nhanh nhất sau thảm họa.

Ứng dụng Disaster Recovery như thế nào?

Việc chuẩn bị cho bất kỳ thảm họa nào về dữ liệu là vấn đề thực sự cần thiết cho doanh nghiệp. Có 2 cách để ứng dụng giải pháp Disaster Recovery nhằm đảm bảo sự hoạt động liên tục của dữ liệu khi có thảm họa xảy ra. 

Tự xây dựng một bộ phận về Disaster Recovery

Để làm được việc này cần có đội ngũ nhân lực chuyên môn cao. Từ đội ngũ nhân sự này sẽ hình thành nên Disaster Recovery Team.  Disaster Recovery Team sẽ tổ chức việc đánh giá rủi ro, sử dụng các hệ thống IT, ứng dụng IT (applications), đầu từ hệ thống lưu trữ, backup dữ liệu. Từ đó hình thành nên phương pháp khôi phục dữ liệu khi cần thiết.
Cách làm này yêu cầu doanh nghiệp cần có năng lực tài chính tốt. Cần đầu tư cơ sở hạ tầng đủ lớn để có thể phòng ngừa tất cả các rủi ro có thể dẫn đến thảm họa với dữ liệu. Ngoài ra cần có đội ngũ nhân lực tốt. Với đặc thù nhân lực ngành CNTT, doanh nghiệp thường phải trả chi phí lớn cho đội ngũ này. Công tác tổ chức vận hành cũng sẽ gặp nhiều khó khăn và yêu cầu những người làm công tác phục hồi sau thảm họa cần được nâng cao năng lực thường xuyên.

Sử dụng Disaster Recovery của các nhà cung cấp dịch vụ CNTT

Thay vì đầu tư cơ sở hạ tầng và tự tổ chức hoạt động khôi phục sau thảm họa, người dùng có thể sử dụng dịch vụ này ở các đơn vị cung cấp chuyên nghiệp. Các nhà cung cấp dịch vụ đã có sẵn cơ sở hạ tầng và đội ngũ nhân sự chuyên môn cao.
Dịch vụ Disaster Recovery sẽ thực hiện sao chép hệ thống dữ liệu từ tất cả phần mềm đã cài đặt của người dùng lên các trung tâm dữ liệu đám mây đã được xây dựng sẵn. Dữ liệu được bảo vệ an toàn bằng các giải pháp bảo mật, phòng chống Ransomware. Dữ liệu được backup liên tục đảm bảo tính toàn vẹn. Khách hàng được cung cấp các giải pháp công cụ để thực hiện khôi phục sau thảm hoạt một cách nhanh chóng.
Việc sử dụng dịch vụ Disaster Recovery của các nhà cung cấp dịch vụ CNTT là giải pháp tối ưu cho người dùng. Giúp tiết kiệm chi phí, bảo mật dữ liệu, khả năng khôi phục sau thảm họa nhanh chóng và vẹn toàn.

Tham khảo mô hình Site Recovery Manager ( SRM ) với hạ tằng ảo hoá VMWare 

Kiến trúc tổng quan SRM

Disaster Recovery

Site Recovery Manager được triển khai cấu hình theo từng cặp, thông thường sẽ có 2 site như sau:

Các thành phần của Site Recovery Manager

– Site Recovery Manager: triển khai trên HĐH Windows hoặc dưới dạng Virtual Appliance và cần phải được trang bị ở cả 2 site DC và DR, cung cấp các thành phần:+ Giao diện người dùng Site Recovery Manager cung cấp đầy đủ chức năng để làm việc với Site Recovery Manager

+ Một plug-in được thêm vào vSphere Web Client và vSphere Client

+ Một cơ sở dữ liệu lưu trữ thông tin quản lý sao chép và thông tin cấu hình sao chép

+ Site Recovery Manager: Site Recovery Manager cũng cung cấp giao diện quản lý thiết bị ảo (virtual appliance management interface – VAMI)

– Protected Site: là site chính triển khai DC, toàn bộ các dịch vụ sẽ chạy trên hạ tầng máy chủ tại site này (active)

– Recovery Site: là site dự phòng (standby), là một cơ sở hạ tầng thay thế mà SRM có thể di chuyển các dịch vụ từ Protected Site đến. Recovery Site có thể ở một địa điểm khác, hoặc trong cùng một cơ sở để thiết lập dự phòng.Thành phần máy chủ Site Recovery Manager điều phối các hoạt động của VMware vCenter Server tại hai site. Khi các máy ảo tại protected site bị tắt hay mất kết nối, các bản sao của các máy ảo ở recovery site sẽ được turn-on. Bằng cách sử dụng dữ liệu được replicate từ protected site, các máy ảo này đảm nhận trách nhiệm cung cấp các dịch vụ giống hệt để thay thế cho site chính bị lỗi.

Disaster Recovery

Tính năng, lợi ích của SRM:

– Khả năng khôi phục thảm họa, failover với thời gian rất ngắn, trong vòng vài phút vì các máy chủ ảo và thành phần lưu trữ được đồng bộ thời gian thực, chỉ mất thời gian khởi động máy chủ.

– Tự động điều phối chuyển đổi dự phòng và khôi phục chỉ với click chuột, giảm thời gian phục hồi.

– Kiểm tra thường xuyên, không gây gián đoạn các kế hoạch khôi phục; đảm bảo các đối tượng khôi phục có khả năng dự đoán cao.

– Quản lý tập trung các kế hoạch khôi phục thay thế cho các thao tác thủ công.

– Quy trình di chuyển có kế hoạch cho phép phòng tránh thảm họa và tính di động của TTDL.

– Tích hợp Vmware vSAN giảm dấu vết DR thông qua nền tảng siêu hội tụ, lưu trữ định nghĩa phần mềm.

– Hỗ trợ nhiều phiên bản vCenter cho phép ghép nối và nâng cấp linh hoạt.

– Tích hợp vSphere Replication mang đến tính năng sao chép tập trung vào VM, giúp loại bỏ sự phụ thuộc vào các thiết bị lưu trữ.

– Ngoài khả năng dự phòng thảm họa, giải pháp này có thể hỗ trợ các tính năng sau:

+ Migration: khi có nhu cầu chuyển đổi DC sang một vị trí mới mà gây ít thời gian downtime nhất có thể.

+ Maintenance: hỗ trợ bảo trì, bão dưỡng và nâng cấp hệ thống chính bằng cách chuyển đổi chế độ hoạt động sang recovery site.

Các mô hình triển khai

Active – Passive: Với mô hình truyền thống này sẽ có một site chính chạy (protected site) các ứng dụng và dịch vụ và một site còn lại (recovery site) không hoạt động cho đến khi sự cố xảy ra và cần phục hồi.

Disaster Recovery

Active – Active: Với mô hình này, SRM có thể được cấu hình để những workloads có độ ưu tiên thấp như môi trường test, dev có thể chạy trên recovery site và có thể được tắt như một phần của kế hoạch phục hồi. Điều nay cho phép tài nguyên trên recovery site sẽ không bị lãng phí mà vẫn có thể đáp ứng được tải cho các hệ thống quan trọng trong trường hợp thảm họa.

Disaster Recovery

Bi – Directional: Áp dụng với những trường hợp môi trường production được hoạt động ở cả 2 site, SRM hỗ trợ bảo vệ máy chủ ảo ở cả 2 hướng. Ví dụ máy chủ ở site này sẽ được bảo vệ ở site kia và ngược lại.

Disaster Recovery

Multi-site:

Shared recovery: nhiều site remote được bảo vệ bởi một site chính. Ví dụ trong trường hợp công ty có nhiều chi nhánh, khi đó mỗi chi nhánh sẽ được xem như protected site và trụ sở chính sẽ có đảm nhiệm site dự phòng (recovery site)

Disaster Recovery

Shared Protection: ngược lại với shared recovery, nhiều site remote sẽ dự phòng cho một site chính. Lúc này, một vài ứng dụng/VM ở site chính sẽ failover sang site remote thứ nhất, một số ứng dụng/VM khác sẽ failover sang site remote thứ 2,3,…n.

Three-site: là dạng mở rộng trong mô hình 2 site, VM ở site A sẽ được bảo vệ ở site B, VM ở site B sẽ được bảo vệ ở site C, VM ở site C sẽ được bảo vệ ở site A.

Disaster Recovery

Lưu ý trong mô hình Multi-site:

– Mỗi VM chỉ được bảo vệ bởi một cặp SRM ( recovery site và protected site)

– SRM hiện tại không hỗ trợ failover cùng một VM đến recovery site thứ 2 hay nhiều recovery site.

Use case 

– Disaster Recovery: SRM được thiết kế để giải quyết bài toán về khôi phục thảm họa hoặc chuyển đổi dự phòng không có kế hoạch từ trước. Đây là use case quan trọng nhất nhưng cũng ít được sử dụng nhất đối với SRM. Những lỗi không mong đợi đối với hệ thống thì không thường xuyên xảy ra nhưng khi chúng được phục hồi nhanh chóng là điều rất quan trọng với hoạt động kinh doanh của bất kỳ doanh nghiệp nào. SRM tự động hóa và điều phối việc khôi phục một phần hoặc toàn bộ hệ thống, đảm bảo thời gian khôi phục(RTO) là nhanh nhất.

– Disaster Avoidance: Đây là một use case phổ biến sử dụng trong trường hợp ngăn ngừa thảm họa. Nếu ta có thể dự tính trước thiên tai thảm họa như bão lũ có thể xảy đến với site chính. Kết hợp với Vmotion, ta có thể tắt các máy ảo và move sang site dự phòng, sao chép toàn bộ dữ liệu và khởi động theo lệnh các máy ảo/ ứng dụng tại site dự phòng để đảm bảo tính nhất quán và không mất dữ liệu.

– Planned Migration: Đây là use case phổ biến nhất – di chuyển máy ảo và ứng dụng giữa các site. Có thể áp dụng cho việc di dời trung tâm dữ liệu, cân bằng tải toàn cầu hoặc bảo trì site theo kế hoạch. SRM có khả năng di chuyển site một cách suôn sẻ, hỗ trợ kiểm tra toàn bộ quá trình di chuyển theo cách hoàn toàn không gây gián đoạn cho môi trường production. Ngoài ra cũng hỗ trợ stretched storage cho việc di chuyển không gây downtime.

– Upgrade & Patch Testing: Cung cấp site thử nghiệm để tiến hành kiểm tra bản vá và nâng cấp hệ điều hành. Site thử nghiệm là bản sao hoàn chỉnh của site chính được cấu hình với mạng cô lập để đảm bảo rằng việc thử nghiệm càng thực tế càng tốt, đồng thời không ảnh hưởng đến site chạy chính.

Selection 1676

P.A Việt Nam tiên phong trong thị trường Internet & Web.
Là nhà đăng ký tên miền lớn nhất Việt Nam. Chuyên nghiệp trong lĩnh vực Tên miền, Website, Email, Server, Thiết kế Web.

Thông tin kiến thức vps-dedicated-colocation tại: https://kb.pavietnam.vn/category/vps-dedicated-colocation
Đăng ký dịch vụ P.A Việt Nam: https://www.pavietnam.vn/
P.A Việt Nam cung cấp đa dạng cấu hình VPS và Dedicated tại: Cloud Server –  Cloud Server Pro  –  Máy Chủ Riêng
Tham khảo các Ưu đãi hiện có tại: https://www.pavietnam.vn/vn/tin-khuyen-mai/
Facebook: https://www.facebook.com/pavietnam.com.vn

Rate this post