본문 바로가기

PRODUCT/Solutions

OpenShift Data Foundation을 이용한 DR 체계 구축: 든든하게! 재해복구(DR) 체계 구축 완벽 가이드

OpenShift Data Foundation을 이용한 DR 체계 구축

 

기업 컴퓨팅 환경에서 컨테이너 플랫폼의 위상이 나날이 높아지고 있습니다. 클라우드 네이티브(Cloud Native)로 전환하는 데 있어 기반이 되다 보니 그 쓰임이 지속해서 늘고 있습니다. 중요성이 높아질수록 관심을 가져야 하는 것이 있습니다. 바로 재해 복구(disaster recovery, 이하 DR) 체계를 갖추는 것입니다. 관련해 이번 포스팅에서는 레드햇 OpenShift 엔터프라이즈 컨테이너 플랫폼이 제공하는 DR 기능에 대해 알아보겠습니다.

 

OpenShift Data Foundation이란?

 

레드햇 OpenShift에서 데이터 관리 및 검색, 복원성, 보안, 거버넌스 같은 데이터 관련 서비스는 OpenShift Data Foundation이 담당합니다. OpenShift Data Foundation이 제공하는 이점은 무엇일까요? 운영과 사용자 모두에게 간소화된 데이터 관리와 보호와 함께 엣지부터 코어, 그리고 클라우드까지 일관된 관리자 경험을 제공하는 것, 대규모 확장성 및 입증된 성능을 보장하는 것을 꼽을 수 있습니다.

 

 

 

OpenShift Data Foundation DR 기능

 

OpenShift Data Foundation은 비즈니스에 중요한 애플리케이션을 자연재해나 사람의 실수로 인한 사고 같은 예기치 않은 사건으로부터 보호하고, 문제 발생 시에도 비즈니스 운영을 지속할 수 있도록 설계한 DR 기능을 제공합니다. 이 기능은 비즈니스 연속성을 보장하는 데 있어 필수라 할 수 있습니다. DR 기능은 크게 세 가지로 유형을 나누어 볼 수 있습니다.

 

첫 번째는 메트로-DR(Metro-DR)입니다. 이 방식은 데이터센터 수준의 대규모 장애가 발생해도 데이터 손실 없이 비즈니스 연속성을 보장합니다. 퍼블릭 클라우드에서 가용 영역(AZ)을 활용해 주 센터의 장애로부터 서비스를 보호하는 것과 비슷한 개념입니다.

 

두 번째는 지역 DR(Regional-DR)입니다. 이 방식은 데이터센터 수준이 아니라 특정 위치의 시스템에 문제가 생겼을 때 비즈니스 연속성을 유지하는 것입니다. 이 역시 퍼블릭 클라우드와 비교할 수 있는데, 일반적인 클라우드 서비스가 제공하는 지역 장애로부터 보호하는 것을 떠올리면 됩니다.

 

세 번째는 확장 클러스터를 사용하는 방식으로 단일 OpenShift 클러스터 내에서 동기 복제를 사용해 데이터 손실 없이 재해 복구를 보장합니다. 이는 대기 시간이 짧은 두 데이터센터와 하나의 중재 노드로 구성하는 것이 특징입니다.

 

그렇다면 세 방식 중 어떤 것을 택해야 할까요? 기준은 분명합니다. DR을 적용하고자 하는 엔터프라이즈 컨테이너 플랫폼에서 운영하는 애플리케이션을 중요성에 따라 선택하면 됩니다. 보통 기업에서 중단 시 비즈니스에 큰 영향을 끼치는 ‘미션 크리티컬’로 분류하는 애플리케이션의 경우 DR의 핵심 지표인 복구 목표 지점(RPO)과 복구 목표 시간(RTO)을 매우 타이트하게 가져갑니다. 이를 기준으로 방식을 고르면 됩니다.

 

참고로 RPO는 데이터 백업 빈도를 결정하는 데 중요한 지표로 활용되며, 조직이 데이터를 얼마나 자주 백업하거나 복제해야 하는지를 나타냅니다. RTO는 비즈니스가 허용할 수 있는 최대 가동 중지 시간을 나타내며, 시스템 복구에 걸리는 시간을 말합니다. 이 두 지표를 기준으로 OpenShift Data Foundation의 DR 방식을 어떻게 선택하면 되는지는 다음 그림을 참조 바랍니다.

 

 

 

OpenShift Data Foundation 4.14에서 주목할 DR 기능 관련 개선 사항

 

OpenShift Data Foundation이 DR 기능은 꾸준히 강화되고 있습니다. 최신 버전인 OpenShift Data Foundation 4.14의 다음과 같은 주요 개선이 반영되었습니다. 상세 내용은 릴리즈 노트를 참조 바랍니다.

 

  • 지역 DR을 대규모로 배포할 수 있는 Ceph 개선 사항: Ceph는 고성능, 고가용성을 제공하는 오픈소스 소프트웨어 정의 스토리지로, 여러 데이터 센터에 걸쳐 데이터를 복제하고 관리하는 데 이상적입니다. 이번 개선을 통해 더 안정적이고 확장할 수 있는 방식으로 지역 재해 복구 기능을 실행할 수 있습니다.
  • 블록 및 파일 애플리케이션 모두에 대해 ACM UI를 사용하여 DR 관리: ACM(Advanced Cluster Management)의 UI를 통해 블록 및 파일 애플리케이션 모두에 대한 재해 복구를 더욱 손쉽게 관리할 수 있게 되었습니다. ACM은 여러 클러스터의 관리와 운영을 간소화하는 툴로, 사용자가 직관적인 UI를 통해 DR 설정을 구성하고 모니터링할 수 있게 해줍니다.
  • 새로운 DR 측정 항목으로 모니터링: DR 프로세스를 모니터링할 수 있는 새로운 측정 항목이 추가되어 DR 시스템의 상태와 성능을 실시간으로 더 정밀하게 파악할 수 있습니다.

 

째도, 째도, 째도 비즈니스 연속성 보장!

 

살펴본 바와 같이 OpenShift Data Foundation의 DR 기능은 컨테이너 플랫폼에서 운영하는 중요 애플리케이션의 중단 없이 비즈니스 연속성을 유지하는 데 있어 그 역할이 중요하다 볼 수 있습니다. DR 기능을 잘 활용하면 OpenShift 클러스터 전반에 걸쳐 애플리케이션과 그 상태를 보호하며, 어떠한 재해 상황에서도 데이터의 손실이나 손상 없이 보존할 수 있습니다. OpenShift Data Foundation 및 DR에 대한 더 자세한 내용이 궁금하다면 락플레이스로 문의 바랍니다.