애플리케이션 고가용성 서비스(AHAS)는 멀티 액티브 재해 복구(줄여서 MSHA) 기능을 통해 애플리케이션 고가용성을 향상하는 데 중점을 두고 트래픽 입력, 애플리케이션 계층, 데이터 장애 조치, 장애 훈련 등의 기능을 제공합니다. 도시 내 및 지역 간 클라우드 서비스의 안정성이 향상됩니다.
애플리케이션 고가용성 서비스는 애플리케이션 고가용성 기능 향상에 중점을 둔 SaaS 제품으로, 주로 다중 활성 재해 복구, 장애 훈련, 트래픽 보호라는 세 가지 독립적인 기능 모듈을 포함합니다. 트래픽 보호가 마이크로서비스 거버넌스 서비스 MSE로 마이그레이션되었습니다.
기능 및 사용 시나리오
다중 활성 재해 복구
다중 사이트 고가용성 MSHA(Multi-Site High Availability)는 Alibaba의 전자 상거래 비즈니스 환경에서 발전된 다중 사이트 재해 복구 아키텍처 솔루션으로, 비즈니스 복구와 오류 복구를 분리할 수 있으며 유연한 규칙 기반 스케줄링을 제공합니다. 도메인 및 클라우드 간 관리 및 제어, 데이터 보호 및 기타 기능을 통해 장애 시나리오에서 신속한 비즈니스 복구를 보장하고 기업이 재해 복구 안정성을 구축할 수 있도록 지원합니다.
작업 과정
다중 활성 재해 복구 MSHA 아키텍처는 비즈니스를 액세스 계층, 애플리케이션 계층, 데이터 계층의 세 가지 계층으로 나눕니다. 애플리케이션 계층은 마이크로서비스 호출 및 메시징과 같은 여러 기능 도메인으로 세분화될 수 있습니다. 구성 요소, 관리 및 제어에는 각 구성 요소 계층을 기반으로 하는 전체 스택 다중 활동 관리 및 제어 기능이 있습니다.
사용되는 장면
건축학
재해 내성
적용 가능한 장면
같은 도시에서 더 많은 삶을 누리세요
RPO: 지역 수준 오류는 제어할 수 없습니다. 컴퓨터실 수준 오류는 몇 초에서 몇 분까지 다양합니다.
RTO: 지역 수준 오류는 제어할 수 없습니다. 컴퓨터실 수준 오류는 몇 분에서 10분 내에 발생합니다.
설명하다
구체적인 상황은 기본 데이터와 보조 데이터의 동기화 지연에 따라 달라집니다.
예산이 제한되어 있으며 오프사이트 재해 복구는 고려되지 않습니다.
짧은 공사 기간(2주 이하)이 예상됩니다.
비즈니스 코드 수정이 전혀 필요하지 않습니다.
데이터 일관성 문제는 고려되지 않습니다.
활성-활성 원격 애플리케이션
RPO: 분.
RTO: 분에서 10분.
설명하다
구체적인 상황은 기본 데이터와 보조 데이터의 동기화 지연에 따라 달라집니다.
재해 복구를 위해 다른 위치에 데이터 센터를 구축하도록 선택합니다.
백업 센터 리소스는 유휴 상태가 아니며 트래픽이 활성-활성 상태가 될 것으로 예상됩니다.
지역 간 네트워크 지연을 허용합니다.
비즈니스 코드에 대한 수정이 0 이하일 것으로 예상됩니다.
데이터 일관성 문제는 고려되지 않습니다.
원격 다중 활동과 비교하여 이 솔루션은 트래픽 라벨링 및 라우팅 오류 수정이 필요하지 않습니다.
원격 활성-활성
RPO: 분.
RTO: 분에서 10분.
설명하다
구체적인 상황은 기본 데이터와 보조 데이터의 동기화 지연에 따라 달라집니다.
예산이 충분하다면 오프사이트 위치에 다중 활성 데이터 센터를 구축하는 것을 선택하십시오.
긴 공사기간(3~6개월)을 수용합니다.
트래픽을 라우팅하고 데이터 샤딩을 수행하기 위해 적절한 차원을 선택할 수 있습니다.
비즈니스 트래픽 표준, 비즈니스 코드 표준 및 미들웨어 업그레이드의 변화를 수용하십시오.
데이터가 결국에는 일관성이 있을 것이라는 사실을 받아들입니다.
문제 해결
Fault Drill은 카오스 엔지니어링의 실험 원리를 따르고 Alibaba의 내부 사례를 통합한 제품으로, 풍부한 오류 시나리오 구현을 제공하고 분산 시스템이 내결함성과 복구 가능성을 향상시키는 데 도움을 줄 수 있습니다.
프로세스
결함 훈련은 준비 단계, 실행 단계, 검사 단계 및 복구 단계를 포함하는 일련의 표준 훈련 절차를 설정합니다. 4단계 과정을 통해 기획부터 복원까지 사용자의 드릴 전과정을 다루며, 시각화를 통해 사용자에게 명확하게 제시됩니다.