Galerie de cartes mentales Alibaba Cloud Service de reprise après sinistre dans le cloud hybride HDR
Service de reprise après sinistre dans le cloud hybride Hybrid Disaster Recovery (« HDR » en abrégé) est un service de reprise après sinistre qui fournit un RPO et un RTO de courte durée pour les applications de niveau entreprise. Couvrant les zones de disponibilité croisée des applications Alibaba Cloud ou les scénarios de reprise après sinistre entre régions ainsi que les scénarios cloud de reprise après sinistre des applications locales, il peut garantir efficacement la sécurité des données et la continuité des activités. Il n'est pas nécessaire de créer vous-même un centre de reprise après sinistre. Les ressources cloud sont gérées et contrôlées de manière entièrement automatique via une console centralisée.
Modifié à 2024-01-13 20:50:39Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
La gestion de projet est le processus qui consiste à appliquer des connaissances, des compétences, des outils et des méthodologies spécialisés aux activités du projet afin que celui-ci puisse atteindre ou dépasser les exigences et les attentes fixées dans le cadre de ressources limitées. Ce diagramme fournit une vue d'ensemble des 8 composantes du processus de gestion de projet et peut être utilisé comme modèle générique.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
La gestion de projet est le processus qui consiste à appliquer des connaissances, des compétences, des outils et des méthodologies spécialisés aux activités du projet afin que celui-ci puisse atteindre ou dépasser les exigences et les attentes fixées dans le cadre de ressources limitées. Ce diagramme fournit une vue d'ensemble des 8 composantes du processus de gestion de projet et peut être utilisé comme modèle générique.
Alibaba Cloud Service de reprise après sinistre dans le cloud hybride HDR
Présentation du produit
Reprise après sinistre dans le cloud hybride HDR (Hybrid Disaster Recovery) est un service qui fournit aux centres de données une sauvegarde locale intégrée et une reprise après sinistre dans le cloud pour les applications de niveau entreprise. Il peut fournir des services de reprise après sinistre aussi bas que le RPO de deuxième niveau et le RTO à la minute pour les centres de données locaux et les entreprises clés de l'entreprise sur Alibaba Cloud, garantissant ainsi efficacement la sécurité des données et la continuité des activités.
Problèmes fondamentaux à résoudre
La reprise après sinistre au niveau des applications garantit la continuité des activités (Business Continuity) : en cas de panne du centre de données ou d'opérations de maintenance du système à long terme, les opérations des applications peuvent être rapidement restaurées sur le cloud, raccourcissant ainsi les temps d'arrêt de l'activité et réduisant considérablement les pertes.
Reprise après sinistre au niveau des données : sauvegardez votre base de données, vos machines virtuelles et vos machines physiques dans le centre de données. Les données de sauvegarde sont stockées localement et automatiquement téléchargées sur le cloud. Il peut garantir la sécurité des données en cas de sinistre majeur dans un centre de données auto-construit, tout en offrant une double restauration efficace, locale et cloud.
Technologies de réplication de données prises en charge
Reprise après sinistre par réplication continue (CDR)
: Fournir des solutions de reprise après sinistre de haut niveau pour les applications clés de l'entreprise, ainsi qu'une reprise après sinistre RPO et RTO à la minute près.
Reprise après sinistre de réplication asynchrone de disque cloud
: Basé sur la technologie de réplication asynchrone de disque cloud ESSD, il offre des capacités de reprise après sinistre aussi faibles que 15 minutes de RPO et de RTO à la minute pour les applications ECS complexes.
Article comparatif Réplication asynchrone de disque cloud (EBS Async) Réplication continue des données (CDR) Scène applicable Le nombre d'ECS est important, les systèmes d'exploitation sont divers et la quantité de données est importante. Inférieur ou égal à 10 ECS. L'échelle de l'application est petite, le volume de données ECS est petit et le système d'exploitation est compatible avec la reprise après sinistre CDR ECS. RPO, RTO 15 minutes 1 à 5 minutes (en fonction du volume d'écriture ECS) coût faible coût Les frais incluent : trafic de réplication de disque cloud de reprise après sinistre illustrer HDR ne facture pas l'utilisation du logiciel de reprise après sinistre pendant la phase bêta publique. Le coût est légèrement plus élevé Les frais comprennent : Frais d'utilisation du logiciel de reprise après sinistre Disque cloud de reprise après sinistre Trafic de réplication ECS en double Envahissant Aucune intrusion Le client doit être installé, occupant les ressources ECS. Le client Windows doit être redémarré après l'installation. Limite supérieure du débit de réplication sur disque unique 100 Mo/s 30 Mo/s Limite supérieure du débit de réplication sur site unique illimité 50 Mo/s Procédure pas à pas du bac à sable Non pris en charge pour le moment soutien Compatibilité du système d'exploitation La plupart des systèmes d'exploitation Limité aux systèmes Windows et Linux désignés. Voir Système d'exploitation pour plus d'informations. Compatibilité des types de disques cloud ESSD tous les types
concept de base
Avant d’utiliser le HDR pour la reprise après sinistre dans le cloud hybride, vous devez comprendre les concepts de base suivants.
concept décrire Basculement La reprise après sinistre fait référence au processus de restauration de l'application sur Alibaba Cloud en cas d'échec de votre application IDC. Revenir en arrière Une fois l'environnement de votre IDC restauré, le processus de migration des données d'application vers votre propre IDC reprend le fonctionnement de l'application. RPO L’objectif de point de récupération fait référence à la quantité de données perdue en cas de panne d’application. Par exemple, RPO = 15 minutes signifie qu'en cas de panne d'une application, les 15 dernières minutes de données ne pourront pas être récupérées sur le cloud. RTO L'objectif de temps de récupération (objectif de temps de récupération) fait référence au temps nécessaire pour restaurer l'application afin qu'elle s'exécute sur le cloud en cas de panne. Machine tout-en-un de reprise après sinistre dans le cloud hybride Une machine tout-en-un avec des fonctions de reprise après sinistre et de sauvegarde lancée par Alibaba Cloud.
Avantages du produit
Faible coût total
Il n'est pas nécessaire de construire vous-même un centre de reprise après sinistre, ce qui élimine les coûts tels que l'exploitation et la maintenance de la salle informatique et l'achat de matériel.
Le cloud est principalement consommateur de ressources de stockage et nécessite très peu de ressources informatiques.
Différents RPO et RTO peuvent être configurés en fonction de différentes exigences d'application et de différentes bandes passantes réseau, réduisant ainsi les coûts.
Par rapport à la solution consistant à construire un centre de reprise après sinistre auto-construit, cela peut permettre d'économiser jusqu'à 80 % du coût.
Simple et facile à utiliser
Le déploiement sous le cloud est simple, les ressources sur le cloud sont gérées de manière entièrement automatique et la console offre un contrôle centralisé.
Les exercices de récupération de sauvegarde et de récupération après sinistre peuvent être effectués à tout moment, avec un démarrage en un clic et un nettoyage rapide.
Classement RPO/RTO
Les entreprises doivent développer des RPO/RTO progressifs pour les applications avec différents niveaux d'importance. L'infrastructure de l'entreprise, en particulier les conditions du réseau, limitera les indicateurs de reprise après sinistre pouvant être atteints.
La reprise après sinistre par réplication continue (CDR) est basée sur la technologie de réplication des données en temps réel au niveau du disque et peut fournir un RPO/RTO en quelques secondes ou quelques minutes.
La reprise après sinistre du Big Data dans le cloud hybride permet une reprise après sinistre du Big Data avec un RPO proche de 0. La reprise après sinistre du cluster Hadoop peut être déplacée vers Alibaba Cloud OSS ou EMR, et une réplication bidirectionnelle en temps réel peut être effectuée entre les clusters Hadoop pour créer un lac de Big Data.
Reprise après sinistre au niveau des applications et reprise après sinistre au niveau des données
Prend en charge la réplication efficace après sinistre et la récupération dans le cloud des serveurs d'applications Windows et Linux pour réaliser une reprise après sinistre au niveau des applications.
Vous pouvez effectuer des sauvegardes planifiées et des sauvegardes sur le cloud uniquement pour les données d'application clés, notamment SQL Server, les bases de données Oracle, les machines virtuelles VMWare, etc., afin de réaliser une reprise après sinistre au niveau des données.
Scénarios d'application
Reprise après sinistre hors site pour les applications critiques
Les applications exécutées sur des centres de données locaux peuvent être confrontées à diverses situations inattendues. Par exemple, parce que l’environnement logiciel et matériel est endommagé et que les applications ne peuvent pas être restaurées dans un court laps de temps, des événements tels que des incendies et des catastrophes naturelles peuvent même conduire à la reconstruction de l’intégralité du centre de données. Ces situations peuvent entraîner une indisponibilité d’applications critiques pendant une longue période, entraînant des pertes importantes pour votre entreprise. Lorsque les applications de votre propre IDC ne peuvent pas être restaurées en peu de temps, les services de reprise après sinistre du cloud hybride peuvent vous aider à lancer rapidement des applications sur le cloud.
Après avoir utilisé la passerelle de reprise après sinistre du cloud hybride, les images du serveur, les données d'application, les fichiers, etc. des applications principales sont copiés en continu sur Alibaba Cloud. Si une application de votre propre IDC rencontre une panne difficile à récupérer, vous pouvez démarrer la passerelle de reprise après sinistre sur Alibaba Cloud et restaurer rapidement le serveur d'applications sur ECS, remettant ainsi l'application en ligne rapidement et réduisant considérablement les pertes commerciales. En temps normal, vous pouvez également facilement effectuer des exercices de reprise après sinistre pour garantir un processus de récupération fluide en cas de panne réelle et garantir l'exactitude du plan de reprise après sinistre.
Le service de reprise après sinistre dans le cloud hybride vous évite d'avoir à supporter l'énorme investissement dans la création de votre propre centre de reprise après sinistre, et vous n'avez pas à vous soucier du déploiement complexe des logiciels et du matériel et du fonctionnement des solutions traditionnelles de reprise après sinistre. le coût de la reprise après sinistre hors site et améliore l'efficacité de la reprise après sinistre.
Migration vers le cloud de toute la machine
La migration traditionnelle vers le cloud nécessite généralement des étapes telles que la réinstallation et la configuration des applications sur des images cloud, la reconfiguration des machines virtuelles ECS, voire la reconstruction des applications. Ce processus est souvent long. Surtout pour certaines applications développées par des tiers, les opérations de migration vers le cloud sont plus difficiles en raison de nombreuses dépendances logicielles floues et de configurations complexes.
La passerelle de reprise après sinistre dans le cloud hybride ou la machine tout-en-un de reprise après sinistre offre un moyen de sauvegarder l'intégralité de la machine sur le cloud et de la restaurer sur le cloud, vous permettant ainsi de restaurer véritablement l'environnement du serveur dans le cloud de manière très pratique dans ECS, ce qui rend migration vers le cloud simple et intuitive.
Planification de reprise après sinistre
analyse de la demande
La protection des données et la continuité des activités revêtent une grande importance pour les centres de données. La défaillance d'applications critiques ou la perte de données peuvent entraîner des pertes importantes pour votre entreprise. Les services de reprise après sinistre dans le cloud hybride offrent deux niveaux de fonctionnalités pour protéger les données et assurer la continuité des activités.
Sauvegarde hors site
Les images et les données du serveur sont sauvegardées et téléchargées directement dans la base de données de reprise après sinistre d'Alibaba Cloud pour obtenir une sauvegarde hors site hautement fiable sur le cloud. Une sauvegarde stable hors site garantit que les données critiques ne sont pas perdues dans des situations extrêmes telles qu'un incendie dans le centre de données local, et peuvent être restaurées sur place après la réparation des installations locales.
Reprise après sinistre dans le cloud
Afin de réduire les pertes commerciales causées par les pannes d'applications, lorsqu'une panne grave survient dans le centre de données et ne peut pas être restaurée rapidement, le service de reprise après sinistre du cloud hybride peut restaurer efficacement et rapidement vos applications sur ECS.
Exigences RTO et RPO
La reprise après sinistre des applications comporte deux indicateurs principaux :
RPO : fait référence à la quantité de perte de données qui peut être tolérée en cas de panne d'une application. Plus les données sont importantes, plus l’exigence RPO est faible. Plus le RPO est petit, plus la fréquence de sauvegarde et de réplication des données est élevée, plus la pression sur l'environnement de production et le réseau est forte et plus le coût est élevé.
RTO : désigne le temps attendu entre le début des opérations de reprise après sinistre et la restauration de l'application après une panne. Plus les dommages causés à l’entreprise par une panne par unité de temps sont importants, plus le RTO requis est court.
Le RTO et le RPO sont généralement demandés par le service commercial, discutés avec le service informatique et basés sur des considérations globales telles que la faisabilité technique, l'impact sur les systèmes existants et le coût. Il existe souvent une relation linéaire entre le niveau des normes RTO et RPO et les coûts d’infrastructure.
Vous pouvez également vous référer aux normes nationales et industrielles pour définir les objectifs RTO et RPO. La norme GB/T 20988-2007 est une spécification de reprise après sinistre des systèmes d'information formulée par le Comité national d'administration de la normalisation de Chine. Vous trouverez des exemples de spécifications de niveau RPO/RTO dans un certain secteur en annexe, comme indiqué ci-dessous. Pour plus d'informations, voir
Analyse des applications
Déploiement d'applications
Avant de déployer des applications critiques, vous devez prendre en compte les trois éléments suivants :
Quels serveurs cette application contient-elle ?
Connexions réseau entre serveurs
Quelle configuration doit être effectuée sur le serveur
Par exemple, une simple application Web contient les éléments suivants :
L'application contient : 1 serveur de base de données, 1 serveur back-end et 1 serveur Web front-end.
3 serveurs sont sur le même réseau.
Il existe un élément de configuration dans le serveur principal qui spécifie l'adresse IP du serveur de base de données, et le serveur Web frontal possède un élément de configuration qui spécifie l'adresse IP du serveur principal.
Après avoir identifié ces éléments, vous pouvez planifier comme suit :
Le service de reprise après sinistre du cloud hybride doit protéger ces trois serveurs.
Lors de la restauration sur Alibaba Cloud, ces trois serveurs doivent être restaurés dans le même VPC.
Une fois la machine entière restaurée, pour garantir que l'application peut s'exécuter, vous devez vous assurer que la même adresse IP est utilisée lors de la restauration que dans le cloud. Vous pouvez également vous assurer que les éléments de configuration sont modifiés à l'aide de scripts automatisés une fois la récupération terminée.
dépendance environnementale
La reprise après sinistre d'une application est un processus qui nécessite la coopération de plusieurs services, notamment celle des administrateurs d'applications, des administrateurs de salle informatique, des administrateurs réseau et d'autres rôles. Une solution complète de reprise après sinistre qui peut répondre aux exigences de l'entreprise doit prendre en compte les détails sous de nombreux aspects, notamment :
L'environnement dont dépend l'application, tel qu'Active Directory (AD), DNS, etc.
Configuration réseau requise par l'application
Dans de nombreux cas, le fonctionnement de l’application présente également des dépendances environnementales importantes. Par exemple, dans un environnement Windows, de nombreuses applications s'appuient sur AD pour s'exécuter. Ensuite, lors de la restauration sur le cloud, votre environnement VPC sur le cloud doit pouvoir se connecter au service AD. Bien entendu, les services DNS constituent également une forte demande dans de nombreux environnements.
En prenant AD comme exemple, il existe généralement deux situations :
Si vous avez déployé plusieurs serveurs AD maître-esclave dans différents centres de données, il vous suffit d'établir un canal haut débit ou une connexion SSLVPN entre le centre de données où se trouve AD et le VPC sur le cloud.
Si votre serveur AD est déployé de manière centralisée dans un centre de données, il peut être mis hors ligne en même temps. Nous vous recommandons de :
Utilisez la machine tout-en-un de reprise après sinistre dans le cloud hybride pour protéger le serveur AD et restaurez d'abord le serveur AD en cas de panne dans le cloud.
Déployez un serveur AD esclave dans le VPC sur le cloud et maintenez une connexion avec le serveur AD maître sous le cloud. Lorsqu'une panne se produit sous le cloud, AD sur le cloud est utilisé.
De même, le serveur DNS doit également être configuré en conséquence pour répondre aux exigences de l'environnement d'application après une reprise après sinistre.
Connexion client applicative
Une fois l'application restaurée, vous devez vous assurer que le client peut se connecter à l'application restaurée. Généralement, vous avez besoin de :
Si l'adresse IP du serveur d'applications restaurée est la même que celle d'origine et que le serveur DNS est restauré avec succès, seuls le client et l'application doivent disposer d'une connexion réseau. Vous devrez peut-être utiliser SSLVPN ou un canal haut débit pour vous assurer que le client peut se connecter à l'application restaurée sur le cloud, ou que l'application restaurée fournit une adresse IP publique à laquelle le client peut accéder.
Il n'est pas obligatoire d'utiliser l'adresse IP d'origine lors de la restauration de l'application. Vous pouvez également modifier le DNS pour garantir que le client puisse se connecter au nouveau service.
Si le nom de domaine et l'adresse IP changent, vous devez modifier le client.
Équipement de reprise après sinistre et environnement réseau
En fonction du nombre de serveurs d'applications, du volume de données, des normes RPO et RTO et des exigences des installations environnementales dépendantes, vous pouvez raisonnablement sélectionner un équipement de reprise après sinistre et déployer un environnement réseau approprié.
Machine tout-en-un de récupération après sinistre CDR
Si un environnement virtualisé est pris en charge et que le nombre de serveurs nécessitant une protection contre la reprise après sinistre est inférieur à 5, il est recommandé de déployer la virtualisation.
Si un environnement virtualisé n'est pas pris en charge ou si le nombre de serveurs pour la protection contre la reprise après sinistre est supérieur à 5, il est recommandé d'utiliser une machine tout-en-un de reprise après sinistre CDR. Les modèles tout-en-un disponibles sont les suivants :
modèle Nombre de serveurs pris en charge Apsara DR100 <20 Apsara DR200 <100
Environnement Web
Les environnements réseau requis pour l'équipement de reprise après sinistre ci-dessus incluent les deux types suivants :
Réseau entre le centre de données et Alibaba Cloud
Grâce à l'algorithme optimisé de stockage et de transmission des données, le service de reprise après sinistre du cloud hybride ne nécessite pas que le centre de données local établisse une connexion de ligne dédiée avec Alibaba Cloud. Toutefois, pour les scénarios comportant de gros volumes de données et des exigences RPO strictes, il est recommandé d'utiliser des connexions de ligne dédiées pour garantir que le service de reprise après sinistre peut répondre aux indicateurs requis.
Une fois l'application restaurée, en fonction des exigences de connexion entre le client, AD, DNS, etc. et Alibaba Cloud VPC, vous devrez peut-être prendre en compte SSLVPN, la connexion par canal haut débit, l'exposition de l'application à l'adresse IP publique, etc. assurer l’utilisation normale de l’application.
Le réseau entre l’appliance de reprise après sinistre du cloud hybride et le serveur protégé
Afin d'effectuer une sauvegarde et une restauration normales du serveur protégé, il doit exister une connexion réseau entre la machine de récupération après sinistre et le serveur protégé.
La machine de sauvegarde tout-en-un propose un choix de cartes réseau double Gigabit et double 10G, et vous pouvez les configurer selon vos besoins en fonction des exigences de débit de sauvegarde et de récupération.