Plan de reprise d’activité

23
Plan de reprise d’activité Karim Abdi – www.exam-pm.com 1 Plan de reprise d’activité Sinistres informatiques Karim Abdi

description

 

Transcript of Plan de reprise d’activité

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

1  Plan de reprise d’activité  

Sinistres informatiques  

Karim Abdi    

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

2  

SOMMAIRE

L’approche préventive (p. 3) L’approche curative (p. 4)

Activités critiques, hiérarchisation des systèmes ! (p. 5) Etude des activités critiques (p. 5)

Hiérarchisation des systèmes et données critiques (p. 6) Evaluer les types de solutions, définir les périmètres (p. 7) !

Les métriques de base (p. 7) Périmètre des données (p. 9)

Périmètre des systèmes (crash recovery) (p. 9) Périmètre entreprise (site survey) ! (p. 10)

Définir les procédures (p. 10) Contenu de la documentation PRA (p. 11)

Annexe

Document de procédure PRA (p. 12-23)

Les droits de distribution de ce document sont libres. Vous ne pouvez pas le reproduire, le copier, le modifier ou le vendre et devez en respecter le copyright.

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

3  

Plan de reprise d’activité Un plan de secours ou plan de reprise ou plan de continuité d’activité ne peut être que du seul ressort de la direction informatique. ! Le PRA est un projet d’entreprise qui doit être dirigé par le comité de direction afin de définir les priorités. !Ici je me concentrerai sur la partie SI. L’approche préventive L’étude du PRA, basé sur les scenarii (plus de 220 au total) de la méthode MEHARI demande un travail de préparation conséquent. ! Il faut tout d’abord définir le périmètre d’intervention du PRA. ! Les scenarii étant exhaustifs (de la simple panne ou effacement de fichier à une grève, une catastrophe naturelle, un sabotage ou du terrorisme), un premier tri doit être effectué. ! Chaque scénario découle d’un incident. ! Chaque incident a une ou plusieurs causes, nécessite une ou plusieurs mesures de prévention ainsi que d’une ou plusieurs mesures curatives (en fonction du cas de figure, des causes, etc.). ! Cette méthodologie ne peut être efficace que si elle est exhaustive (dans le périmètre défini).

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

4  

L’approche curative Je vous propose une autre méthode, essentiellement applicable en PME. ! C’est une approche combinant une méthodologie définie par Hewlett Packard et les recommandations du CLUSIF. On peut résumer cette méthode de la manière suivante. ! En cas de problème, et ce quelque soit la nature du problème, on ne peut se retrouver que face à 3 situations différentes dans 99% des cas: !

- Problème ne touchant qu’un seul système / données / application / utilisateur.

- Problème touchant plusieurs systèmes / données / applications / utilisateurs. !

- Problème touchant tous les systèmes et/ou le site. Il suffit de mettre en place des solutions en fonction de ces trois cas pour couvrir n’importe quel sinistre. ! Bien sûr, dans la démarche, des actions préventives peuvent et doivent être mises en place.

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

5  

Activités critiques, hiérarchisation des systèmes ! Etude des activités critiques Dans cette approche, il n’est pas nécessaire d’avoir un niveau de granularité proche des processus. Une étude des activités critiques peut suffire. Le schéma ci dessous ne représente pas toutes les activités de l’entreprise mais celles dont l’arrêt peut causer des pertes financières. !Les activités critiques sont en rouge.

Ici il s’agit du circuit de commande d’articles : quel que soit le canal de commande (téléphone, fax, email) celui ci ne doit jamais s’interrompre. ! Il en va de même pour les payements. !L’ERP, qui gère les commandes et la chaine logistique, ne doit pas, lui aussi, être interrompu.

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

6  

Hiérarchisation des systèmes et données critiques Il est important d’avoir une connaissance exhaustive et à jour de l’existant : téléphonie, wan, lan, alimentation électrique, postes clients… !C’est sur cette base que le projet sera réalisé. ! Une topologie à jour de votre réseau est primordiale à la réalisation de la hiérarchisation des systèmes critiques. En fonction du schéma précédent sur les activités critiques, vous allez définir l’ordre de priorité pour le redémarrage des équipements.

Au dessus de chaque élément se trouve une bulle dont la couleur est fonction du type d’élément (système, réseau, périphérique, etc.). !

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

7  

Dans chaque bulle se trouve un numéro : l’importance de l’équipement et donc son ordre de remise en route suite à un incident. ! Et au dessus de la bulle, une annotation avec une durée : c’est la durée maximale souhaitée avant une reprise en mode normal. !Vous devez en faire de même avec les données. Evaluer les types de solutions, définir les périmètres ! Les métriques de base ! - Estimation du coût d’arrêt de production : impact du sinistre

Un calcul d’impact de sinistre s’impose afin de positionner le point de rupture (intersection des courbes, Cf. figure ci-dessus). ! Le périmètre défini par un rectangle rouge qualifiera une fourchette pour votre temps de reprise après sinistre (recovery time objectif ou RTO) et l’investissement correspondant. Il vous faudra en avoir terminé avec ce qui suit pour compléter la courbe rouge.

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

8  

- RPO recovery point objective : Désigne la durée maximale d’enregistrement des données qu’il est acceptable de perdre lors d’une avarie. - RTO recovery time objective : Spécifie le délai maximum que l’entreprise tolère avant de reprendre son activité.

Plus vos points et temps de reprise seront proches du sinistre et plus la solution sera onéreuse. !L’estimation du coût d’arrêt de production permet de ne pas surdimensionner la solution.

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

9  

Périmètre des données - S’assurer que toute donnée importante pour l’activité soit sauvegardée ! - Optimiser les sauvegardes ! - Supprimer du pool de sauvegarde les données “inutiles”

Périmètre des systèmes (crash recovery) Définition des systèmes intégrés au PRA : alimentation électrique, téléphonie, poste utilisateur, serveurs, lan, wan, …

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

10  

Périmètre entreprise (site survey) ! Définition des parties (ou la totalité) du SI intégrées au site de secours. Nous venons d’estimer l’investissement à faire pour notre PRA, de définir le périmètre des éléments pris en compte ainsi que de définir une partie du niveau de service (RTO et RPO). Comme chaque plan de reprise est différent, il est difficile d’aller plus loin dans le contenu des périmètres. ! Mais vous avez tous les éléments pour mettre en place les mesures de reprise en cas de sinistre. Définir les procédures Une fois le PRA en place, vous mettrez à disposition un document aux formats papier et électronique (disponible quoi qu’il arrive donc hors de la salle serveur avec une copie hors site). Les procédures, et documents associés, sont le facteur clé de réussite d’un plan de reprise et de continuité d’activité en cas de sinistre (les tests aussi, mais nous n’en sommes pas encore là). ! Afin de ne pas noyer les intervenants dans un document imbuvable en situation de stress (j’ai vu des pavés de plus de 200 pages… lorsque la maison brûle, il y a peu de chance de se poser sur un canapé pour le lire), j’ai pris le parti de réaliser un format inférieur à 20 pages, avec des renvois suivant les situations. ! Partir d’un document général (celui fourni en annexe) pour descendre au niveau de détails le plus fin suivant le rôle de l’intervenant, l’état d’avancement du plan, le problème rencontré etc.

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

11  

Contenu de la documentation PRA ! - Les contraintes du niveau de service, ! - La hiérarchisation des éléments du réseau, ! - Aide à la décision (gain de temps): Les arbres de décisions / Identifier les scenarii possibles, ! - Les manuels d’utilisation, ! - La liste des contacts. Pas plus de 25 pages, rappelez vous que ce genre de document ne se lit jamais lorsque tout va bien et qu’en situation de stress on doit trouver l’essentiel pour redémarrer l’activité. Pour terminer, un PRA s’entretient et se met à jour. Des tests réguliers (1 à 2 fois par an) doivent être réalisés pour vérifier les solutions en place et entrainer les équipes à réagir.

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

12  

ANNEXE   Le but de ce document (donné dans cette annexe) est d’apporter un support et une aide à la décision lors d’un plan de reprise et de continuité d’activité en cas de sinistre informatique.

- ce document est un exemple -

- i l peut être pr is comme base pour réal iser le votre -

Contenu :

§ Les contraintes du niveau de service § Une description des éléments du réseau § Une topologie du réseau et la hiérarchisation des systèmes

critiques § Les arbres de décisions § La liste des contacts fournisseurs § Une documentation sur l’utilisation du logiciel de « snapshot »

Dans la section « les arbres de décisions », les références aux documents « incidents.xls », « contacts.doc » … servent à la documentation électronique. Dans le document papier, ces références sont présentes dans ce même document.

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

13  

SOMMAIRE de l’annexe

Les contraintes du niveau de service (p. 14) Les éléments du réseau (p. 14)

Topologie réseau et la hiérarchisation des systèmes critiques (p. 15) Les arbres de décisions (p. 16)

Plan de secours (p. 17) Procédure : serveurs Windows et données (p. 18)

Snapshot : restauration d’une image (p. 18) Procédure : LAN (p. 19) Procédure : WAN (p. 20) Procédure : PABX (p. 20)

Procédure : Alimentation électrique (p. 21) Procédure : Site survey (p. 22)

Liste des contacts fournisseurs (p. 23)

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

14  

Les contraintes du niveau de service

Les premières 24h (après déclaration du sinistre)

Actions

Les premières 36h (après déclaration du sinistre)

Actions

Les premières 72h (après déclaration du sinistre)

Actions

Les éléments du réseau

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

15  

Topologie du réseau et la hiérarchisat ion des systèmes crit iques

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

16  

Les arbres de décisions 1ère étape en cas de sinistre informatique : Invocation ou non du plan de secours et dans quelle mesure, ainsi que l’organisation des équipes et prise de décisions.

Membres : Cellule de veille : Service informatique Comité de crise : x Cellule de coordination : x Equipe d’intervention : Service informatique

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

17  

Plan de secours En fonction de la nature du sinistre : choisir la procédure correspondante. Les procédures se trouvent dans ce document (voir sommaire).

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

18  

Procédure : serveurs Windows et données

Snapshot : restaurat ion d’une image Indiquer ici la procédure de restauration avec le logiciel de snapshot.

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

19  

Procédure : LAN Le câblage provisoire sera l’achat de câbles réseau au mètre (voir contacts) puis sertissage sur place afin de desservir les utilisateurs directement depuis la salle serveur en cas de disfonctionnement du réseau LAN (câblage).

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

20  

Procédure : WAN

Procédure : PABX

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

21  

Procédure : Al imentat ion électr ique

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

22  

Procédure : Site survey La procédure « sitesecours.doc » donne les détails sur l’activation des serveurs du site de secours, la restauration des données depuis les bandes de sauvegarde externalisées, le paramétrage des postes utilisateurs reçus…

Plan de reprise d’activité

Karim Abdi – www.exam-pm.com

23  

Liste des contacts fournisseurs - Téléphonie - Alimentation électrique - Postes utilisateurs - LAN - WAN - Site de secours - Serveurs Pour chaque élément, ayez le maximum d’information :

- n° de téléphone - Nom de contact privilégié - Adresse email, site Web - n° de contrat - Les éléments contractuels importants : délai d’intervention par

ex. - Vos identifiants, mots de passe (attention à la manière dont sera

conservé le document et qui y aura accès) - etc. etc.