Panne des numéros d’urgence : l’enquête d’Orange conclut à un bug logiciel

Revue de Presse

Source : nouvelobs.com (11 juin 2021 )

L’opérateur est formel  : un «  dysfonctionnement logiciel » sur un serveur, chargé de faire le lien entre le vieux réseau téléphonique et le réseau internet moderne, est bien à l’origine des importantes difficultés pour joindre le 15, le 17, le 18 et le 112, le 2 juin dernier.

«  L’enquête confirme qu’il s’agit bien d’un dysfonctionnement logiciel », indique Orange à «  l’Obs », ce vendredi 11 juin, à l’occasion de la publication des résultats de son enquête sur la panne du réseau téléphonique qui a rendu inaccessibles les numéros d’urgence 15 (Samu), 17 (police), 18 (pompiers) et 112 (numéro européen unique), le 2 juin pendant plusieurs heures, période durant laquelle au moins cinq décès sont survenus faute d’accès aux secours publics.

Vaste panne des numéros d’urgence  : à qui la faute ?

La panne est survenue le mercredi 2 juin, à 16h45, lors d’une opération prévue de longue date sur un équipement du réseau téléphonique. Sous le capot, tout s’est joué au niveau de l’interconnexion entre l’ancien réseau téléphonique commuté (RTC, celui qu’on dit «  cuivre ») et le réseau fibre transportant les données internet, dont la voix sur IP ( «  VoIP »). L’opération consistait à améliorer des «  calls servers », ces passerelles entre les deux réseaux, et route indispensable pour l’ensemble du flux des communications – que ce soit les appels passés depuis un téléphone en wi-fi vers un poste fixe, ou depuis un mobile d’un autre opérateur vers les numéros d’urgence (ceux-ci utilisent encore à 90 % le vieux RTC). Cette opération a été décidée après avoir constaté l’augmentation des appels durant la crise sanitaire, notamment vers les services d’urgence, et le besoin d’augmenter les capacités de ces «  calls servers ».

Une fois les serveurs connectés, les techniciens d’Orange ont alors saisi des commandes informatiques pour la reconnexion qui ont révélé un bug présent dans le logiciel source des serveurs, causant au passage, en quelques minutes, des dysfonctionnements successifs sur les six serveurs, présents en redondance, normalement pour éviter les pannes. Branle-bas de combat chez Orange. La centaine de personnes mobilisée a finalement identifié en fin de soirée la défaillance logicielle, et le partenaire fournissant le serveur (un constructeur européen) a adressé un correctif. L’ensemble du réseau est revenu à la normale le jeudi 3 juin, à 2 heures.

Face au bug, la responsabilité en question

Au total, environ 3 millions d’appels n’ont pas pu aboutir, dont 11 800 à destination des numéros d’urgence. «  Soit 11 % du total d’appels, note-t-on chez Orange, c’est-à-dire que 89 % ont abouti. » En temps normal, le taux moyen d’aboutissement des appels est de 97 %. La panne n’a donc pas été totale.

Mais l’incident a probablement eu des conséquences dramatiques  : des enquêtes judiciaires ou administratives ont été ouvertes sur au moins cinq décès survenus durant la panne dans le Morbihan, en Haute-Saône, en Vendée, dans les Bouches-du-Rhône et sur l’île de La Réunion, dont celui d’un enfant de 28 mois. «  Nous déplorons des victimes qui sont susceptibles d’avoir été causées par ce grave incident », a souligné le Premier ministre Jean Castex, en précisant qu’il se prononçait «  sous réserve évidemment de ce que diront les enquêtes, notamment les enquêtes judiciaires qui sont ouvertes ».

Après la panne du 15, du 17, du 18 et du 112, faut-il un numéro unique ?

Des questions de responsabilités vont se poser. D’abord sur le plan technico-juridique, entre Orange et son fournisseur de serveur. Puis sur l’incident lui-même, et les différentes enquêtes ouvertes qui devront se prononcer sur d’éventuelles victimes. Enfin sur les réparations civiles. «  La responsabilité d’Orange est établie », glisse une source chez l’opérateur. En revanche, il n’est pas prévu d’accabler une personne précise (la direction d’Orange refuse de nommer jusqu’au fournisseur des serveurs à l’origine du bug), ni de réclamer la démission de son PDG Stéphane Richard.

Un PDG qui doit par ailleurs être auditionné mercredi prochain par la commission des Affaires économiques de l’Assemblée nationale. «  L’Etat a un cahier des charges très clair vis-à-vis d’Orange. Visiblement, il n’a pas été respecté », avait déclaré le député LREM Roland Lescure, qui préside cette commission, sur Franceinfo.

«  Malheureusement cela pourrait se reproduire »

Dans les résultats de son enquête, Orange opère toutefois une autocritique, en évoquant d’abord «  la nécessité d’améliorer la rapidité de la diffusion de l’information vers les différentes parties prenantes de cette crise  : les pouvoirs publics, les services d’urgence et les médias ». Il est ainsi prévu de revoir l’organisation interne afin qu’une cellule de crise soit déclenchée bien plus rapidement en cas d’incident lié aux numéros d’urgence (réduire le délai à deux heures trente maximum). Mais aussi de mettre en place «  un numéro d’urgence pour les numéros d’urgence » pour tout dysfonctionnement, d’accompagner l’Etat dans la migration accélérée du RTC vers la VoIP, et de réfléchir à la diffusion massive de SMS de consignes en cas de panne.

L’enquête d’Orange est distincte de l’audit «  de contrôle de la sécurité et de l’intégrité » du réseau et des services de l’opérateur historique demandé par le gouvernement, et piloté par l’Agence nationale de Sécurité des Systèmes d’Information (Anssi), dont les conclusions sont attendues d’ici deux mois.

«  N’en déplaise aux politiques, le risque zéro n’existe pas et n’existera jamais, nous expliquait l’avocat Alexandre Archambault, spécialiste des réseaux télécoms. Techniquement, un réseau passe son temps à planter, et les opérateurs doivent constamment jongler pour atténuer ces plantages. Là, il s’agit d’un blocage particulièrement important et aux conséquences dramatiques, mais malheureusement cela pourrait se reproduire, vu la complexité de notre système. »

Orange s’est d’ailleurs livré à un rapide recensement des pannes de réseau téléphonique ces trois dernières années, relevant une quinzaine d’incidents relatifs aux numéros d’urgence. On se souvient aussi de la panne du réseau mobile qui a affecté Orange durant neuf heures en 2012, déjà causée par un bug logiciel sur un équipement de cœur de réseau – mais il était alors possible de joindre les numéros d’urgence au moyen des téléphones fixes. Un ancien de France Telecom rappelle enfin à notre mémoire une précédente panne, en 2004, également due à une «  anomalie logicielle » sur un équipement chargé de faire le pont entre la VoIP et le RTC, qui a bloqué les appels deux jours durant, perturbant fortement l’accès aux services d’urgence – mobilisant à l’époque fortement les pouvoirs publics.