« 1 - SLO »

Temps de lecture estimé : 7 minutes

L’accord de niveau de service (ou SLA pour Service Level Agreement) cadre juridiquement la qualité du service que notre entreprise fournit et par voie de conséquence ce que le client est en droit d’exiger en cas de défaillance. Il apparaît dans le contrat quand l’entreprise atteint un tel niveau de qualité technique, organisationnelle et métier qu’elle est en mesure de garantir cela à ses clients. Mais l’officialisation de cette valeur n’est-elle pas un cul-de-sac où l’entreprise finit emprisonnée dans ses propres contraintes ?

Ça pourrait, c’est pour cela que la création et le suivi d’un SLA doivent obéir à des règles particulières. Pour illustrer au mieux ce qu’on risque et les moyens de contourner les écueils, nous allons nous concentrer ici sur le cas du critère « disponibilité » (autrement dit le ratio entre le temps opérationnel et un temps total fixé), mais cela peut être étendu à tout autre critère de niveau de service.

Contraintes et bonnes pratiques d’un SLA

À choisir, toute entreprise aimerait ne pas avoir à mettre de SLA, car il représente une contrainte évidente :

Je vous garantis telle qualité de service, à défaut je vous dois des pénalités.

Si toutefois elle décide de passer d’une obligation de moyen à une obligation de résultat, c’est parce que c’est un très bon argument commercial qui rassure le client. Mais en tant que tel, pourquoi ne pas directement « plier le game de la concurrence » en mettant 100% du temps ?

Plusieurs raisons s’y opposent. La première, c’est l’application de la stratégie de l’acte nécessaire et suffisant. Notre SLA n’a pas besoin d’être absolu pour convaincre, juste d’être meilleur que la concurrence.

mise en concurrence de voitures par leur prix

Cette stratégie peut sembler futile, mais faire des petits pas est une stratégie gagnante vu qu’elle nous permet de nous ajuster au mieux au marché. Chacun de ces pas va immanquablement impliquer des nouveaux investissements en réarchitecture, formation et outillage, qui seront de surcroit de plus en plus chers à mesure que l’on s’approche du Graal des 100%. Il faut donc être sûr que ces investissements soient rentables en tenant compte de la loi des rendements décroissants1 et du besoin client.

Définir un SLA avec nos clients, c’est aussi établir une promesse durable ; il ne s’agit pas de l’ajouter et l’enlever quand bon nous semble. Sa force argumentaire tient à sa constance, c’est pourquoi nous devons être certains de pouvoir faire persister ces investissements et donc cet accord dans le temps et ce, quoi qu’il se passe. En conséquence, il est plus facile de contractualiser en SLA un état déjà acquis par l’entreprise plutôt qu’en viser un que nous ne serons pas certain d’atteindre.

Pourquoi ? Parce que par essence, un SLA s’accompagne toujours d’une contrepartie financière en cas de défaut. Cette dernière doit être de même ordre de grandeur que la perte générée pour former un bon argument de vente tout en ayant une probabilité contrôlée pour protéger les intérêts financiers de l’entreprise. L’entreprise doit budgétiser et quantifier ce coût, à défaut de quoi cette dépense peut mettre en danger l’entreprise.

Enfin, terminons sur l’aspect communicationnel. Revendiquer un SLA maximal signifie que votre entreprise a réussi à dompter l’aléatoire. Or, comme je le rappelais dans l’article Que cache le point d’exclamation dans htop ?, il existe un plafond de verre physique : tôt ou tard, il se passera quelque chose d’inattendu qui vous privera de votre précieux 100%. Vos clients professionnels savent cela, ce qui signifie que personne ne vous prendra au sérieux si vous prétendez atteindre 100% en permanence, voire vous susciterez de la méfiance.

Comme on le voit, un SLA se définit avec mesure et contrôle ; afficher des prétentions trop élevées est un problème pour l’entreprise. Mais même en ayant cela en tête, il existe un piège inhérent à la définition même du SLA : il nous pousse au conservatisme. Puisque son non-respect met en jeu la crédibilité et les finances de l’entreprise, nous nous retrouvons à éviter toutes situations risquées.

Avec la naissance du SLA naît donc un paradoxe : d’un côté le SLA fait de nous un fournisseur fiable, de l’autre il réduit drastiquement notre capacité d’action. Il n’est alors qu’une question de temps avant que notre compétitivité ne s’effondre. Comment gérer ce paradoxe ?

Vérifier le niveau de service

Comme nous venons de l’expliquer, fixer un SLA doit davantage être une officialisation qu’une direction. Mais pour établir correctement un état de fait et en tirer un SLA, il est nécessaire de constater la situation réelle par des mesures régulières2. Par exemple, si le SLA qui nous intéresse est celui de la disponibilité de notre service, alors les mesures doivent vérifier sa bonne accessibilité à intervalles. De la synthèse de ces mesures découle un indicateur de niveau de service (ou SLI pour Service Level Indicator), et dans notre cas un taux de disponibilité :

équation du sla : ratio des mesures “ok” sur le total des mesures

S’il permet d’évaluer la situation initiale, le SLI sert aussi sur la durée, notamment en défendant la qualité effective du service auprès des clients et en vérifiant que des actions d’amélioration portent bien leurs fruits.

Dans le même temps, la tenue du cadre juridique ne peut persister que si notre entreprise se donne un objectif un peu plus élevé que celui qu’elle affiche dans les contrats car l’aléatoire n’est jamais loin. En effet, si nous nous donnons simplement pour objectif interne de respecter le SLA, l’équipe n’aura que peu de marge de manœuvre en cas de défaut et les échecs auront des conséquences dramatiques. Cet objectif interne, c’est ce qu’on appelle le SLO (Service Level Objective) et Google conseille de partir de l’objectif interne, puis de figer le SLA sur une valeur légèrement moins exigeante3 (ex: 99.99% -> 99.95% de dispo).

In fine, ce sont les évolutions du SLI comparé au SLO qui nous mettent en mouvement, nous poussant à mieux nous organiser ou refondre l’architecture. La fiabilité et la stabilité du SLA ne sont que la conséquence du bon respect du SLO.

Le budget erreur

Nous savons à présent comment trouver un SLA adapté à la situation et surtout comment utiliser les SLA et SLO pour garantir la qualité de service auprès de nos clients, mais notre problème principal demeure : comment conserver notre capacité à innover en dépit du conservatisme inhérent au SLA ? Pour rester compétitive, une entreprise se doit d’innover4 au maximum de sa capacité. Cela peut se traduire de multiples façons : s’organiser plus efficacement pour réduire la charge sur les équipes, réduire la boucle de feedback pour parfaire le product-market fit ou renforcer son équipe pour répondre à de nouveaux marchés. Nous parlions déjà de ce besoin de mouvement dans l’article « L’art de bien piloter son entreprise ».

Toute la question est bien évidemment Comment ?. Comment réduire une boucle de feedback, comment avoir une organisation plus efficace, comment renforcer son équipe ? Il n’y a pas de formule magique, il faut expérimenter. Et puisqu’il n’existe pas non plus de méthode de succès inconditionnel, nous allons devoir introduire un mot qui fait peur : l’erreur.

Car c’est par l’expérience que nous trouvons de nouvelles solutions, et cette expérience s’accompagne obligatoirement d’un certain nombre d’erreurs ; il n’y a ni exception, ni de raccourci à cela. C’est là qu’intervient la notion de budget erreur5. Elle se définit par le cumul d’erreurs acceptable sur une période donnée. Formellement, ce qui est acceptable ou non s’appuie sur le SLA contractualisé avec le client : si nous nous sommes engagés à fournir 99% de disponibilité mensuelle, nous avons 1% de zone grise. Mais en interne, c’est bien le SLO qui nous organise et le budget erreur doit découler de lui ; il sera donc tout l’espace laissé par le SLO :

équation du budget erreur : 1 - slo

fluctuation du sli et budget erreur

Grâce à cette formule, nous profitons du meilleur des deux mondes : d’un côté, de la crédibilité accrue héritée du SLA, de l’autre d’une sacralisation de notre innovation puisqu’elle est sans risque pour l’entreprise. L’équation 1 - SLO est un mantra, il nous aide à nous souvenir que nous devons prendre tout l’espace laissé vacant par les engagements pour essayer, créer mais aussi rater. Il est là pour ça.


    Ce billet vous a plu ? Partagez-le sur les réseaux…


    … Ou inscrivez-vous à la newsletter pour ne manquer aucun article (Si vous ne voyez pas le formulaire, désactivez temporairement uBlock).

    Voir aussi