Chez PayFit, malgré le côté "licorne scale-up", tout est loin d’être rose et plein de paillettes : en moyenne, sur les 6 derniers mois, nous avons un incident par jour — de gravité différente bien sûr.
Venez découvrir comment, en l’espace d’un an, nous sommes passé d’une culture où le mot "incident" n’existait même pas et où les problèmes soudains étaient cachés dans des board Jira obscurs, à aujourd’hui où nous nous sommes outillés et organisés pour les gérer sereinement et s’en servir comme leviers d’une démarche d’amélioration continue et de réduction de la dette technique.
Au programme :
- Évaluer la sévérité d’un incident
- Communiquer en interne
- Communiquer publiquement
- Mitigations, troubleshooting, et autre
- Outillage & automatisation
- Post-mortems
- Un mot sur l’astreinte
Vous ressortirez de ce talk avec un retour d’expérience concret sur la manière dont nous gérons nos incidents chez PayFit, et le chemin que nous avons parcouru pour en arriver à une approche saine et constructive, incluant bien sûr des idées et tips que vous pourrez appliquer chez vous si besoin !