13 — Monitoring
Suite Azure Monitor : collecter, analyser, alerter sur les metrics, logs, events des ressources Azure (et hybrides via Arc).
A. Azure Monitor — vue d'ensemble
3 piliers de données :
| Type | Quoi | Stockage | Utilisation |
|---|---|---|---|
| Metrics | Numériques, séries temporelles (CPU, RAM, IOPS) | TSDB Azure Monitor (rétention 93 jours) | Alerts rapides, dashboards |
| Logs | Texte structuré (events, traces, signin) | Log Analytics workspace | KQL queries, alertes complexes, corrélation |
| Activity Log | Events plane management (qui a fait quoi sur Azure) | Activity log (90j gratuit) | Audit, compliance, alertes |
Sources de données
- Resource metrics/logs : auto pour ressources Azure → activer via Diagnostic Settings
- Guest OS (VMs) : via Azure Monitor Agent (AMA) → DCRs
- Activity Log : auto par sub
- Custom metrics/logs : via SDK/REST API
- Application Insights : pour apps (telemetry app-side)
B. Metrics
- Numériques, échantillonnés à 1 minute par défaut.
- Auto-collectées (pas de config nécessaire pour les ressources Azure).
- Rétention : 93 jours (gratuit).
- Metrics Explorer : visualisation interactive (chart, scatter plot, etc.).
- Multi-resource : agréger sur plusieurs ressources d'un même type.
- Splitting : décomposer une metric par dimension (ex: CPU par VM).
Custom metrics
- Jusqu'à 50 dimensions par metric.
- Envoi via API REST ou AMA.
C. Logs & Log Analytics
Log Analytics Workspace (LAW)
- Container régional pour stocker les logs.
- Pricing : Pay-as-you-go (par GB ingéré + retention) ou Commitment Tiers (engagement volume).
- Retention : 30j gratuit, jusqu'à 730 jours (2 ans), avec Archive (jusqu'à 12 ans) à coût réduit.
- 1+ workspaces par tenant. Choix : centralisé (1 LAW global) vs décentralisé (1 par BU/region) — trade-off coût/gouvernance.
Tables principales
| Table | Quoi |
|---|---|
AzureActivity |
Activity logs |
AzureDiagnostics |
Logs diagnostic des ressources (legacy) |
Heartbeat |
Heartbeat des VMs avec AMA |
Perf |
Performance counters VMs |
Syslog |
Linux syslog |
Event |
Windows Event Log |
SecurityEvent |
Windows Security Event Log |
<service>Logs |
Tables dédiées par service (StorageBlobLogs, AppServiceHTTPLogs, etc.) |
KQL (Kusto Query Language)
Langage de requête sur les logs.
// Top 10 VMs avec le plus haut CPU
Perf
| where ObjectName == "Processor" and CounterName == "% Processor Time"
| where TimeGenerated > ago(1h)
| summarize avg(CounterValue) by Computer
| top 10 by avg_CounterValue desc
// Erreurs 5xx sur App Service
AppServiceHTTPLogs
| where ScStatus >= 500
| summarize count() by CsHost, bin(TimeGenerated, 5m)
Pour AZ-104 : connaître le concept de table + opérateurs basiques (
where,summarize,project,top,join). Pas de KQL avancé attendu.
Search query — syntaxe à connaître (piège exam)
| Query | Quoi ça fait |
|---|---|
search in (EventLogs) "error" ⭐ |
Cherche le mot "error" dans la table EventLogs uniquement (rapide, ciblé) |
search "error" |
Cherche dans TOUTES les tables du workspace (lent, large) |
EventLogs | take 10 |
Retourne juste 10 lignes (pas de filtre par contenu) |
EventLogs | sort by TimeGenerated desc |
Trie tout, ne filtre pas |
→ Pour "trouver error dans la table EventLogs" → search in (EventLogs) "error" (avec in (table) pour limiter le scope, plus efficient que search "error" sans scope).
D. Activity Log
Audit log plane management : "qui a fait quoi" sur les ressources Azure.
Catégories
- Administrative : create/update/delete ressource
- Service Health : incidents Azure, maintenance planifiée
- Resource Health : santé d'une ressource
- Alert : déclenchements d'alertes
- Autoscale : actions auto-scale
- Security : alertes Defender
- Recommendation : Advisor
- Policy : compliance Policy
Caractéristiques
- 90 jours gratuits, dans le portail.
- Pour conserver plus longtemps : exporter via Diagnostic Settings vers :
- Log Analytics (KQL queries, alerts)
- Storage Account (long-term archive)
- Event Hub (streaming vers SIEM externe)
E. Diagnostic Settings
Configuration par ressource (ou via Azure Policy à grande échelle) pour exporter ses logs + metrics vers une destination.
Destinations
- Log Analytics workspace (recommandé pour analyse)
- Storage Account (archive long-terme)
- Event Hub (streaming SIEM)
- Partner solutions (Datadog, etc.)
À retenir
- Pas activé par défaut sur la plupart des ressources.
- 5 diagnostic settings max par ressource.
- Catégories de logs varient par service (ex: Storage = StorageRead/Write/Delete + Transactions).
F. Azure Monitor Agent (AMA) & DCRs
Agent unifié pour collecter logs + metrics du guest OS (VMs Azure et Arc).
🚨 Azure Diagnostics extension dépréciée 31 mars 2026. Log Analytics agent (MMA) retraite août 2024 (déjà retiré). → Utiliser AMA uniquement pour toutes nouvelles installations.
Architecture
- AMA installé sur la VM (extension Azure ou Arc).
- Data Collection Rules (DCR) définissent quoi collecter, où envoyer.
- 1 VM peut avoir N DCRs assignées.
DCR — composants
- Data sources : Performance counters Windows/Linux, Event log, Syslog, Custom logs (text files).
- Streams : transformations (KQL light) avant ingestion → réduire le coût.
- Destinations : LAW, Azure Monitor Metrics, Event Hubs.
Déploiement à grande échelle
- Azure Policy : assigner AMA + DCRs sur toutes les VMs (effect DINE).
- DCR Association : crée le lien VM ↔ DCR.
Data Collection Endpoint (DCE)
Endpoint réseau (public ou Private Endpoint) qui reçoit les données de l'AMA avant ingestion dans LAW. Optionnel pour les data sources standard, requis pour :
- Custom logs (text/JSON files via DCR — sans DCE l'ingestion custom log refuse de démarrer).
- AMPLS (Azure Monitor Private Link Scope) — trafic Monitor via Private Endpoint.
- Logs ingestion API custom.
Référencé dans la DCR via le champ dataCollectionEndpointId. 1 DCE peut servir N DCRs (même region).
💡 Piège exam : "données AMA collectées via endpoint dédié pour compliance" → 1ère étape = créer le DCE, puis le référencer dans la DCR. Ne pas confondre avec AMPLS (qui sécurise tout Azure Monitor, scope plus large) ou VM Insights (focus perf, pas collecte custom).
G. Alerts
Surveillent les conditions et déclenchent des actions.
Types d'alertes
| Type | Source | Use case |
|---|---|---|
| Metric alert | Metrics | Seuils numériques, le plus rapide (~1min) |
| Log alert | Log Analytics (KQL) | Alertes complexes basées sur logs |
| Activity log alert | Activity Log | Quand qqn supprime un RG, change un NSG, etc. |
| Smart detection | Application Insights | ML-based, anomalies auto |
| Service Health alert | Service Health events | Incidents Azure côté MS, maintenance planifiée, advisories |
| Resource Health alert | Resource Health | Quand une de tes ressources devient unhealthy/degraded |
Service Health vs Resource Health (piège classique)
| Service Health | Resource Health | |
|---|---|---|
| Concerne | Le service Azure côté MS (panne globale) | Ta ressource spécifique |
| Source | Azure platform events | État individuel de la ressource |
| Scope | Region / service / sub | Ressource précise |
| Exemple | "Azure Storage East US a un incident" | "Ta VM web01 est Unavailable" |
| Catégories | Service issues / Planned maintenance / Health advisories / Security advisories | Available / Unavailable / Unknown / Degraded |
| Où le voir | Service Health blade |
Resource > Resource health |
| Alerts | Activity log alert sur catégorie Service Health | Activity log alert sur catégorie Resource Health |
Pour AZ-104 : savoir distinguer les deux. Service Health = problème côté Azure. Resource Health = problème côté ta ressource (peut être causé par le service en panne, ou autre).
États
- Alert state :
New→Acknowledged→Closed(manuel) - Monitor condition :
Fired/Resolved(auto, basé sur les conditions)
Severity
- 0 (Critical) → 4 (Verbose)
Action Groups
- Définissent ce qui se passe quand l'alerte fire.
- Actions multiples possibles :
- Email / SMS / Push (mobile app) / Voice call
- Webhook (custom endpoint)
- Azure Function
- Logic App
- Automation Runbook
- Azure Mobile App push notif
- ITSM (ServiceNow, etc.)
- Event Hub
- 1 Action Group réutilisable sur N alertes.
Alert Processing Rules
- Règles globales pour modifier le comportement des alertes :
- Suppress alertes pendant une fenêtre de maintenance
- Apply Action Groups à plusieurs alertes
- Scope : sub / RG / resource type.
H bis. Métriques Azure Functions / Stream Analytics — niche AZ-104
Si une question porte sur "events Azure Functions ou Stream Analytics en attente / délai" :
| Métrique | Quoi |
|---|---|
| Backlogged Input Events ⭐ | Nombre d'events en attente de traitement → indique que la function ne suit pas la cadence (le plus utilisé pour identifier un backlog) |
| Late Input Events | Events arrivés plus tard qu'attendu (timing) — pas un backlog |
| Watermark Delay | Délai entre event time (génération) et processing time — latence, pas backlog |
| Out-of-Order Events | Events arrivés dans le mauvais ordre — sequence, pas backlog |
→ Pour "trop d'events non traités sur une Azure Function reliée à Event Hub" → Backlogged Input Events. Action : scale out le Function App ou optimiser le code.
Niche : tombe rarement à l'exam réel mais TD le pose.
I. Insights (solutions packagées)
Vues préconfigurées pour types de ressources spécifiques :
| Insight | Pour |
|---|---|
| VM Insights | VMs (perf + map dépendances) — voir fiche 6 |
| Container Insights | AKS / Container Apps |
| Network Insights | Vue centralisée de toutes les ressources réseau |
| Storage Insights | Storage Accounts |
| SQL Insights | SQL Databases |
| Application Insights | Apps custom (Agent ou SDK — voir ci-dessous) |
Tous nécessitent un Log Analytics workspace (sauf certaines metrics).
Application Insights — Agent vs SDK
| Méthode | Use case | Code changes |
|---|---|---|
| App Insights Agent ⭐ | App existante (IIS Windows, App Service, VM Linux) | ❌ Aucun (auto-instrumentation) |
| App Insights SDK | App custom où tu veux tracker events/dependencies/métriques spécifiques | ✅ Nécessite SDK + code |
🚨 Piège exam : "monitor app perf avec minimal code changes" → Agent (pas SDK).
Application Insights Profiler
Profiling auto des requêtes web d'une app → identifie le hot code path (méthodes les plus lentes), médiane / fastest / slowest response time par endpoint. Activable sur App Service, VM, Cloud Services. Pas d'impact perf significatif.
🚨 Piège exam : "tracer les requêtes web lentes / comprendre la cause d'un délai" → Application Insights Profiler. Pas Network Watcher (réseau ≠ code), pas Activity Log (events plane management), pas "Diagnose and solve problems" (diagnostic générique).
J. Network Watcher
Suite d'outils diagnostic réseau. Activé automatiquement dans chaque region où tu as un VNet.
Outils principaux
| Outil | Quoi |
|---|---|
| IP Flow Verify | "Cette requête de A vers B est allow ou deny ? quelle règle gagne ?" Test une connexion virtuelle (NSG) |
| NSG Diagnostic | Successeur de Effective Security Rules — affiche toutes les règles s'appliquant à une NIC |
| Next Hop | "Quel est le next hop pour ce paquet ?" → utile pour debug UDR |
| Connection Troubleshoot | Test ad-hoc : depuis VM A, est-ce que je peux joindre IP/FQDN B sur port X ? |
| Connection Monitor | Surveillance continue de connexions multi-points (latence, packet loss, traceroute). 🚨 Connection Monitor Classic retiré le 1er juillet 2024 — utiliser le nouveau Connection Monitor uniquement. |
| Packet Capture | Capture pcap (.cap Wireshark-compatible) sur une VM. Durée max 5h (18 000 sec). Pre-req : Network Watcher extension sur la VM. Pour enregistrer trafic d'une VM pendant N secondes (ex 3600s = 1h) → Packet Capture (pas Connection Monitor qui est pour connexions on-prem↔cloud, pas IP Flow Verify qui ne fait que tester une règle NSG) |
| Topology | Carte visuelle du VNet (subnets, NICs, peerings) |
| VPN Troubleshoot | Diagnostic des VPN Gateways |
NSG Flow Logs ⚠️
- Loggue chaque flux allow/deny par NSG → vers Storage Account, optionnellement enrichi via Traffic Analytics (Log Analytics).
- 🚨 Retraite 30 sept 2027. Création bloquée depuis 30 juin 2025.
- → Migrer vers VNet Flow Logs (capture au niveau VNet, plus complet, recommandé MS).
VNet Flow Logs (successeur)
- Capture tout le trafic d'un VNet (pas juste un NSG).
- Supporte Traffic Analytics (visualisation dans Log Analytics).
- À configurer pour toute nouvelle workload.
Traffic Analytics
- Couche d'analyse au-dessus des Flow Logs (NSG ou VNet).
- Visualise : top talkers, traffic patterns, threats potentielles, geo-distribution.
- Coût : ingestion Log Analytics + processing.
Pré-requis (3 obligatoires) :
- NSG ou VNet Flow Logs activés (source des données)
- Log Analytics Workspace (LAW) — destination + analyse via KQL
- Data Collection Rule (DCR) — définit quoi collecter et où envoyer (modèle moderne via AMA)
Permissions pour activer : Owner, Contributor, ou Network Contributor au scope sub.
💡 Piège exam : pour "enable Traffic Analytics + visualize traffic" il faut 2 actions : (1) Log Analytics workspace + (2) Data Collection Rule. Pas Sentinel (SIEM ≠ traffic), pas Azure Policy (compliance ≠ traffic), pas Monitor Alerts (réactif ≠ analyse).
K. DDoS Protection (rappel)
| Tier | Quoi |
|---|---|
| DDoS Network Protection | Au scope VNet entier, mitigation L3-L4, attack analytics |
| DDoS IP Protection | Au scope Public IP individuelle, version simplifiée |
| DDoS Infrastructure Protection | Gratuit, automatique sur toutes les Public IPs Azure (basique) |
Recommandé prod : Network Protection sur VNets exposés publiquement (App Gateway, LB public).
DEMO — chemins portail & KQL
Voir les metrics d'une VM
VM > Monitoring > Metrics- Sélectionner namespace + metric (ex
Percentage CPU) - Aggregation (Avg, Max, Min, Sum, Count)
- Time range + granularity
- Pin to dashboard ou créer alerte
Activity Log — review + archive
Monitor > Activity log→ filter par catégorie / sub / RG / time- Pour archive long-terme :
Activity log > Diagnostic settings > Add diagnostic setting - Choisir destination : LAW (KQL) + Storage (archive)
Diagnostic Settings (sur une ressource)
Resource > Monitoring > Diagnostic settings > Add diagnostic setting- Cocher catégories de logs + AllMetrics
- Destination : LAW / Storage / Event Hub
Log Analytics — query basique
// Heartbeat des VMs (qui ne reportent plus ?)
Heartbeat
| summarize LastHeartbeat=max(TimeGenerated) by Computer
| where LastHeartbeat < ago(15m)
// Activity Log — qui a supprimé des ressources hier ?
AzureActivity
| where TimeGenerated > ago(1d)
| where OperationNameValue endswith "delete"
| project TimeGenerated, Caller, OperationNameValue, ResourceGroup, _ResourceId
Configurer une alerte metric
Monitor > Alerts > + Create > Alert rule- Scope : choisir la ressource (VM, App Service, etc.)
- Condition : choisir metric + opérateur (
>,<, etc.) + threshold + aggregation - Action : sélectionner ou créer un Action Group (email, SMS, webhook, runbook…)
- Details : nom, severity, description, suppress duplicate alerts (mute pendant X)
Configurer une alerte log
Monitor > Alerts > + Create > Alert rule- Scope : LAW
- Condition : Custom log search → écrire la KQL query → seuil (
Number of results > 0par exemple) - Frequency d'évaluation (1min, 5min…)
- Action group + details
Network Watcher — IP Flow Verify
Network Watcher > IP flow verify- Sélectionner VM source + direction + protocol + IP/port distant
- Le tool indique : Allow/Deny + quelle règle (NSG) gagne
Network Watcher — Connection Troubleshoot
Network Watcher > Connection troubleshoot- Source : VM Azure
- Destination : VM / IP / FQDN + port
- Run → résultat : path, latency, status
Network Watcher — Connection Monitor (continu)
Network Watcher > Connection monitor > Create- Test group : sources (VMs/agent on-prem) + destinations + tests (TCP/HTTP/ICMP) + frequency
- Visualisation continue dans le dashboard, alertes possibles
- Données dans Log Analytics (table
NWConnectionMonitorTestResult)
NSG Flow Logs (legacy, à éviter)
Network Watcher > NSG flow logs > Create→ choisir NSG + Storage- Activer Traffic Analytics : pointer vers un LAW
- Visualiser dans Network Watcher > Traffic Analytics
VNet Flow Logs (recommandé)
Network Watcher > Flow logs > Create > Type: VNet- Choisir VNet + Storage Account + retention
- Activer Traffic Analytics → LAW
Packet Capture
Network Watcher > Packet capture > + Add- Choisir VM cible
- Configurer filters (proto, IP, port) + max size + max duration
- Run → fichier
.capenregistré dans Storage Account - Analyser avec Wireshark
Network Diagnostics workflow type
- IP Flow Verify : "le NSG bloque-t-il ce flux ?" — 30 sec
- Next Hop : "où va vraiment ce trafic ?" — détecte UDR / peering issues
- Connection Troubleshoot : test bout-en-bout, voir le path
- Packet Capture : si rien d'évident → analyse profonde du trafic réel
🏢 Scenarios d'entreprise réels — pensée d'architecte
Comment ces services s'utilisent dans la vraie vie. Pour chaque scenario : contexte business → choix techniques (uniquement les services traités dans la fiche) → pièges typiques.
Scenario 1 : SaaS B2B — observabilité centralisée multi-tenant
Contexte business : éditeur SaaS RH (50 clients enterprise, 200 microservices sur AKS + App Services). SRE team 6 personnes en charge de l'uptime. Besoin : 1 single pane of glass + corrélation cross-service + alertes routées au bon on-call. Choix techniques : LAW unique central (région primary) + AMA + DCRs pour les VMs/AKS + Diagnostic Settings Policy DINE sur tout + Action Groups par squad + Workbooks par produit. Architecture / pattern :
- 1 LAW central (
law-prod-weu) — retention 90j hot + Archive 2 ans (audit) - Tags
Tenant=client42injectés en custom property dans App Insights → KQL filter par tenant pour debug - DCR unique
dcr-vm-prodavec Perf counters + Syslog + Event → assignée via Policy DINE à toutes les VMs - Activity Log de chaque sub → export Diagnostic Settings → même LAW (un seul endroit pour "qui a fait quoi")
- Action Groups par squad (
ag-payments,ag-reporting) : email squad + webhook PagerDuty + Automation Runbook auto-remediation pour incidents connus - Workbook "Tenant Health" par client (top errors, latency p95, requests/s) Pièges à éviter :
- LAW décentralisée (1 par squad) → impossible de corréler "payment 5xx → DB lent → host saturé" entre 3 workspaces. Centraliser tant que feasible coût.
- Confondre Activity Log et Diagnostic Settings : Activity Log = audit management plane (auto, 90j). Diagnostic Settings = export ressource-par-ressource (logs+metrics du service) vers LAW. Faut les deux pour observabilité complète.
- MMA déprécié (août 2024) + Diagnostics extension Azure retraite mars 2026 → tout nouveau setup uniquement AMA + DCR
Scenario 2 : Healthcare — compliance + alertes service health
Contexte business : clinique privée (PHI sur Azure, 30 VMs Windows + App Services). Régulateur exige : preuve d'alerting opérationnel, archive logs 7 ans, notification immédiate si MS annonce une maintenance impactant West Europe. Choix techniques : LAW + Archive tier + Activity Log alert sur Service Health + Resource Health alerts par ressource critique + AMA + DCR custom logs (apps métier). Architecture / pattern :
- LAW : retention interactive 90j + Archive 7 ans sur tables critiques (
SecurityEvent,AuditLogs) — coût Archive = 1/10 du hot - Service Health alert (Activity Log alert) : catégorie
Service Health > Service issuefiltré sur West Europe + services utilisés (Compute, SQL, Storage) → Action Group email DSI + SMS astreinte - Resource Health alert par VM critique : trigger sur état
UnavailableouDegraded→ Action Group dédié - DCR avec Custom logs ingérant les logs métier de l'app DICOM (text files) — nécessite DCE (Data Collection Endpoint) créé en amont
- Diagnostic Settings : tout export vers LAW + Storage Account immuable (legal hold) pour archive très long terme Pièges à éviter :
- Confondre Service Health (côté MS) et Resource Health (côté ta ressource) : faut les 2 alertes, ce ne sont pas les mêmes événements
- Custom logs sans DCE → ingestion refuse de démarrer (piège exam classique)
- Archive ≠ hot : queries sur Archive nécessitent Search Jobs ou Restore (latence, coût) → garder hot ce qui sert vraiment au quotidien
Scenario 3 : Fintech — troubleshooting perf appli + détection latence backend
Contexte business : néobanque, app mobile + API REST sur App Service. Plaintes utilisateurs : "le login est lent par moments". Équipe a ajouté l'App Insights SDK il y a 6 mois mais ne sait pas l'exploiter. Choix techniques : Application Insights Profiler + metric alerts + log alerts KQL sur 5xx + Smart Detection ML. Architecture / pattern :
- App Insights connecté à l'App Service (Agent auto-instrumentation, pas SDK lourd) → trace dépendances DB, externe APIs
- Profiler activé : traces de requêtes web lentes → identifie le hot path (méthode
ValidateToken()à 2.3s p95 sur 8s totaux) - Metric alert :
Response time > 3s(avg sur 5min) → Severity 2, Action Groupag-mobile-oncall - Log alert KQL :
AppRequests | where ResultCode startswith "5" | summarize count() by bin(TimeGenerated, 5m) | where count_ > 50→ Sev 1 pageDuty - Smart Detection activée (ML auto sur App Insights) → détecte anomalies de latence sans seuil manuel
- Workbook "API Health" : top 10 endpoints lents, dependencies failures, exceptions Pièges à éviter :
- "Pour tracer requêtes web lentes" → App Insights Profiler, pas Network Watcher (réseau ≠ code), pas Activity Log (audit ≠ perf)
- Agent vs SDK : Agent = zéro code change, idéal app existante. SDK = nécessite recompile + déploiement (use case : tracker custom events business)
- Alertes sans Action Group = inutile (alerte fire mais personne notifié). Toujours tester l'Action Group avant prod
Scenario 4 : E-commerce — pic Black Friday & autoscale observability
Contexte business : retailer e-commerce, pics x20 trafic sur Black Friday (jusqu'à 50K req/s). VMSS + Azure Functions reliées à Event Hub pour le pipeline commande. Besoin : voir en direct si le scale-out suit la charge, sinon escalade. Choix techniques : Metric alerts multi-resource sur VMSS + Backlogged Input Events sur Functions + Connection Monitor pour latence vers PSP externe + Alert Processing Rules pour suppress maintenance. Architecture / pattern :
- Metric alert VMSS :
Percentage CPU > 75%agrégé 5min sur l'ensemble → Action Group qui trigger un Automation Runbook (force scale-out manuel +5 instances en panique) - Metric alert Backlogged Input Events sur Azure Function
func-orders(events Event Hub en attente) > 1000 → indique que la function ne suit pas la cadence → scale plan upgrade - Connection Monitor (nouveau, pas Classic retiré juillet 2024) : sondage continu de l'API PSP externe depuis Azure → si latence > 500ms ou packet loss → alerte
- Alert Processing Rule : supprime toutes les alertes Sev 3-4 entre J-2 et J+1 du Black Friday (focus sur Sev 0-2 critiques) ; auto-réactive ensuite
- Workbook live "Black Friday War Room" projeté sur écran : req/s, scale events, errors, top slow endpoints Pièges à éviter :
- Backlogged Input Events ≠ Late Input Events ≠ Watermark Delay : pour "events en attente non traités" → Backlogged Input Events uniquement
- Connection Monitor Classic retiré 1er juillet 2024 : si vieux setup tourne dessus → migrer vers Connection Monitor (nouveau) avant l'événement
- Action Group avec trop de canaux (email + SMS + voice + Teams + ITSM) sur Sev 0 = bruit ingérable : 1 canal urgent (SMS/voice) + 1 canal trace (ITSM) suffit
Sources :