Guide de Dépannage OmniHSS
← Retour au Guide des Opérations
Table des Matières
- Aperçu du Dépannage
- Échecs d'Authentification
- Problèmes de Connectivité Diameter
- Problèmes de Base de Données
- Échecs d'Enregistrement EPC
- Échecs d'Enregistrement IMS
- Échecs d'Appels VoLTE
- Problèmes de Roaming
- Problèmes EIR
- Problèmes de Performance
- Problèmes d'État des Abonnés
- Problèmes d'API
- Outils et Commandes de Diagnostic
Aperçu du Dépannage
Approche Générale de Dépannage
Informations à Collecter
Avant de dépanner un problème, collectez :
-
Informations sur l'Abonné (si spécifique à l'abonné)
- IMSI
- MSISDN (numéro de téléphone)
- Dernier état connu
- Messages d'erreur du dispositif
-
Informations de Temps
- Quand le problème a-t-il commencé ?
- Est-il intermittent ou constant ?
- Heure de la dernière opération réussie
-
Portée de l'Impact
- Abonné unique ou plusieurs ?
- Réseau spécifique ou tous les réseaux ?
- Service spécifique (données/voix) ou les deux ?
-
État du Système
- Vérifiez le Panneau de Contrôle pour l'état du système
- Examinez l'état des pairs Diameter
- Vérifiez la connectivité de la base de données
Échecs d'Authentification
Symptômes
- L'abonné ne peut pas se connecter au réseau
- Erreurs "Authentification rejetée"
- Tentatives d'authentification répétées
Causes et Solutions Courantes
Cause 1 : Ensemble de Clés Incorrect
Symptômes :
- Échec d'authentification constant pour un abonné spécifique
- Fonctionne pour d'autres abonnés avec le même profil
Étapes de Diagnostic :
-
Interroger l'abonné pour vérifier key_set_id :
curl -k https://hss.example.com:8443/api/subscriber/imsi/[IMSI] -
Vérifier que l'ensemble de clés existe et a les bonnes valeurs :
curl -k https://hss.example.com:8443/api/key_set/[KEY_SET_ID] -
Comparer les valeurs Ki et OPC avec la documentation de la carte SIM
Solution :
- Mettre à jour l'abonné avec le bon ensemble de clés
- Si les clés sont correctes, la carte SIM peut être défectueuse
Cause 2 : SQN Désynchronisé
Symptômes :
- L'authentification échoue après avoir fonctionné auparavant
- Erreur : "Échec de synchronisation SQN"
- Fonctionne de manière intermittente
Étapes de Diagnostic :
- Vérifier l'état de l'abonné pour la valeur SQN dans la base de données
- Rechercher des erreurs liées à SQN dans les journaux
- Vérifier la valeur SQN de l'ensemble de clés de l'abonné
Solution :
- SQN se resynchronisera automatiquement après que l'abonné envoie AUTS
- Si cela persiste, réinitialiser SQN à 0 dans l'ensemble de clés (nécessite une nouvelle connexion de l'abonné)
Avertissement : La réinitialisation de SQN peut causer des problèmes de sécurité. Ne le faites que pendant la maintenance.
Cause 3 : Abonné Désactivé
Symptômes :
- Authentification rejetée immédiatement
- Aucun vecteur d'authentification généré
Étapes de Diagnostic :
-
Vérifier l'état d'activation de l'abonné :
curl -k https://hss.example.com:8443/api/subscriber/imsi/[IMSI] -
Vérifier que le champ
enabledesttrue
Solution :
- Activer l'abonné :
curl -k -X PUT https://hss.example.com:8443/api/subscriber/[ID] \
-H "Content-Type: application/json" \
-d '{"subscriber": {"enabled": true}}'
Cause 4 : Profil EPC Manquant
Symptômes :
- La recherche d'abonné réussit mais l'authentification échoue
- Erreur : "Aucun profil EPC assigné"
Étapes de Diagnostic :
- Vérifier le champ
epc_profile_idde l'abonné - Vérifier que le profil EPC existe :
curl -k https://hss.example.com:8443/api/epc/profile/[PROFILE_ID]
Solution :
- Assigner un profil EPC valide à l'abonné
Organigramme de Dépannage de l'Authentification
Problèmes de Connectivité Diameter
Symptômes
- Les pairs Diameter apparaissent comme déconnectés dans le Panneau de Contrôle
- Erreurs "Aucun itinéraire vers l'hôte"
- Services échouent pour tous les abonnés
Causes et Solutions Courantes
Cause 1 : Connectivité Réseau
Symptômes :
- Le pair ne se connecte jamais
- Erreurs de délai d'attente de connexion
- Ping échoue vers le pair
Étapes de Diagnostic :
-
Vérifier la connectivité réseau de OmniHSS vers le pair :
ping [PEER_IP] -
Vérifier si le port Diameter est accessible :
telnet [PEER_IP] 3868 -
Vérifier que les règles de pare-feu permettent le trafic Diameter (port 3868)
Solution :
- Corriger le routage réseau
- Mettre à jour les règles de pare-feu
- Vérifier que le pair fonctionne et écoute
Cause 2 : Configuration Diameter Incorrecte
Symptômes :
- Les tentatives de connexion échouent
- L'échange CER/CEA échoue
- Le pair rejette la connexion
Étapes de Diagnostic :
-
Examiner la configuration Diameter dans runtime.exs :
- Vérifier que origin_host du pair correspond à la valeur attendue
- Vérifier la configuration origin_realm
- Vérifier que l'adresse IP du pair est correcte
-
Vérifier les journaux pour des erreurs CER/CEA
-
Vérifier que la configuration du pair attend origin_host de OmniHSS
Solution :
- Mettre à jour runtime.exs avec la configuration Diameter correcte
- Redémarrer OmniHSS après modification de la configuration
- Coordonner avec l'administrateur du pair pour vérifier les paramètres
Cause 3 : Problèmes de Certificat (TLS Diameter)
Symptômes :
- La connexion échoue lors de la poignée de main TLS
- Erreurs de validation de certificat
- Erreurs "Certificat expiré" ou "Certificat invalide"
Étapes de Diagnostic :
-
Vérifier que les fichiers de certificat existent dans
priv/cert/ -
Vérifier l'expiration du certificat :
openssl x509 -in priv/cert/diameter.crt -noout -dates -
Vérifier que la chaîne de certificats est complète
-
Vérifier le certificat du pair si TLS mutuel
Solution :
- Renouveler les certificats expirés
- Installer la chaîne de certificats correcte
- Mettre à jour les fichiers de certificat et redémarrer OmniHSS
Cause 4 : Incompatibilité de Support d'Application du Pair
Symptômes :
- Le pair se connecte mais ne prend pas en charge les applications requises
- L'échange de capacités réussit mais les opérations échouent
- Erreurs "Application non supportée"
Étapes de Diagnostic :
- Vérifier la page Diameter du Panneau de Contrôle pour les applications du pair
- Vérifier que le pair prend en charge l'application requise (S6a, Cx, Sh, etc.)
- Examiner l'échange CER/CEA dans les journaux
Solution :
- Vérifier que la configuration du pair inclut les applications Diameter requises
- Vérifier que le type de pair correspond à la fonctionnalité attendue :
- MME doit prendre en charge S6a (16777251)
- S-CSCF doit prendre en charge Cx (16777216)
- P-GW doit prendre en charge Gx (16777238)
Organigramme de Dépannage Diameter
Problèmes de Base de Données
Symptômes
- L'API renvoie des erreurs 500
- Le Panneau de Contrôle ne se charge pas
- Erreurs "Échec de connexion à la base de données"
- Performance de requête lente
Causes et Solutions Courantes
Cause 1 : Serveur de Base de Données Hors Service
Symptômes :
- Tous les appels API échouent
- Le Panneau de Contrôle affiche une erreur
- Erreurs "Connexion refusée"
Étapes de Diagnostic :
-
Tester la connectivité de la base de données :
# Si vous utilisez PostgreSQL
psql -h [DB_HOST] -U [DB_USER] -d [DB_NAME]
# Si vous utilisez MySQL
mysql -h [DB_HOST] -u [DB_USER] -p [DB_NAME] -
Vérifier l'état du service de base de données sur le serveur de base de données
-
Vérifier la connectivité réseau vers le serveur de base de données
Solution :
- Démarrer le service de base de données
- Corriger les problèmes du serveur de base de données
- Vérifier le routage réseau vers le serveur de base de données
Cause 2 : Identifiants de Base de Données Incorrects
Symptômes :
- Erreurs "Authentification échouée"
- OmniHSS ne peut pas se connecter au démarrage
Étapes de Diagnostic :
- Examiner la configuration de la base de données dans runtime.exs
- Tester les identifiants manuellement avec le client de base de données
- Vérifier les permissions de l'utilisateur de la base de données
Solution :
- Mettre à jour la configuration de la base de données dans runtime.exs
- Accorder les permissions correctes à l'utilisateur de la base de données
- Redémarrer OmniHSS après modification de la configuration
Cause 3 : Pool de Connexion Épuisé
Symptômes :
- Erreurs 500 intermittentes
- Erreurs "Aucune connexion disponible"
- Les périodes de forte charge déclenchent des échecs
Étapes de Diagnostic :
- Vérifier le nombre de connexions actuelles dans la base de données
- Examiner la taille du pool de base de données dans runtime.exs
- Surveiller l'utilisation des connexions pendant les périodes de pointe
Solution :
- Augmenter la taille du pool dans la configuration runtime.exs
- Enquêter sur les fuites de connexion si le pool s'épuise de manière répétée
- Envisager l'évolutivité de la base de données si la charge est constamment élevée
Cause 4 : Requêtes Lentes
Symptômes :
- Réponses API très lentes
- Délais d'attente sur les recherches d'abonnés
- Haute utilisation du CPU de la base de données
Étapes de Diagnostic :
- Interroger la base de données pour le journal des requêtes lentes
- Identifier les requêtes lentes spécifiques
- Vérifier les index manquants
- Vérifier le nombre d'abonnés et les tailles des tables
Solution :
- Optimiser les requêtes lentes
- Ajouter des index manquants
- Envisager l'optimisation des performances de la base de données
- Planifier l'évolutivité de la base de données si nécessaire
Organigramme de Dépannage de la Base de Données
Échecs d'Enregistrement EPC
Symptômes
- L'abonné ne peut pas se connecter au réseau LTE
- MME rejette la connexion
- Aucune session PDN établie
Causes et Solutions Courantes
Cause 1 : Roaming Refusé
Symptômes :
- L'abonné fonctionne sur le réseau domestique mais échoue en roaming
- Erreurs "Roaming non autorisé"
- Fonctionne pour certains réseaux mais pas pour d'autres
Étapes de Diagnostic :
- Vérifier le champ roaming_profile_id de l'abonné
- Interroger le profil de roaming et les règles
- Vérifier le MCC/MNC du réseau visité
- Vérifier si une règle de roaming existe pour ce réseau
Solution :
- Ajouter une règle de roaming pour le MCC/MNC du réseau visité
- Ou mettre à jour l'action par défaut du profil de roaming pour autoriser
- Voir la Documentation sur le Roaming pour la configuration
Cause 2 : Configuration APN Manquante
Symptômes :
- La connexion réussit mais la session PDN échoue
- Erreurs "APN inconnu" du MME
- L'abonné ne peut pas obtenir de connexion de données
Étapes de Diagnostic :
- Vérifier que le profil EPC a des profils APN liés
- Vérifier que l'identifiant APN correspond à ce que demande le dispositif
- Interroger la configuration du profil APN
Solution :
- Lier les profils APN au profil EPC de l'abonné
- S'assurer que le nom de l'APN correspond à la configuration du dispositif
- Vérifier que le profil QoS de l'APN existe
Cause 3 : MME Non Connecté
Symptômes :
- Tous les abonnés échouent à se connecter
- Aucune communication avec le MME
- Pair Diameter hors service
Étapes de Diagnostic :
- Vérifier la page Diameter du Panneau de Contrôle
- Vérifier que l'état du pair MME est "Connecté"
- Vérifier que le MME prend en charge l'application S6a
Solution :
- Dépanner la connectivité Diameter
- Vérifier la configuration du MME
- Contacter l'administrateur du MME
Cause 4 : Corruption de l'État de l'Abonné
Symptômes :
- L'abonné apparaît comme attaché mais ne peut pas se reconnecter
- L'état ne correspond pas à la réalité
- La déconnexion et la reconnexion échouent
Étapes de Diagnostic :
- Interroger l'état de l'abonné depuis la base de données
- Vérifier les affectations MME obsolètes
- Vérifier l'horodatage de la dernière mise à jour
Solution :
- Effacer l'état de l'abonné (procédure de déconnexion)
- Réinitialiser le MME de service dans l'état de l'abonné
- Peut nécessiter un cycle d'alimentation de l'abonné
Organigramme de Dépannage de l'Enregistrement EPC
Échecs d'Enregistrement IMS
Symptômes
- L'abonné ne peut pas s'enregistrer pour VoLTE
- "Échec de l'enregistrement IMS" sur le dispositif
- Les données fonctionnent mais la voix ne fonctionne pas
Causes et Solutions Courantes
Cause 1 : IMS Désactivé pour l'Abonné
Symptômes :
- L'abonné a des données mais pas d'IMS
- Enregistrement rejeté immédiatement
Étapes de Diagnostic :
- Interroger l'abonné et vérifier le champ
ims_enabled - Vérifier que l'abonné a un
ims_profile_idassigné
Solution :
- Activer IMS pour l'abonné
- Assigner un profil IMS
Cause 2 : S-CSCF Non Connecté
Symptômes :
- Tous les enregistrements IMS échouent
- Aucun trafic Diameter lié à l'IMS
Étapes de Diagnostic :
- Vérifier la page Diameter du Panneau de Contrôle
- Vérifier que le pair S-CSCF est connecté
- Vérifier que le S-CSCF prend en charge l'application Cx
Solution :
- Corriger la connectivité Diameter vers le S-CSCF
- Vérifier la configuration du S-CSCF
Cause 3 : Modèle IFC Manquant ou Invalide
Symptômes :
- L'enregistrement échoue lors de la Réponse d'Autorisation d'Utilisateur
- Erreurs liées à l'IFC dans les journaux
Étapes de Diagnostic :
- Interroger le profil IMS de l'abonné
- Vérifier que le modèle IFC est présent
- Vérifier la syntaxe XML de l'IFC
Solution :
- Mettre à jour le profil IMS avec un modèle IFC valide
- Voir la Documentation sur les Profils pour des exemples d'IFC
Cause 4 : Roaming Refusé pour l'IMS
Symptômes :
- L'IMS fonctionne sur le réseau domestique
- Échoue en roaming
- Le roaming de données fonctionne mais pas l'IMS
Étapes de Diagnostic :
- Vérifier l'action IMS du profil de roaming
- Vérifier que les règles de roaming ont la bonne
ims_action
Solution :
- Mettre à jour les règles de roaming pour autoriser l'IMS
- Ou mettre à jour l'action IMS par défaut du profil de roaming
Organigramme de Dépannage de l'Enregistrement IMS
Échecs d'Appels VoLTE
Symptômes
- L'enregistrement IMS réussit mais les appels échouent
- Audio unidirectionnel
- L'appel se coupe immédiatement
- Erreur "Appel échoué" sur le dispositif
Causes et Solutions Courantes
Cause 1 : P-CSCF Non Connecté
Symptômes :
- L'enregistrement fonctionne mais les appels échouent
- L'autorisation des médias échoue
Étapes de Diagnostic :
- Vérifier la page Diameter du Panneau de Contrôle
- Vérifier que le pair P-CSCF est connecté
- Vérifier que le P-CSCF prend en charge l'application Rx (fonction PCRF de OmniHSS)
Solution :
- Corriger la connectivité Diameter vers le P-CSCF
- Vérifier que la configuration du P-CSCF pointe vers OmniHSS pour Rx
Cause 2 : Autorisation de Médias Manquante
Symptômes :
- La configuration de l'appel commence mais échoue
- Échange AAR/AAA échoue
- Erreurs sur l'interface Rx
Étapes de Diagnostic :
- Vérifier les journaux pour les messages Diameter Rx
- Vérifier que AAR (AA-Request) a été reçu
- Vérifier la r��ponse AAA (AA-Answer)
Solution :
- Vérifier que le P-CSCF envoie AAR pour l'autorisation des médias
- Vérifier la configuration de l'application Rx de OmniHSS
- Vérifier que l'abonné a un enregistrement IMS actif
Cause 3 : Problèmes de QoS/Support de Porteuse
Symptômes :
- L'appel se connecte mais pas d'audio
- Audio unidirectionnel
- Problèmes de qualité
Étapes de Diagnostic :
- Vérifier le profil QoS de l'APN pour l'APN de voix
- Vérifier que le QCI est correctement défini (généralement QCI 1 pour la voix)
- Vérifier que le P-GW est connecté pour Gx (fonction PCRF)
Solution :
- Vérifier le profil QoS de l'APN pour l'APN IMS
- S'assurer que QCI 1 est configuré pour la porteuse de voix
- Corriger la connectivité Diameter vers le P-GW si nécessaire
Organigramme de Dépannage des Appels VoLTE
Problèmes de Roaming
Symptômes
- L'abonné fonctionne à domicile mais pas en roaming
- Certains réseaux de roaming fonctionnent, d'autres non
- Le roaming de données fonctionne mais pas la voix (ou vice versa)
Causes et Solutions Courantes
Cause 1 : Aucun Profil de Roaming Assigné
Symptômes :
- Le roaming échoue pour l'abonné
- D'autres abonnés roament avec succès
Étapes de Diagnostic :
- Interroger le champ
roaming_profile_idde l'abonné - Vérifier si le champ est nul
Solution :
- Assigner un profil de roaming à l'abonné
Cause 2 : Roaming Refusé par la Politique
Symptômes :
- Le roaming échoue de manière cohérente sur un réseau spécifique
- L'erreur indique un rejet de la politique
Étapes de Diagnostic :
- Identifier le MCC/MNC du réseau visité depuis le dispositif de l'abonné ou le MME
- Interroger le profil de roaming de l'abonné
- Vérifier les règles de roaming pour le MCC/MNC correspondant
- Vérifier l'action par défaut du profil
Solution :
- Ajouter une règle de roaming pour autoriser le réseau visité :
curl -k -X POST https://hss.example.com:8443/api/roaming/rule \
-H "Content-Type: application/json" \
-d '{
"roaming_rule": {
"name": "Autoriser le Réseau Visité",
"mcc": "310",
"mnc": "410",
"data_action": "allow",
"ims_action": "allow"
}
}'
Cause 3 : Données Autorisées mais IMS Refusé
Symptômes :
- Le roaming de données fonctionne
- Le roaming vocal/IMS échoue
- Disponibilité de service divisée
Étapes de Diagnostic :
- Interroger les règles de roaming pour le réseau visité
- Vérifier les valeurs
data_actionpar rapport àims_action - Vérifier les actions par défaut du profil de roaming
Solution :
- Mettre à jour la règle de roaming pour autoriser l'IMS :
- Définir
ims_action: "allow"
- Définir
- Ou mettre à jour
ims_action_if_no_rules_matchdu profil à"allow"
Voir la Documentation sur le Roaming pour une configuration détaillée.
Problèmes EIR
Symptômes
- Appareils bloqués de manière inattendue
- Appareils volés non bloqués
- Vérification EIR échouée
Causes et Solutions Courantes
Cause 1 : Regex IMEI Incorrect
Symptômes :
- Mauvais appareils bloqués/autorisés
- La règle correspond incorrectement
Étapes de Diagnostic :
- Interroger les règles EIR
- Identifier quelle règle correspond
- Tester le modèle regex contre l'IMEI réel
- Vérifier la priorité/l'ordre des règles
Solution :
- Mettre à jour la règle EIR avec le regex correct
- Tester le regex de manière approfondie avant de l'appliquer
- Considérer l'ordre des règles (première correspondance gagnante)
Cause 2 : MME Ne Pas Envoyer de Requêtes S13
Symptômes :
- La vérification EIR ne se produit jamais
- Tous les appareils sont autorisés indépendamment des règles
Étapes de Diagnostic :
- Vérifier si le MME est configuré pour utiliser l'interface S13
- Vérifier que le pair Diameter du MME est connecté
- Vérifier le support de l'application S13
- Examiner la configuration du MME
Solution :
- Configurer le MME pour effectuer des vérifications EIR via S13
- Vérifier que le pair Diameter prend en charge l'application S13 (16777252)
- Contacter l'administrateur du MME si nécessaire
Cause 3 : Pas de Règle par Défaut
Symptômes :
- Les appareils ne correspondant à aucune règle ont un comportement inattendu
Étapes de Diagnostic :
- Interroger toutes les règles EIR
- Vérifier si une règle de rattrapage existe
- Vérifier l'ordre des règles
Solution :
- Ajouter une règle par défaut avec regex
.*pour correspondre à tous les IMEIs - Définir l'action appropriée (liste blanche ou liste noire)
- S'assurer que les règles spécifiques sont vérifiées avant la règle de rattrapage
Problèmes de Performance
Symptômes
- Réponses API lentes
- Délais d'attente de requêtes Diameter
- Haute utilisation du CPU ou de la mémoire
- Panneau de Contrôle lent à charger
Causes et Solutions Courantes
Cause 1 : Charge Élevée sur la Base de Données
Symptômes :
- Toutes les opérations lentes
- Haute utilisation du CPU de la base de données
- Délais d'attente de requêtes
Étapes de Diagnostic :
- Vérifier l'utilisation des ressources du serveur de base de données
- Identifier les requêtes lentes
- Vérifier les index manquants
- Surveiller les modèles de requêtes
Solution :
- Optimiser les requêtes lentes
- Ajouter des index de base de données
- Augmenter les ressources de la base de données
- Envisager l'évolutivité de la base de données
- Voir les Problèmes de Base de Données
Cause 2 : Nombre Élevé d'Abonnés
Symptômes :
- Performance dégradée au fil du temps
- La lenteur est corrélée à la croissance des abonnés
- Les opérations de liste sont particulièrement lentes
Étapes de Diagnostic :
- Interroger le nombre total d'abonnés
- Vérifier les tailles des tables
- Examiner les plans d'exécution des requêtes
- Surveiller les tendances d'utilisation des ressources
Solution :
- Planifier une mise à niveau de capacité
- Optimiser les requêtes pour de grands ensembles de données
- Envisager la pagination pour de grands résultats
- Mettre en œuvre un cache si nécessaire
Cause 3 : Problèmes de Pair Diameter
Symptômes :
- Les opérations Diameter sont lentes
- Délais d'attente sur un pair spécifique
- Certains pairs rapides, d'autres lents
Étapes de Diagnostic :
- Vérifier la page Diameter du Panneau de Contrôle
- Identifier le pair lent
- Tester la latence réseau vers le pair
- Vérifier l'utilisation des ressources du pair
Solution :
- Enquêter sur les problèmes de performance du pair
- Vérifier le chemin réseau pour la congestion
- Envisager d'ajouter des pairs redondants
- Augmenter le délai d'attente Diameter si nécessaire
Cause 4 : Problèmes de Mémoire
Symptômes :
- Utilisation de la mémoire élevée par OmniHSS
- Erreurs de mémoire insuffisante
- La performance se dégrade au fil du temps
Étapes de Diagnostic :
- Vérifier l'utilisation de la mémoire de OmniHSS sur la page Application
- Surveiller la tendance de la mémoire
- Vérifier les fuites de mémoire
- Examiner les paramètres de la VM Erlang
Solution :
- Redémarrer OmniHSS pour effacer la condition temporaire
- Enquêter sur les fuites de mémoire si l'utilisation augmente continuellement
- Ajuster les paramètres de mémoire de la VM Erlang dans runtime.exs
- Planifier une mise à niveau matérielle si l'utilisation est constamment élevée
Problèmes d'État des Abonnés
Symptômes
- L'abonné apparaît comme attaché mais ne l'est pas
- Informations d'état obsolètes
- Informations de localisation incorrectes
- Impossible de détacher l'abonné
Causes et Solutions Courantes
Cause 1 : Crash/Réinitialisation du MME
Symptômes :
- L'abonné montre un MME de service qui ne sert plus
- L'abonné ne peut pas se connecter après le redémarrage du MME
- L'état est obsolète
Étapes de Diagnostic :
- Vérifier l'état de l'abonné pour le MME de service
- Vérifier si le MME a redémarré
- Vérifier l'heure de la dernière connexion du MME
Solution :
- Attendre que l'abonné se reconnecte (l'état sera mis à jour)
- Ou effacer manuellement l'état de l'abonné
- Le MME doit envoyer Cancel-Location lors du redémarrage
Cause 2 : Détachement Réseau Non Reçu
Symptômes :
- L'abonné éteint mais apparaît comme attaché
- Les sessions PDN restent dans la base de données
- La localisation n'est pas effacée
Étapes de Diagnostic :
- Vérifier l'horodatage last_seen de l'abonné
- Vérifier si l'ancien état (heures ou jours) est obsolète
- Vérifier si le dispositif de l'abonné est accessible
Solution :
- L'état sera effacé lorsque l'abonné se reconnectera
- Ou attendre le délai d'expiration de l'état (si mis en œuvre)
- Un nettoyage manuel peut être nécessaire pour un état très obsolète
Cause 3 : Corruption de la Base de Données
Symptômes :
- État incohérent à travers les tables
- Violations de clés étrangères
- L'état n'a pas de sens
Étapes de Diagnostic :
- Interroger l'état de l'abonné directement depuis la base de données
- Vérifier les enregistrements orphelins
- Vérifier l'intégrité référentielle
Solution :
- Identifier et corriger les données incohérentes
- Peut nécessiter un nettoyage manuel de la base de données
- Contacter le support si la corruption est généralisée
Problèmes d'API
Symptômes
- L'API renvoie des erreurs
- Réponses API lentes
- Impossible de créer/mettre à jour des entités
- Erreurs 500
Causes et Solutions Courantes
Cause 1 : Données de Requête Invalides
Symptômes :
- Erreurs 400 ou 422
- Messages d'erreur de validation
- Champ rejeté
Étapes de Diagnostic :
- Examiner la réponse d'erreur pour des erreurs de champ spécifiques
- Vérifier le format de la requête API
- Vérifier que les champs requis sont présents
- Vérifier les types de données
Solution :
- Corriger les données de requête pour correspondre à la référence API
- S'assurer que tous les champs requis sont inclus
- Vérifier que les références de clés étrangères existent (ID de profil, etc.)
Cause 2 : Contrainte de Clé Étrangère
Symptômes :
- Impossible de créer un abonné
- Erreur : "key_set_id n'existe pas"
- Entité référencée non trouvée
Étapes de Diagnostic :
- Identifier quelle clé étrangère échoue
- Vérifier que l'entité référencée existe :
- key_set_id → ensembles de clés
- epc_profile_id → profils EPC
- ims_profile_id → profils IMS
Solution :
- Créer d'abord l'entité référencée
- Ou utiliser l'ID d'une entité existante
- Suivre le flux de travail de provisionnement complet
Cause 3 : Connectivité de Base de Données
Symptômes :
- Erreurs 500
- Tous les appels API échouent
- Erreurs de connexion à la base de données
Solution :
- Voir les Problèmes de Base de Données
Outils et Commandes de Diagnostic
Vérifications Rapides du Panneau de Contrôle
-
Aperçu du Système
- URL :
https://[hostname]:7443/overview - Vérifier : Comptes d'abonnés, sessions actives, état du système
- URL :
-
État Diameter
- URL :
https://[hostname]:7443/diameter - Vérifier : Tous les pairs critiques connectés
- URL :
-
Santé de l'Application
- URL :
https://[hostname]:7443/application - Vérifier : Utilisation de la mémoire, nombre de processus, temps de fonctionnement
- URL :
Commandes de Diagnostic API
Vérifier la Santé du Système :
curl -k https://hss.example.com:8443/api/status
Interroger un Abonné :
# Par IMSI
curl -k https://hss.example.com:8443/api/subscriber/imsi/001001123456789
# Par MSISDN
curl -k https://hss.example.com:8443/api/subscriber/msisdn/14155551234
# Par ID
curl -k https://hss.example.com:8443/api/subscriber/1
Lister Tous les Abonnés :
curl -k https://hss.example.com:8443/api/subscriber
Vérifier la Configuration du Profil :
# Profil EPC
curl -k https://hss.example.com:8443/api/epc/profile/1
# Profil IMS
curl -k https://hss.example.com:8443/api/ims/profile/1
# Profil de Roaming
curl -k https://hss.example.com:8443/api/roaming/profile/1
Commandes de Diagnostic Réseau
Tester la Connectivité du Port Diameter :
telnet [PEER_IP] 3868
Vérifier le Certificat TLS :
openssl s_client -connect [hostname]:8443 -showcerts
Tester la Connectivité de la Base de Données :
# PostgreSQL
psql -h [DB_HOST] -U [DB_USER] -d [DB_NAME] -c "SELECT COUNT(*) FROM subscriber;"
# MySQL
mysql -h [DB_HOST] -u [DB_USER] -p -e "SELECT COUNT(*) FROM subscriber;" [DB_NAME]
Analyse des Journaux
Rechercher des Journaux pour un IMSI Spécifique :
grep "001001123456789" /var/log/omnihss/omnihss.log
Trouver des Échecs d'Authentification :
grep "authentication.*fail" /var/log/omnihss/omnihss.log
Vérifier les Événements des Pairs Diameter :
grep "Diameter peer" /var/log/omnihss/omnihss.log
Trouver des Erreurs de Base de Données :
grep -i "database.*error" /var/log/omnihss/omnihss.log
Directives d'Escalade
Quand Escalader
Escalader au support technique/ingénierie lorsque :
- Pannes à l'échelle du système qui ne peuvent pas être résolues avec des procédures documentées
- Corruption de données ou état incohérent de la base de données
- Bugs logiciels suspectés ou comportement inattendu
- Problèmes de performance qui ne peuvent pas être résolus par un réglage
- Incidents de sécurité ou accès non autorisé
- Questions sur un comportement non documenté
Informations à Fournir
Lors de l'escalade, inclure :
- Symptômes détaillés - Ce qui échoue, quand, pour qui
- Étapes entreprises - Ce que vous avez déjà fait en matière de dépannage
- Journaux - Extraits de journaux pertinents montrant le problème
- Configuration - Portions pertinentes de runtime.exs (masquer les données sensibles)
- Environnement - Version de OmniHSS, version de la base de données, version du système d'exploitation
- Impact - Combien d'abonnés sont affectés, impact commercial
- Exemples d'abonnés - IMSIs spécifiques montrant le problème
Critique vs Non-Critique
Problèmes Critiques (Escalader Immédiatement) :
- Système complètement hors service
- Tous les abonnés incapables de se connecter
- Corruption de base de données
- Violation de sécurité
Problèmes Non-Critiques (Documenter et Escalader Pendant les Heures de Bureau) :
- Problèmes d'abonnés uniques qui peuvent être contournés
- Dégradation de performance gérable
- Demandes d'amélioration
- Questions de documentation
Référence des Messages d'Erreur Courants
Erreurs d'Authentification
| Message d'Erreur | Cause | Solution |
|---|---|---|
| "Échec de génération des vecteurs d'authentification" | Ensemble de clés manquant ou invalide | Vérifier la configuration de l'ensemble de clés |
| "Échec de synchronisation SQN" | SQN désynchronisé | Attendre la resynchronisation |
| "Abonné non trouvé" | IMSI invalide | Vérifier l'IMSI, provisionner l'abonné |
| "Abonné désactivé" | enabled=false | Activer l'abonné |
Erreurs Diameter
| Message d'Erreur | Cause | Solution |
|---|---|---|
| "Délai d'attente de connexion au pair Diameter" | Problème réseau | Vérifier la connectivité réseau |
| "Échange CER/CEA échoué" | Incompatibilité de configuration | Vérifier la configuration Diameter |
| "Application non supportée" | Le pair ne prend pas en charge l'application requise | Vérifier les applications du pair |
| "Échec de la poignée de main TLS" | Problème de certificat | Vérifier les certificats |
Erreurs de Base de Données
| Message d'Erreur | Cause | Solution |
|---|---|---|
| "Connexion refusée" | Base de données hors service | Démarrer la base de données |
| "Authentification échouée" | Mauvais identifiants | Corriger les identifiants |
| "Aucune connexion disponible" | Pool épuisé | Augmenter la taille du pool |
| "Délai d'attente de requête" | Requête lente | Optimiser les requêtes |
Erreurs d'API
| Message d'Erreur | Cause | Solution |
|---|---|---|
| "key_set_id n'existe pas" | Clé étrangère invalide | Créer d'abord l'ensemble de clés |
| "L'IMSI a déjà été pris" | IMSI en double | Utiliser un IMSI différent ou supprimer l'existant |
| "Erreur de validation" | Entrée invalide | Vérifier le format et les exigences des champs |
← Retour au Guide des Opérations | Suivant : Référence API →