Premiers pas avec la classification des tickets (Ticket Classification)

Ivanti Neurons Machine Learning Lab (Labo d'apprentissage machine) vous fournit un environnement où vous pouvez créer, entraîner et déployer des modèles de Machine Learning. Cette section vous guide dans le processus de préparation et de configuration de modèles de classification des tickets (Ticket Classification) pour Neurons for ITSM.

Que fait Ticket Classification ?

Lorsqu'un incident est créé dans Neurons for ITSM, il est automatiquement classé, en temps réel, par un modèle de Machine Learning qui le met dans le service, la catégorie et la sous-catégorie appropriés en fonction du contenu du champ Sujet. Vous pouvez entraîner et déployer votre propre modèle en accédant au labo Machine Learning Lab de la plateforme Neurons et en téléchargeant les données d'entraînement.
Ticket Classification :

est compatible avec Neurons for ITSM en version sur site comme en version Cloud ;
est disponible pour les clients qui possèdent à la fois Neurons for ITSM et Neurons for Healing.

Ticket Classification exige que votre instance Neurons for ITSM soit de version 2021.3 ou supérieure.

Configuration de Ticket Classification

Le processus de configuration comprend les étapes suivantes :

1. Connexion de vos instances de Neurons for ITSM et de la plateforme Ivanti Neurons

Pour connecter vos instances de Neurons for ITSM et la plateforme Neurons, envoyez une demande de service à l'équipe Ivanti Cloud Ops (Support). Elle appliquera la configuration nécessaire à Neurons for ITSM.

Si vous utilisez Neurons for Healing et que vous possédez Neurons for ITSM mais que vous ne voyez pas l'option Logiciels > Machine Learning Lab dans la plateforme Neurons, contactez le support Ivanti.

2. Exportation de données pour entraîner votre modèle de Machine Learning

Même si Neurons Machine Learning Lab facilite énormément la création de modèles de Machine Learning, le résultat dépend aussi de la qualité des données d'entraînement que vous fournissez. Ces données serviront à entraîner le modèle. En fait, les données d'entraînement sont tout simplement un ensemble vérifié d'incidents créés précédemment, avec leur classification.
Pour des résultats optimaux, le jeu de données doit couvrir toutes les classes possibles, c'est-à-dire les combinaisons Service, Catégorie et Sous-catégorie disponibles dans votre environnement Neurons for ITSM.
Si votre environnement Neurons for ITSM utilise (également) Service réel, Catégorie réelle et Sous-catégorie réelle, et que ces données sont plus précises, pensez à plutôt utiliser ces champs « réel ».

Pour exporter des incidents pour votre jeu de données d'entraînement :

Ouvrez l'espace de travail Incident dans Neurons for ITSM.
Créez une requête qui renvoie les données d'incident à préparer pour entraîner votre modèle de Machine Learning.
Accédez à Plus > Actions de formulaire > Exporter.

Configuration requise pour les données d'entraînement

Le fichier doit être au format CSV, avec une virgule comme séparateur.
Le fichier doit contenir :
- une colonne nommée Sujet ;
- au moins l'une des colonnes Service, Catégorie et Sous-catégorie, selon la configuration et l'utilisation.

Après l'exportation des données depuis Neurons for ITSM, vous pouvez commencer à préparer votre jeu de données pour l'entraînement.
Si vous choisissez d'utiliser les données Service réel, Catégorie réelle et Sous-catégorie réelle, ces colonnes doivent être renommées respectivement Service, Catégorie et Sous-catégorie.

Ivanti vous recommande de supprimer toutes les autres colonnes du fichier CSV exporté.

3. Nettoyage des données d'entraînement

Veillez à bien traiter tous les points de cette étape, car cela peut avoir un impact important sur la précision du modèle.
Pour une meilleure vue d'ensemble, pensez à trier vos données sur le champ Service, Catégorie ou Sous-catégorie. Cela crée en fait une liste triée par classe.

Le nettoyage des données d'entraînement inclut les actions suivantes :

Suppression des informations d'identification personnelle.
Cela évite les problèmes potentiels de respect de la vie privée et (ce qui est tout aussi important ici) évite que des données de ce type affectent le modèle.
Exemple :Si les données d'entraînement contiennent une ligne d'objet avec un numéro de téléphone, le modèle qui en découle peut interpréter ce numéro comme définissant une classe spécifique.
Suppression ou changement du nom des classes obsolètes.
Toutes les classes des données d'entraînement doivent exister dans Neurons for ITSM. Si un modèle propose une classe non disponible, l'utilisateur voit un message d'erreur et l'incident risque de ne pas être enregistré.
Si vos données d'entraînement contiennent des échantillons de classes désormais obsolètes, vous pouvez :
- renommer l'échantillon pour utiliser la classe disponible correcte (si possible) ;
- supprimer l'échantillon.
  Vérifiez que vos données d'entraînement contiennent suffisamment d'échantillons, à la fois pour chaque classe et au total.
  Reportez-vous à « Pour améliorer la précision du modèle d'apprentissage » (ci-après)
Correction ou suppression des exemples avec des classifications trop génériques.
Les classes contenant des valeurs comme « Autre » ou « Sans catégorie » peuvent être trop génériques.
Corrigez ces exemples pour utiliser des classes plus spécifiques chaque fois que c'est possible, dont le sujet contient des informations utiles pour prédire la classe.
Suppression des exemples où le sujet contient très peu d'informations ou des détails inutiles.
Par exemple, les échantillons avec le sujet « Demande urgente ! ou « Besoin d'aide immédiatement » ne contiennent aucune information utilisable pour entraîner le modèle.
Correction des classifications incorrectes.
Par exemple, si un incident dont le sujet est « Mon clavier a perdu toutes ses touches» porte la classe « Réseau », corrigez-la et utilisez la classe « Périphériques ».
Suppression ou division des exemples où le sujet contient des informations sur plusieurs incidents de classes différentes.
Les utilisateurs combinent parfois des problèmes totalement différents dans le même incident. Par exemple, « Mon clavier est en panne et j'ai besoin d'une VM ».
Supprimez cet exemple ou divisez-le en deux incidents distincts, chacun affecté à la classe correcte.
Vérification de la cohérence de vos données d'entraînement et amélioration si nécessaire.
Les incidents dotés de champs Sujet presque identiques (avec la même signification) doivent recevoir la même classification.
Exemple
Pour les sujets suivants :
- « Ma caméra ne fonctionne pas pendant un appel vidéo »
- « J'étais en plein appel vidéo quand ma caméra s'est arrêtée »
Les classes « Appel vidéo » et « Webcam » sont toutes les deux correctes, mais il est important que ces deux incidents soient affectés à la même classe dans vos données d'entraînement.
Vérification : toutes les classes possibles doivent être représentées avec suffisamment d'exemples.
Machine Learning Lab a besoin d'avoir assez d'exemples pour créer un modèle précis.
Si vos données d'entraînement contiennent un grand nombre de classes avec seulement quelques exemples, vous devez augmenter la quantité de ces données d'entraînement.
Vous pouvez aussi essayer de fusionner et/ou de supprimer certaines de ces classes.
Réduction du nombre d'exemples des classes représentées par un nombre d'exemples supérieur à la moyenne.
Ces « classes dominantes » affectent la précision, car le modèle est plus susceptible de choisir une classe dominante.

Pour améliorer la précision du modèle d'apprentissage

Veillez à ce que vos données d'entraînement :

contiennent uniquement des classifications que vous savez être correctes ;
soient cohérentes ;
contiennent des quantités (à peu près) égales de chaque classe, quelle que soit la fréquence d'utilisation réelle de ces classes ;
contiennent au moins 50 échantillons par classe. Cependant, tant que vos échantillons répondent aux trois premiers critères et que vos données ont été correctement nettoyées, il est en général plus intéressant d'en avoir plus.

Exemple

Si votre environnement utilise 10 services et que chaque service compte 5 catégories, vous avez 10 x 5 = 50 classes.
Votre jeu de données d'entraînement doit par conséquent compter au moins 50 classes x 50 exemples = 2 500 exemples au total.

La quantité minimale peut parfois suffire à créer un modèle précis, cela dépend de vos données et de vos classes.

4. Préparation d'un fichier de mots vides (facultatif)

Pour améliorer les performances d'un modèle, vous pouvez choisir de fournir un fichier de mots vides. Ce fichier contient les mots que le modèle doit ignorer.
Par défaut, le jeu de mots vides de NLTK est automatiquement appliqué.

Configuration requise pour les mots vides

Le fichier doit être au format CSV ou TXT.
Le fichier doit contenir un seul mot vide par ligne.

5. Création et entraînement de votre modèle de Machine Learning

Une fois les données préparées, vous pouvez commencer à créer et à entraîner votre modèle.

Ajoutez un nouveau modèle.
Téléchargez votre fichier de données d'entraînement et (facultatif) le fichier de mots vides.
Enregistrez vos changements.
Entraînez votre modèle.

Machine Learning Lab démarre le processus d'entraînement.

Une fois l'entraînement terminé, l'onglet Détails du modèle indique son niveau de précision. En fonction de cette précision, vous pouvez décider ou non de déployer le modèle.
Pour une meilleure précision, mettez à jour vos données d'entraînement et/ou vos mots vides.

6. Déploiement du modèle de Machine Learning entraîné

Une fois votre modèle entraîné, vous pouvez le déployer dans votre environnement.
Après le déploiement, le modèle commence à classifier les incidents dans votre environnement Neurons for ITSM.

7. Activation de Ticket Classification dans Neurons for ITSM

Dans Neurons for ITSM, activez la classification des tickets (Ticket Classification).
Pour savoir comment procéder, reportez-vous à « Configuration de Ticket Classification » dans le Guide de configuration de Neurons for ITSM.

Quand faut-il entraîner un modèle ?

Vous pouvez choisir d'entraîner un nouveau modèle pour améliorer la précision de vos modèles, par exemple si vous avez continué à nettoyer vos données d'entraînement.
Mais il existe des situations où l'entraînement d'un nouveau modèle est nécessaire, voire même urgent :

Lorsque des classes deviennent obsolètes
Si un modèle propose une classe qui n'est plus disponible, l'utilisateur voit un message d'erreur dans Neurons for ITSM et l'incident risque de ne pas être enregistré.
Comment éviter cette erreur
1. Mettez à jour vos données d'entraînement pour qu'elles ne contiennent plus aucun exemple utilisant la classe obsolète.
  Affectez une autre classe à ces exemples ou supprimez-les totalement.
2. Utilisez les données d'entraînement pour entraîner un nouveau modèle.
3. Déployez le nouveau modèle.
4. Marquez la classe comme obsolète dans Neurons for ITSM.
Lorsqu'une classe change de mode d'utilisation
Exemples :
- Une classe utilisée pour des téléphones fixes est désormais utilisée pour des périphériques mobiles.
- Un programme de votre environnement a été remplacé ou vous en avez introduit un nouveau.
- Un nouveau type de produit (tablettes ou montres connectées, par exemple) arrive sur le marché, pour lequel des incidents peuvent être créés.
Sans un nouveau modèle entraîné avec des données contenant également des exemples d'incidents reflétant ces changements, la précision peut diminuer.
Lorsque de nouvelles classes sont créées.
Un modèle ne peut proposer que les classes avec lesquelles il a été entraîné. Si vous ne créez pas de nouveau modèle sur la base de données d'entraînement contenant les nouvelles classes, votre modèle ne les proposera jamais.