Aller au contenu

Données nécessaires pour une Fouille de Données

Les tableaux ci-dessous décrivent les données indispensables (obligatoire), et/ou optionnelles (optionnel) dont le logiciel a besoin pour effectuer une analyse.

Tout format d'entrée (fichier) devra contenir ces champs, qui seront repris dans l'API d'alimentation de données.

Nom Description obligatoire/optionnel
Identifiant du cas (Case ID) Permet de distinguer, dans les traces, le cas auquel l'activité se rapporte (exemples : identifiant client, dont on cherche à analyser la succession d'activités, lot de production, n° de dossier client, ... ) obligatoire
Activité Description ou nom d'une activité (peut être couplé à un identifiant d'activité) obligatoire
Date de début d'activité Date à laquelle une activité débute obligatoire
Date de fin d'activité Date à laquelle une activité se termine recommandé (*)
Ressource Description de la ressource intervenant dans l'activité (ex: Conseiller client, Ressource de production, ...) recommandé (**)
Autres informations Si la source de donnée contient d'autres informations permettant, comme les Ressources par exemple, de compléter l'analyse métier, de catégoriser, de comprendre ou de déduire le comportement du processus, ces informations sont évidemment à conserver. Elles ne sont pas décrites formellement en tant que données nécessaires, mais peuvent apporter beaucoup à l'analyse. Exemples : période de promotion, contexte commercial, usine de production, ... optionnel

(*) Si on veut tirer partie du temps passé dans les activités

(**) Si on veut obtenir des informations pertinentes sur les Ressources associées au processus

Exemple de fichier d'événements : processus industriel

Exemple fictif d'un processus industriel. La seconde ligne indique le mapping métier correspondant aux données nécessaires

Identifiant Activité Date début Date fin Ressource Autre
N° lot étape horodatage entrée horodatage sortie id robot chaine de production
1 decoupe 13:46:00 13:46:24 R2 RENNES
1 emboutissage 13:46:26 13:46:28 R2 RENNES
1 marquage 13:46:30 13:46:33 R2 RENNES
1 sertissage 13:46:36 13:46:40 R2 RENNES
1 etiquette 13:46:45 13:46:46 R2 RENNES
2 decoupe 13:46:05 13:46:29 R2 LYON
2 emboutissage 13:46:30 13:46:32 R2 LYON
2 marquage 13:46:35 13:46:37 R2 LYON
2 etiquette 13:46:40 13:46:41 R2 LYON

Autre Exemple d'événements : processus marchand

Identifiant Activité Date début Date fin Ressource Autre Autre
N° commande activité date conseiller produit quantité
57021 commande 28/01/2016 11:10:05 Ludovic iPhone 1
57022 commande 28/01/2016 12:34:23 Sarah Disque dur 2 To 2
57023 commande 28/01/2016 13:30:20 André Casque audio 1
57021 vérification stock 28/01/2016 11:15:05 Ludovic iPhone 1
57022 livraison 28/01/2016 12:35:23 Sarah Disque dur 2 To 2
57023 annulation 28/01/2016 13:33:10 André Casque audio 1

Autre Exemple d'événements : parcours hospitalier

Identifiant Activité Date début Date fin Ressource Autre Autre
patient soin date entrée date sortie personnel age classe de coût
883 radiologie 10/12/2016 09:10:05 10/12/2016 09:23:09 Dr Durant 45 A
884 accueil 10/12/2016 09:12:50 10/12/2016 09:20:30 J. Dupuis 65
884 test sanguin 10/12/2016 10:02:20 10/12/2016 10:23:12 A. Joyeux 65 C
884 facturation 10/12/2016 10:45:05 10/12/2016 10:50:22 J. Dupuis 65
880 scanner 10/12/2016 11:10:00 10/12/2016 11:50:09 Dr Poisson 36 E