Diagrammes de flux sur plans factoriels

Flowchart
    Derrière ce nom barbare se cache une méthode d'analyse graphique de séquences représentant des successions d'items (comportementaux par exemple). Elle a été proposée par Pierre & Kasper (1990), mais est plus facilement compréhensible dans cet article de van Baaren et al. (1993). En deux mots, il s'agit d'une AFC sur la matrice de transition (modifiée) entre les différents items.

   La méthode fournit un diagramme de flux, c'est-à-dire une représentation en deux dimensions sur laquelle :
 (i) chaque item est représenté par une ellipse dont la taille est proportionnelle à la fréquence de l'item
 (ii) les items sont reliés deux à deux par une flèche dont la largeur est proportionnelle à la fréquence de transition entre l'item de départ et celui d'arrivée.

   Je trouve cette méthode relativement géniale car elle permet non seulement de comprendre très intuitivement la façon dont sont structurées les séquences mais aussi de comparer ces séquences dans différents contextes. En écologie chimique (mais pas seulement), elle est donc particulièrement utile.

   Comme elle n'était pas implémentée dans R, j'ai écrit la fonction seq.flowchart() qui permet de tracer ces diagrammes de flux, selon la méthode de Pierre & Kasper. Elle travaille sur un tableau dont chaque ligne correspond à la succession d'items d'un individu.

   Le fichier R contient la fonction et l'explication de tous ses arguments. Pour l'utiliser, il suffit de faire Fichier > Sourcer du code R... Je joins à ce fichier un jeu de données d'exemple (dont est issu le graphe ci-dessus), qui est un extrait de 50 individus du jeu de données de McVicar & Anyadike-Danes (2002). Dans cette étude de sciences sociales, la situation professionnelle de 712 jeunes irlandais a été suivie mensuellement pendant six ans.

   Pour nuancer un peu les choses, la méthode des diagrammes de flux sur plans factoriels est très utile mais permet seulement l'analyse des transitions entre les items, sans tenir compte du temps passé dans chacun. Pour une analyse quantitative prenant en compte ces durées, voyez l'excellent package TraMineR et les méthodes (plus complexes) qui y sont implémentées.

Pour télécharger les deux fichiers, cliquez sur l'icône ci-dessous.

Fichiers


Graphes de choix

   Beaucoup d'expérimentations génèrent des données de type "choix entre deux modalités". Les graphes classiquement utilisés pour illustrer ces résultats n'étant pas triviaux à tracer sous R, j'ai créé une petite interface dédiée. Deux types de résultats peuvent être représentés : proportions (ex : tant d'individus ont choisi telle modalité, quand tant d'autres ont choisi l'autre) ou moyennes (ex : l'individu a passé tant de temps dans telle modalité, et tant de temps dans l'autre) :




   L'interface ressemble à ça :

Interface

   Le fichier zip contient le code de l'interface et les deux jeux de données ayant permis de tracer les graphes au-dessus. Pour lancer l'interface, il suffit de faire Fichier > Sourcer du code R... et de choisir le fichier Graphes_choix.R (même pas besoin d'ouvrir ce fichier), puis de taper la commande graphe.choix(). Trois packages doivent être installés pour que l'interface fonctionne : tcltk, tkrplot et jpeg.

Pour télécharger les deux fichiers, cliquez sur l'icône ci-dessous.

Zip