Aide-mémoire de statistique appliquée à la biologie - Construire son étude et analyser les résultats à l'aide du logiciel R

Version finale (mise à jour 03.01.2020)

(cliquez sur l'image pour télécharger le document)

Ce document a pour vocation de guider les biologistes peu à l'aise en statistiques dans la construction de leurs expériences et l'analyse de leurs résultats. Il vise à les rendre autonomes, tout en assurant une analyse de qualité.

Il mêle à la fois :

(i) des notions théoriques fondamentales : les plans d'expérience, le principe de fonctionnement des tests...

(ii) des arbres de décision pour choisir le test approprié selon la situation, tout en respectant les conditions de son emploi

(iii) la description des commandes à utiliser pour réaliser l'analyse dans R. Pour les personnes non familières de ce logiciel/langage, un rappel sur les objets de base ou la création d'un jeu de données au bon format sont proposés.

La majorité des analyses courantes, descriptives comme inférentielles, univariées comme multivariées, sont couvertes sous forme de 117 fiches.

Cet aide-mémoire est associé au package R RVAideMemoire.

GrapheR

Les graphes que l'on peut tracer dans R sont de grande qualité (rien de comparable avec Excel), mais les tracer est souvent une épreuve car les commandes graphiques sont très nombreuses. Sans une bonne motivation et un temps certain devant soi, il arrive souvent que l'on se contente de graphes de moins bonne qualité (et beaucoup moins paramétrables) obtenus en quelques minutes dans un tableur. C'est fort dommage, et c'est pour essayer de remédier à cela que j'ai créé l'interface GrapheR.

L'objectif premier de ce package est de permettre la création rapide de graphes de qualité, en particulier à des fins de publication. Dans un second temps, pour les utilisateurs désirant apprendre les commandes graphiques, il est possible d'enregistrer dans un fichier externe (au format .R) le code aboutissant aux graphes tracés.

Les six types de graphe les plus courants peuvent être tracés : histogrammes, diagrammes en boîtes à moustaches, diagrammes en barres, camemberts, courbe(s) et nuage(s) de points.

Quel que soit le type de graphe choisi, de nombreuses options sont paramétrables facilement grâce à un ensemble de menu et de boutons. Pour une description plus complète, vous pouvez vous référer au manuel (en français, également disponible en anglais et en allemand) fourni avec le package.

Le package se télécharge directement depuis R, à partir du menu Packages > Installer le(s) package(s)... ou via la commande suivante : install.packages("GrapheR"). Pour lancer l'interface après avoir chargé le package, utilisez la commande run.GrapheR(). C'est la seule commande que vous aurez à taper.

Un aperçu de l'interface (qui est également disponible en anglais, en espagnol et en allemand - notamment grâce à l'aide d'utilisateurs volontaires) et des possibilités offertes :

SequenceR

(cliquez ici pour télécharger le fichier R nécessaire au lancement de l'interface et un guide d'utilisation détaillé)

La manière la plus simple et la plus efficace de mener des expérimentations où l'on doit observer finement le comportement d'un organisme est d'utiliser une interface d'encodage en temps réel. La plus connue, la plus utilisée et sans doute la meilleure est The Observer de Noldus. Cependant ce logiciel est payant, ce qui est souvent un frein à son utilisation.

Pour les expérimentations ne nécessitant que le suivi d'un seul individu, j'ai créé l'interface sequenceR qui est une alternative gratuite. Elle est implémentée dans R (il faut donc avoir installé ce logiciel pour lancer l'interface), mais ne nécessite pas du tout de connaître le langage R pour être utilisée.

SequenceR permet de définir des items comportementaux de plusieurs types (ponctuels ou ayant une certaine durée), d'encoder simplement les séquences en temps réel et d'enregistrer les résultats sous plusieurs formats.