Quelques programmes sous MATLAB ou Octave

Voici quelques programmes de statistiques et d'analyse des données sous MATLAB/Octave. Les techniques sont très classiques, mais les logiciels commerciaux sont souvent mal adaptés: les logiciels anglo-saxons ignorent souvent l'AFC, l'ADDAD ou STATITCF ont des sorties un peu désuètes, le PPDS de Super-ANOVA est faux (pas super)... Après le cours de statistique, vous connaissez toutes ces techniques, il vous est donc aisé de modifier ces programmes ou de les adapter pour des utilisations spécifiques. Toute suggestion d'amélioration est bienvenue, contactez

Bertrand HEYD
ENSIA,
1 av des Olympiades
91305 MASSY, FRANCE

ou heyd@massy.inra.fr

Pour vous éviter une saisie fastidieuse, les programmes sont tous accessibles sur l'internet .
Sous Matlab on peut utiliser l'interface utilisateur "adons.m". Etant donné les légères différence au niveau de la gestion des graphes, une traduction en Octave est disponibles.
La première partie regroupe de petits programmes utilisés par tous les modules d'analyse des données. Ils permettent de centrer les matrices (centnorm), de faire un graphe croisé (gvar gacp ou de charger les noms des variables (noms).

Chaque méthode comporte une unité générale faisant les calculs (uacp, uafc, uaftd) et une autre permettant de gérer les fichiers et d'effectuer la sortie des résultats. En général le programme a besoin d'un fichier de données nom.don et de deux fichiers contenant les noms des variables nom.col et nom.lgn (deux exemples sont fournis dans c:\matlab\toolbox\adons\donnees: les données ble.don, ble.col et ble.lgn.

Vous pouvez ainsi faire une Analyse en Composantes Principales, une Analyse Factorielle des Correspondances une Analyse Factorielle d'un Tableau de Distances ou une Classification Ascendante Hiérarchique.

Ces programmes ne contiennent pas les nombreuses options proposées par ADDAD, mais s'ils ne vous donnent pas entière satisfaction, modifiez-les! Vous avez des individus supplémentaires? Multipliez leurs coordonnées (centrées normées) par vep (matrice de passage) renvoyée par uacp et vous obtiendrez leur projection dans le nouveau repère.

MATLAB fournit une ANalyse de VAriance (anova1 et anova2) bien faite mais ne permettant ni de travailler a plus de deux facteurs ni de calculer le PPDS de Fisher ni de travailler avec des groupes de taille inégale. anava est un peu plus délicate d'emploi, mais elle le permet. ppds permet de faire les comparaisons deux à deux quand l'ANoVA montre une différence significative entre les groupes. gppds permet de présenter les résultats de façon classique. Certains programmes sont alambiqués (cf gppds), si vous avez des suggestions n'hésitez pas. Je une unité de régression ureg est également disponible.

Le programme adon permet le gerer le traitement des données dans les cas simple. Au démarrage il demande le nom d'un fichier .don, et charge le .col et .lgn associes. Il permet d'effectuer ACP, AFC, CAH, ANoVA. Je tiens également à votre disposition des programmes de cartographie des préférences, d'analyse factorielle discriminante et d'analyse procrustéenne, encore trop peu finis pour figurer ici. Si vous avez des idées ou des problèmes, contactez moi! Bon courage Bertrand HEYD P.S. moins sérieux, julien.m donne le jour julien, et calrev donne la date du calendrier de la Révolution (métrique)