Guide pratique pour comprendre la dernière controverse sur la « crosse de hockey »" />

Guide pratique pour comprendre la dernière controverse sur la « crosse de hockey »

validité des CPs

Cette détermination est généralement fondée sur une «simulation de Monte Carlo » (ainsi appelée en raison de la nature probabiliste des calculs). Par exemple, si vous prenez 1000 groupes de chiffres au hasard (qui auront les mêmes propriétés statistiques que le groupe de chiffres en question), et que vous effectuez 1000 fois l’analyse ACP, vous obtiendrez 1000 différentes premieres CP. Chacun d’entre eux expliquera une quantité différente de variation (ou variance) dans les chiffres d’origine. Ordonnés par degré d’explication de variance, le décile inférieur défini le niveau de confiance 99 % : c’est à dire que si votre CP réelle explique plus de variance que 99% du CP aléatoire, alors vous pouvez dire qu’il est significatif à 99 %. Ceci peut être effectué successivement pour chacune des CP. (Cette technique a été introduite par Preisendorfer et ses collègues (1981), et est appelée la règle normative de Preisendorfer).

La figure de droite donne deux exemples de cela. Dans ce graphique, chaque CP est positionnée en fonction de la fraction de variance qu’elle représente. La ligne bleue correspond à une série aléatoire de chiffres, alors que les points bleus sont le résultat de CP sur des chiffres réels. Il apparaît clairement qu’au moins les 2 premiers points sont significativement séparés de la ligne de points aléatoires. Dans l’autre cas, il y a 5 (peut-être 6) croix rouges qui apparaissent discernables de la ligne rouge des points aléatoires. Notez aussi que la premiere (‘la plus importante’) CP n’explique pas toujours la même quantité de chiffres originaux.

4) Que représentent les différentes conventions pour l’analyse des CP ?

Il existe quelques différentes conventions concernant la façon dont les données originelles doivent être normalisées. Par exemple, les chiffres peuvent être normalisés pour que leur moyenne soit de zéro sur l’ensemble de la série, ou alors sur un sous-intervalle choisi. La variance est associée aux écarts par rapport à la moyenne quelle que soit la façon dont celle-ci a été choisie.

Ainsi, le modèle structural des données qui montre les plus grands écarts par rapport à la moyenne dominera dans le calcul des CP. S’il y a une raison a priori de s’intéresser aux écarts par rapport à une certaine moyenne, ceci est un moyen de s’assurer que les modèles structuraux résultants seront placés en tête dans l’ordre des CP. Changer les conventions signifie que la quantité de variance expliquée peut être différente pour chacun des CP, ainsi que leur ordre d’importance et le nombre des CP significatives.

5) Comment pouvez-vous dire que vous avez pris en compte assez de CP ?

C’est assez facile à dire. Si votre réponse dépend du nombre de CP introduites, cela signifie qu’il n’y en a pas assez. Dit d’une autre façon, si la réponse que vous obtenez est la même que si vous aviez utilisé toutes les données sans faire aucune analyse de CP, alors vous êtes probablement au bon nombre. Néanmoins, la raison pour laquelle les condensations de données par CP sont utilisées en premier lieu dans les paléo reconstitutions est que l’utilisation de la totalité des indicateurs introduit le danger de trop bien coller aux chiffres de la période de calibrage (la période durant laquelle les indicateurs sont soumis à correspondre aux mesures instrumentales). Cela peut conduire à une déficience dans les capacités prédictives en dehors de cette fenêtre, alors que c’est précisément l’objectif de la reconstitution. Pour résumer, la sélection des CP est un compromis : d’un coté, l’objectif est de capturer autant de variabilité des données que possible représentée par les différents CP. De l’autre, il ne faut pas introduire de CP qui n’apporte pas réellement d’information significative supplémentaire.

Partie II : Application à l’équipe de hockey (MBH98)

1) Où donc est utilisée l’Analyse des Composantes principales (ACP) dans la méthodologie MBH ?

Page 2 of 5 | Previous page | Next page