Consultation gratuite
Invisalign
Analyse statistique-les données

Analyse statistique-les données

Généralités.

Le seuil de signification (probabilité) dans ce travail était de 0,05.

Les données ont été analysées statistiquement avec le logiciel SPSS. (Statistical Package for the Social Sciences, version 15).

Les différents calculs utilisés étaient : statistiques descriptives de chaque variable ainsi que des distributions de fréquences.

Les tests khi-carré, corrélation de Pearson, test alpha de Kronchback, et une analyse des variances one-way Anova, des analyses de régression, furent utilisés.

Le coefficient de corrélation de Pearson indique 2 choses :

A)= la force du lien (1= parfait, 0= nul)

Pour avoir un 1, tous les points seraient sur une ligne.

Pour avoir un zéro, tous les points seraient dispersés partout.

  1. B) Il devient négatif, si la ligne est descendante.

Il devient positif si la ligne est ascendante.

Après avoir regardé la probabilité (p = 0,05) pour cette recherche, on regarde le coefficient de corrélation de Pearson qui indique la force de cette probabilité.

Les différentes mesures utilisées dans cette étude

Le choix d’une mesure ou d’un coefficient dépend pour une bonne part de l’échelle de mesure utilisée lors de la collecte ou de la saisie des données. Nous distinguerons d’abord quatre échelles de mesure.

Dans le cas des statistiques descriptives (univariées)

L’échelle nominale : comme son nom l’évoque nomme la réalité étudiée. Les modalités de cette échelle n’entretiennent entre elles aucune relation de grandeur; par exemple « homme » « femme » pour désigner le genre. Si un code numérique est utilisé, ce dernier sera arbitraire. Les mesures permises sont les fréquences et le mode.

L’échelle ordinale : comme on le devine cette échelle fait intervenir l’idée d’ordre ou de rang et peut être accompagnée de codes numériques qui représentent un classement mais pour lesquels les seules mesures permises sont les fréquences, le mode et la médiane.

L’échelle d’intervalle : c’est une échelle qui fait intervenir des nombres (quantitative) et qui permet certains calculs mathématiques mais qui ne se prête pas à la division. La température exprimée en degré Celcius est une variable pour laquelle la moyenne est permise mais pas le ratio : 10 degrés la nuit et 20 le jour représente une différence de dix degrés pour une moyenne de 15 degrés; mais 20 degrés ne représente pas deux fois plus de chaleur que 10 degrés. L’année de naissance en est un autre exemple, mais cette fois-ci, ni la moyenne ni le ratio ne peuvent être calculés : l’individu né en 2014 a 100 ans de moins que celui né en 1914 mais 2014 divisé par 1914 n’a aucun sens.

L’échelle de rapport ou ratio : cette échelle permet un très grand nombre de calculs dont la moyenne et l’écart type, du fait qu’on peut se référer à un zéro absolu. L’âge d’une personne en est un bon exemple.

Dans cette étude, les échelles nominales (ex : sexe, présence ou absence de maux de cou) et les échelles de rapport (ex : sévérité d’un déplacement méniscal) seront utilisées.

Dans le cas des croisements de 2 variables (bivariées).

Encore une fois, les échelles de mesure déterminent le choix des calculs à effectuer. Plusieurs scénarios sont possibles :

Deux échelles nominales : par exemple, sexe (M/F) et maux de cou (oui/non). Pour présenter les résultats, nous utiliserons les tableaux croisés et pour établir l’existence possible d’un lien nous calculerons le Khi carré (ou la correction de continuité ou le test Exact de Fisher).

Exemple pour la compréhension des tableaux :

(0%) implique que nous ne pouvons utiliser le test de Fisher, oui si ≥ 20

Si l’effectif théorique est ≥ 10, on peut utiliser le khi-deux de Pearson

Si l’effectif théorique est ≤ 10, on doit prendre la correction de continuité qui doit aussi être <0,05)

Le but étant de rejeter ou d’infirmer l’hypothèse nulle et de comprendre le lien significatif ou non présent.

Le test choisi n’est pas plus fort, il est juste le plus approprié.

Une échelle nominale et une échelle de rapport : par exemple le sexe et le déplacement méniscal en heures. Les résultats pourront être présentés dans un diagramme à deux bandes, chaque bande représentant la moyenne des déplacements pour chacun de deux sexes. Le test utilisé sera l’analyse de variance simple dans le cas de la comparaison entre deux groupes ou le test T dans le cas de deux échantillons appariés.

Deux échelles de rapport : par exemple l’âge et le déplacement méniscal. Les résultats seront présentés sur un plan cartésien sous forme de nuage de points accompagné d’une droite de régression. Le coefficient utilisé sera le coefficient de corrélation de Pearson.

Dans le cas des analyses multivariées

Lorsqu’on croit qu’il existe des interrelations entre plusieurs variables on pourra faire appel à des modèles multivariés (i.e. impliquant plus de 2 variables).

Dans cette étude nous utiliserons l’analyse en composantes principales afin de réduire plusieurs variables originales à quelques composantes (facteurs)

Nous utiliserons aussi la régression multiple quand les variables indépendantes et dépendantes sont mesurées sur des échelles de rapport.

Quand la variable dépendante est une échelle de rapport et que plusieurs variables indépendantes sont catégorielles, nous utiliserons l’analyse de variance à plusieurs facteurs (modèle linéaire général).

On peut aussi utiliser une analyse discriminante, i.e., avec une entrée des variables étapes par étapes.

 

Termes correspondant en Anglais :

Français Anglais

Échelle de mesure Measurement scale ou level of measurement

Nominale Nominal

Ordinale Ordinal

Intervalle Interval

Rapport Ratio

Statistiques descriptives Descriptives

Moyenne Mean

Mode Mode

Médiane Median

Écart type Standard Deviation

Khi carré Chi Square

Correction de continuité Continuity Correction

Test exact de Ficher Fisher Exact Test

Analyse de variance (test F) One Way Analysis of Variance (F Test)

Diagramme à bandes Bar Chart

Coefficient de corrélation Correlation Coefficient (ex. Pearson : plus il se rapproche de 1, plus la corrélation est parfaite, à 0, elle est nulle.

Nuage de points Scatergram

Multivarié Multivariate

Composantes principales Principals components

Régression Regression

 

Lire la suite

Retour à la table des matières