Connexion
Connexion

Galerie de cartes mentales CTT, fiabilité

CTT, fiabilité

La théorie classique des tests (CTT) et la fiabilité des mesures en psychométrie sont deux concepts fondamentaux qui forment ensemble le cadre de base de la psychométrie. Vous trouverez ci-dessous une explication détaillée de ces deux concepts.

Modifié à 2024-11-13 11:42:33

Gavinnblake

Œuvres récentes Afficher plus d'œuvres>>

DeepSeek User Guide Collection
In order to help everyone use DeepSeek more efficiently, a collection of DeepSeek guide mind map was specially compiled! This mind map summarizes the main contents: Yitu related links, DS profile analysis, comparison of DeepSeek and ChatGPT technology routes, DeepSeek and Qwen model deployment guide, how to make more money with DeepSeek, how to play DeepSeek, DeepSeek scientific research Application, how to import text from DeepSeek into MindMaster, the official recommendation of DeepSeek Wait, allowing you to quickly grasp the essence of AI interaction. Whether it is content creation, plan planning, code generation, or learning improvement, DeepSeek can help you achieve twice the result with half the effort!
DeepSeek 30 feeding level instructions
This is a mind map about DeepSeek's 30 feeding-level instructions. The main contents include: professional field enhancement instructions, interaction enhancement instructions, content production instructions, decision support instructions, information processing instructions, and basic instructions.
Voice recognition commercial solution
This is a mind map about a commercial solution for task speech recognition. The main content includes: text file content format:, providing text files according to the same file name as the voice file.

CTT, fiabilité

Gavinnblake

Œuvres récentes Afficher plus d'œuvres>>

Recommandé pour vous
Contour

Classement de la mémoire
- 9
Gavinnblake
Développement et perspectives de l'industrie lourde
- 11
Gavinnblake
concert d'hiver
- 10
Gavinnblake
revêtement en poudre
- 12
Gavinnblake
Les dix principaux domaines de connaissances en gestion de projet
- 26
Gavinnblake
comptabilité analytique
- 44
Gavinnblake
Un bref contexte historique des 3000 ans de l'Empire britannique
- 13
Gavinnblake
Structure d'exploitation des mines de charbon
- 9
Brooooke_00
Géologie et reliefs
- 10
Brooooke_00
Carte mentale de l'histoire du développement de la musique électronique
- 11
Brooooke_00

Théorie classique des tests (CTT), fiabilité des mesures

Théorie classique des tests (CTT)

Traits psychologiques et leur hypothèse de mesurabilité

traits psychologiques

Signification : fait référence au comportement unique et relativement stable manifesté chez une personne, tel que l'intelligence, les intérêts, l'attitude, la personnalité, etc.

Propriétés : stabilité relative, abstraction, implicitement, prévisibilité

Mesurabilité des traits psychologiques :

Les traits psychologiques sont une existence objective

Thorndike : Tout ce qui existe objectivement a sa quantité

McColl : Tout ce qui a de la quantité peut être mesuré

Erreurs de mesure et leurs sources

La signification de l'erreur psychométrique

Fait référence à un effet de mesure inexact ou incohérent causé par des facteurs changeants qui n'ont rien à voir avec l'objectif de la mesure au cours du processus de mesure.

Types d'erreurs de mesure

Erreur aléatoire : une erreur causée par des facteurs accidentels qui n'ont rien à voir avec le but de la mesure et qui n'est pas facile à contrôler. Ses changements de direction et de taille sont complètement aléatoires.

Erreur systématique : effet constant et régulier provoqué par des facteurs changeants qui n'ont rien à voir avec le but de la mesure, et dont l'ampleur et la direction restent inchangées.

Sources d'erreur psychométrique

1. Outils de mesure

Les échelles psychométriques sont instables (faible fiabilité)

Ne pas vraiment mesurer ce que nous voulons mesurer (faible validité)

2.Objet de mesure

Le véritable niveau du sujet de test n’a pas été correctement démontré

3. Processus de test

Environnement physique : température, lumière, son, etc. sur le site de mesure

Temps de test

interférence inattendue

Principaux facteurs de test

4. Évaluateur

Effet sujet, effet sujet

Effet expérimentateur : également connu sous le nom d'effet expérimentateur, cela signifie que l'expérimentateur peut, intentionnellement ou non, influencer les sujets d'une manière ou d'une autre (comme les expressions, les gestes, le ton, etc.) au cours de l'expérience, afin que leurs réponses répondent aux attentes du expérimentateur. Par conséquent, cet effet est souvent appelé effet Rosenthal ou effet d’attente.

Effet sujet : également connu sous le nom d'effet Hawthorne, il fait référence au biais expérimental provoqué par la perception et l'attitude du sujet à l'égard de son identité. En termes simples, le sujet change de comportement parce qu'il reçoit une attention supplémentaire, ce qui entraîne une situation dans laquelle la performance ou. l'effort augmente

Méthodes pour réduire les erreurs de mesure

Outils de mesure : améliorer la fiabilité et la validité des outils de mesure

Objet de mesure : assurer les performances normales de l'objet de mesure

Processus de test : standardisation

Évaluateurs : normes de notation unifiées

Fractions vraies et hypothèses associées

La signification de la vraie fraction

La valeur qui reflète le niveau réel du trait psychologique d'un sujet est appelée le score réel du trait ; le score réellement mesuré est appelé le score observé du trait.

Modèle mathématique de la théorie classique des tests et ses hypothèses

X=T E (score observé = score vrai score d'erreur aléatoire)

①ε(X)=T ou ε(E)=0 La valeur attendue du score observé est le score réel et la valeur attendue du score d'erreur aléatoire est 0. Définition opérationnelle d'une fraction vraie : la moyenne des résultats obtenus à partir de nombreuses mesures.

②ρ(T,E)=0 Les fractions vraies et les erreurs aléatoires sont indépendantes les unes des autres

③ρ(E1,E2)=0 Les erreurs aléatoires sur chaque test parallèle sont indépendantes les unes des autres

test parallèle

Si deux tests avec des questions différentes mesurent le même trait et que le format des questions, le nombre, la difficulté, la discrimination et la distribution des résultats du test sont cohérents, les deux tests sont dits parallèles l'un à l'autre. Test parallèle : deux tests qui utilisent des questions différentes pour mesurer le même contenu, et la moyenne et l'écart type des résultats du test sont les mêmes. Des tests parallèles rigoureux sont difficiles à construire.

fiabilité des mesures

Aperçu de la fiabilité

Définition de la fiabilité : La fiabilité est le degré de stabilité/fiabilité/cohérence des résultats de mesure. Le degré de cohérence des résultats obtenus en répétant les mesures sur les mêmes sujets à des moments différents en utilisant le même test (ou en utilisant un autre ensemble de tests équivalents).

Le rôle de la fiabilité

L'un des indicateurs importants pour évaluer la qualité des tests

Reflet de la taille des erreurs aléatoires existant dans le processus de mesure

Interprétation de la signification des résultats des tests individuels : erreur standard de mesure

Comparez les différences de scores à différents tests

Comment estimer la fiabilité

fiabilité test-retest

signification

La fiabilité test-retest, également appelée fiabilité test-retest, fait référence à la cohérence des résultats obtenus en utilisant le même outil de mesure pour tester deux fois le même groupe de sujets dans les mêmes conditions, et reflète les résultats de l'outil de mesure affecté par. facteurs d’intervalle de temps. L'intervalle de temps le plus approprié varie en fonction de l'objectif et de la nature du test et des caractéristiques des sujets. Généralement, deux à quatre semaines sont appropriées, et de préférence pas plus de six mois.

Méthode d'évaluation

La taille de la fiabilité test-retest peut être marquée en calculant le coefficient test-retest ou le coefficient de stabilité de l'outil de mesure. Plus précisément, il s'agit d'obtenir le coefficient de corrélation de différence de produit de Pearson entre les scores du même groupe de sujets aux deux tests.

Conditions de candidature

Les traits psychologiques individuels mesurés par l’outil de mesure doivent être relativement stables dans le temps. Tel que : test de personnalité Il ne devrait y avoir aucun effet évident de la pratique et de l'oubli sur les traits psychologiques individuels mesurés par l'outil de mesure, et les effets de la pratique et de l'oubli s'annulent fondamentalement. Tels que : test d'intelligence (6 mois) Aucune formation ou formation particulière ne doit être dispensée entre les deux administrations pour garantir que la fiabilité test-retest reflète l'influence de facteurs aléatoires.

Fiabilité de réplication

signification

La fiabilité en double fait référence au degré de cohérence des résultats obtenus par deux tests en double (tests parallèles) mesurant le même groupe de sujets. Le degré de fiabilité de la réplique est calculé en calculant le coefficient de corrélation de différence de produit de Pearson des scores obtenus par le même groupe de sujets sur les deux tests de réplique. La fiabilité de la réplication reflète les erreurs de mesure causées par les différences dans les questions et les intervalles de temps.

Méthode d'évaluation

Coefficient d'équivalence : les deux tests en double sont administrés simultanément et en continu ;

Coefficient de stabilité et d'équivalence/fiabilité test-retest : les deux tests répétés sont administrés deux fois, séparés par une période de temps.

effet de commande

L'effet de l'ordre de présentation des variables indépendantes sur la variable dépendante. C'est-à-dire, lorsque les mêmes sujets reçoivent des traitements expérimentaux différents, l'impact possible du premier traitement expérimental sur le deuxième traitement expérimental. L’impact peut être énorme ou léger, de courte durée ou durable.

Conception équilibrée

Technique de conception expérimentale qui contrôle l'ordre des traitements expérimentaux pour compenser les erreurs de séquence provoquées par l'ordre des traitements expérimentaux.

Conditions de candidature

1) Construire deux ou plusieurs tests véritablement parallèles (c'est-à-dire les épreuves A et B) ; Tests en double ou parallèles : deux tests qui utilisent des éléments différents pour mesurer le même contenu et dont les résultats de test ont la même moyenne et le même écart type. 2) Les sujets doivent être qualifiés pour accepter deux tests. (temps, argent, etc.) 3) Vous devez faire de votre mieux pour expliquer en détail l'intervalle de temps entre les deux tests, la séquence de test, l'expérience des sujets pendant le test, etc. dans le rapport des résultats du test.

fiabilité de la cohérence interne

signification

La fiabilité de la cohérence interne, également appelée fiabilité de l'homogénéité, évalue principalement si les mêmes traits psychologiques sont mesurés parmi les composants aléatoires du test et reflète le degré de cohérence d'échantillonnage du contenu de la question.

Méthode d'estimation

fiabilité divisée en deux

signification

La fiabilité divisée en deux fait référence à la cohérence des scores obtenus par tous les sujets sur les deux moitiés après avoir divisé un test en deux moitiés égales. La fiabilité divisée par deux indique si les éléments des deux composantes aléatoires du test mesurent le même trait psychologique.

méthode divisée en deux

Méthode impaire et même demi

Méthode d'évaluation

Formule de Spearman-Brown Formule Flanagan Formule Lu Lun

Fiabilité théorique des bibliothèques

coefficient de Cronbach

Fiabilité Hoyt

fiabilité inter-évaluateurs

signification

La fiabilité inter-évaluateurs fait référence au degré de cohérence avec lequel plusieurs évaluateurs évaluent les réponses du même groupe de personnes. Généralement, la cohérence moyenne entre les paires d'évaluateurs formés doit être supérieure à 0,90 avant que la note ne soit considérée comme objective.

Méthode d'évaluation

Deux évaluateurs : calculez le coefficient de corrélation (corrélation de différence de produit de Pearson ou corrélation de rang de Spearman) entre les scores attribués par les deux évaluateurs au même lot de feuilles de réponses des sujets.

Plus de deux évaluateurs : estimé à l'aide du coefficient de concorde de Kendall.

Moyens d'améliorer la fiabilité

Facteurs affectant la fiabilité des mesures

Caractéristiques du sujet

sujet unique

Motivation à l'examen

tester l'anxiété

Expérience de quiz

effet de pratique

tendance à la réponse

Variables physiologiques

Hétérogénéité du groupe de matières, niveau de capacité moyen du groupe de matières

Principales caractéristiques des tests

testeur

niveleuse

Situation de test

outils de mesure

Durée de l'essai

Difficulté du test

intervalle de temps

Moyens d'améliorer la fiabilité

Augmenter la durée du test de manière appropriée

Contrôler la répartition de la difficulté des questions de test

Essayez d'améliorer la discrimination de chaque question

Sélectionnez le groupe de sujets approprié

Standardisez le processus de test et unifiez l’environnement de test

Assurer suffisamment de temps aux sujets pour répondre aux questions

thème flottant