Galerie de cartes mentales CTT, fiabilité
La théorie classique des tests (CTT) et la fiabilité des mesures en psychométrie sont deux concepts fondamentaux qui forment ensemble le cadre de base de la psychométrie. Vous trouverez ci-dessous une explication détaillée de ces deux concepts.
Modifié à 2024-11-13 11:42:33In order to help everyone use DeepSeek more efficiently, a collection of DeepSeek guide mind map was specially compiled! This mind map summarizes the main contents: Yitu related links, DS profile analysis, comparison of DeepSeek and ChatGPT technology routes, DeepSeek and Qwen model deployment guide, how to make more money with DeepSeek, how to play DeepSeek, DeepSeek scientific research Application, how to import text from DeepSeek into MindMaster, the official recommendation of DeepSeek Wait, allowing you to quickly grasp the essence of AI interaction. Whether it is content creation, plan planning, code generation, or learning improvement, DeepSeek can help you achieve twice the result with half the effort!
This is a mind map about DeepSeek's 30 feeding-level instructions. The main contents include: professional field enhancement instructions, interaction enhancement instructions, content production instructions, decision support instructions, information processing instructions, and basic instructions.
This is a mind map about a commercial solution for task speech recognition. The main content includes: text file content format:, providing text files according to the same file name as the voice file.
In order to help everyone use DeepSeek more efficiently, a collection of DeepSeek guide mind map was specially compiled! This mind map summarizes the main contents: Yitu related links, DS profile analysis, comparison of DeepSeek and ChatGPT technology routes, DeepSeek and Qwen model deployment guide, how to make more money with DeepSeek, how to play DeepSeek, DeepSeek scientific research Application, how to import text from DeepSeek into MindMaster, the official recommendation of DeepSeek Wait, allowing you to quickly grasp the essence of AI interaction. Whether it is content creation, plan planning, code generation, or learning improvement, DeepSeek can help you achieve twice the result with half the effort!
This is a mind map about DeepSeek's 30 feeding-level instructions. The main contents include: professional field enhancement instructions, interaction enhancement instructions, content production instructions, decision support instructions, information processing instructions, and basic instructions.
This is a mind map about a commercial solution for task speech recognition. The main content includes: text file content format:, providing text files according to the same file name as the voice file.
Théorie classique des tests (CTT), fiabilité des mesures
Théorie classique des tests (CTT)
Traits psychologiques et leur hypothèse de mesurabilité
traits psychologiques
Signification : fait référence au comportement unique et relativement stable manifesté chez une personne, tel que l'intelligence, les intérêts, l'attitude, la personnalité, etc.
Propriétés : stabilité relative, abstraction, implicitement, prévisibilité
Mesurabilité des traits psychologiques :
Les traits psychologiques sont une existence objective
Thorndike : Tout ce qui existe objectivement a sa quantité
McColl : Tout ce qui a de la quantité peut être mesuré
Erreurs de mesure et leurs sources
La signification de l'erreur psychométrique
Fait référence à un effet de mesure inexact ou incohérent causé par des facteurs changeants qui n'ont rien à voir avec l'objectif de la mesure au cours du processus de mesure.
Types d'erreurs de mesure
Erreur aléatoire : une erreur causée par des facteurs accidentels qui n'ont rien à voir avec le but de la mesure et qui n'est pas facile à contrôler. Ses changements de direction et de taille sont complètement aléatoires.
Erreur systématique : effet constant et régulier provoqué par des facteurs changeants qui n'ont rien à voir avec le but de la mesure, et dont l'ampleur et la direction restent inchangées.
Sources d'erreur psychométrique
1. Outils de mesure
Les échelles psychométriques sont instables (faible fiabilité)
Ne pas vraiment mesurer ce que nous voulons mesurer (faible validité)
2.Objet de mesure
Le véritable niveau du sujet de test n’a pas été correctement démontré
3. Processus de test
Environnement physique : température, lumière, son, etc. sur le site de mesure
Temps de test
interférence inattendue
Principaux facteurs de test
4. Évaluateur
Effet sujet, effet sujet
Effet expérimentateur : également connu sous le nom d'effet expérimentateur, cela signifie que l'expérimentateur peut, intentionnellement ou non, influencer les sujets d'une manière ou d'une autre (comme les expressions, les gestes, le ton, etc.) au cours de l'expérience, afin que leurs réponses répondent aux attentes du expérimentateur. Par conséquent, cet effet est souvent appelé effet Rosenthal ou effet d’attente.
Effet sujet : également connu sous le nom d'effet Hawthorne, il fait référence au biais expérimental provoqué par la perception et l'attitude du sujet à l'égard de son identité. En termes simples, le sujet change de comportement parce qu'il reçoit une attention supplémentaire, ce qui entraîne une situation dans laquelle la performance ou. l'effort augmente
Méthodes pour réduire les erreurs de mesure
Outils de mesure : améliorer la fiabilité et la validité des outils de mesure
Objet de mesure : assurer les performances normales de l'objet de mesure
Processus de test : standardisation
Évaluateurs : normes de notation unifiées
Fractions vraies et hypothèses associées
La signification de la vraie fraction
La valeur qui reflète le niveau réel du trait psychologique d'un sujet est appelée le score réel du trait ; le score réellement mesuré est appelé le score observé du trait.
Modèle mathématique de la théorie classique des tests et ses hypothèses
X=T E (score observé = score vrai score d'erreur aléatoire)
①ε(X)=T ou ε(E)=0 La valeur attendue du score observé est le score réel et la valeur attendue du score d'erreur aléatoire est 0. Définition opérationnelle d'une fraction vraie : la moyenne des résultats obtenus à partir de nombreuses mesures.
②ρ(T,E)=0 Les fractions vraies et les erreurs aléatoires sont indépendantes les unes des autres
③ρ(E1,E2)=0 Les erreurs aléatoires sur chaque test parallèle sont indépendantes les unes des autres
test parallèle
Si deux tests avec des questions différentes mesurent le même trait et que le format des questions, le nombre, la difficulté, la discrimination et la distribution des résultats du test sont cohérents, les deux tests sont dits parallèles l'un à l'autre. Test parallèle : deux tests qui utilisent des questions différentes pour mesurer le même contenu, et la moyenne et l'écart type des résultats du test sont les mêmes. Des tests parallèles rigoureux sont difficiles à construire.
fiabilité des mesures
Aperçu de la fiabilité
Définition de la fiabilité : La fiabilité est le degré de stabilité/fiabilité/cohérence des résultats de mesure. Le degré de cohérence des résultats obtenus en répétant les mesures sur les mêmes sujets à des moments différents en utilisant le même test (ou en utilisant un autre ensemble de tests équivalents).
Le rôle de la fiabilité
L'un des indicateurs importants pour évaluer la qualité des tests
Reflet de la taille des erreurs aléatoires existant dans le processus de mesure
Interprétation de la signification des résultats des tests individuels : erreur standard de mesure
Comparez les différences de scores à différents tests
Comment estimer la fiabilité
fiabilité test-retest
signification
La fiabilité test-retest, également appelée fiabilité test-retest, fait référence à la cohérence des résultats obtenus en utilisant le même outil de mesure pour tester deux fois le même groupe de sujets dans les mêmes conditions, et reflète les résultats de l'outil de mesure affecté par. facteurs d’intervalle de temps. L'intervalle de temps le plus approprié varie en fonction de l'objectif et de la nature du test et des caractéristiques des sujets. Généralement, deux à quatre semaines sont appropriées, et de préférence pas plus de six mois.
Méthode d'évaluation
La taille de la fiabilité test-retest peut être marquée en calculant le coefficient test-retest ou le coefficient de stabilité de l'outil de mesure. Plus précisément, il s'agit d'obtenir le coefficient de corrélation de différence de produit de Pearson entre les scores du même groupe de sujets aux deux tests.
Conditions de candidature
Les traits psychologiques individuels mesurés par l’outil de mesure doivent être relativement stables dans le temps. Tel que : test de personnalité Il ne devrait y avoir aucun effet évident de la pratique et de l'oubli sur les traits psychologiques individuels mesurés par l'outil de mesure, et les effets de la pratique et de l'oubli s'annulent fondamentalement. Tels que : test d'intelligence (6 mois) Aucune formation ou formation particulière ne doit être dispensée entre les deux administrations pour garantir que la fiabilité test-retest reflète l'influence de facteurs aléatoires.
Fiabilité de réplication
signification
La fiabilité en double fait référence au degré de cohérence des résultats obtenus par deux tests en double (tests parallèles) mesurant le même groupe de sujets. Le degré de fiabilité de la réplique est calculé en calculant le coefficient de corrélation de différence de produit de Pearson des scores obtenus par le même groupe de sujets sur les deux tests de réplique. La fiabilité de la réplication reflète les erreurs de mesure causées par les différences dans les questions et les intervalles de temps.
Méthode d'évaluation
Coefficient d'équivalence : les deux tests en double sont administrés simultanément et en continu ;
Coefficient de stabilité et d'équivalence/fiabilité test-retest : les deux tests répétés sont administrés deux fois, séparés par une période de temps.
effet de commande
L'effet de l'ordre de présentation des variables indépendantes sur la variable dépendante. C'est-à-dire, lorsque les mêmes sujets reçoivent des traitements expérimentaux différents, l'impact possible du premier traitement expérimental sur le deuxième traitement expérimental. L’impact peut être énorme ou léger, de courte durée ou durable.
Conception équilibrée
Technique de conception expérimentale qui contrôle l'ordre des traitements expérimentaux pour compenser les erreurs de séquence provoquées par l'ordre des traitements expérimentaux.
Conditions de candidature
1) Construire deux ou plusieurs tests véritablement parallèles (c'est-à-dire les épreuves A et B) ; Tests en double ou parallèles : deux tests qui utilisent des éléments différents pour mesurer le même contenu et dont les résultats de test ont la même moyenne et le même écart type. 2) Les sujets doivent être qualifiés pour accepter deux tests. (temps, argent, etc.) 3) Vous devez faire de votre mieux pour expliquer en détail l'intervalle de temps entre les deux tests, la séquence de test, l'expérience des sujets pendant le test, etc. dans le rapport des résultats du test.
fiabilité de la cohérence interne
signification
La fiabilité de la cohérence interne, également appelée fiabilité de l'homogénéité, évalue principalement si les mêmes traits psychologiques sont mesurés parmi les composants aléatoires du test et reflète le degré de cohérence d'échantillonnage du contenu de la question.
Méthode d'estimation
fiabilité divisée en deux
signification
La fiabilité divisée en deux fait référence à la cohérence des scores obtenus par tous les sujets sur les deux moitiés après avoir divisé un test en deux moitiés égales. La fiabilité divisée par deux indique si les éléments des deux composantes aléatoires du test mesurent le même trait psychologique.
méthode divisée en deux
Méthode impaire et même demi
Méthode d'évaluation
Formule de Spearman-Brown Formule Flanagan Formule Lu Lun
Fiabilité théorique des bibliothèques
coefficient de Cronbach
Fiabilité Hoyt
fiabilité inter-évaluateurs
signification
La fiabilité inter-évaluateurs fait référence au degré de cohérence avec lequel plusieurs évaluateurs évaluent les réponses du même groupe de personnes. Généralement, la cohérence moyenne entre les paires d'évaluateurs formés doit être supérieure à 0,90 avant que la note ne soit considérée comme objective.
Méthode d'évaluation
Deux évaluateurs : calculez le coefficient de corrélation (corrélation de différence de produit de Pearson ou corrélation de rang de Spearman) entre les scores attribués par les deux évaluateurs au même lot de feuilles de réponses des sujets.
Plus de deux évaluateurs : estimé à l'aide du coefficient de concorde de Kendall.
Moyens d'améliorer la fiabilité
Facteurs affectant la fiabilité des mesures
Caractéristiques du sujet
sujet unique
Motivation à l'examen
tester l'anxiété
Expérience de quiz
effet de pratique
tendance à la réponse
Variables physiologiques
Hétérogénéité du groupe de matières, niveau de capacité moyen du groupe de matières
Principales caractéristiques des tests
testeur
niveleuse
Situation de test
outils de mesure
Durée de l'essai
Difficulté du test
intervalle de temps
Moyens d'améliorer la fiabilité
Augmenter la durée du test de manière appropriée
Contrôler la répartition de la difficulté des questions de test
Essayez d'améliorer la discrimination de chaque question
Sélectionnez le groupe de sujets approprié
Standardisez le processus de test et unifiez l’environnement de test
Assurer suffisamment de temps aux sujets pour répondre aux questions
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant
thème flottant