로그인
로그인

마인드 맵 갤러리 심리측정학

심리측정학

중국과학원: 심리 상담사 - 기본 개념, 고전적인 테스트 이론, 심리 테스트 품질 지표 등을 포함한 심리 측정학

2024-01-31 16:23:53에 편집됨

슈퍼직장인

최근 작업 더 많은 작업 보기>>

(III) 저산소 유도 인자 프롤릴 하이드 록 실라 제 억제제
이것은 (III) 저산소증-유도 인자 프롤릴 하이드 록 실라 제 억제제에 대한 마인드 맵이며, 주요 함량은 다음을 포함한다 : 저산소증-유도 인자 프롤릴 하이드 록 실라 제 억제제 (HIF-PHI)는 신장 빈혈의 치료를위한 새로운 소형 분자 경구 약물이다. 1. HIF-PHI 복용량 선택 및 조정. Rosalasstat의 초기 용량, 2. HIF-PHI 사용 중 모니터링, 3. 부작용 및 예방 조치.
Kuka 산업용 로봇의 개발 및 Kuka 산업 로봇의 모션 제어 명령
이것은 Kuka Industrial Robots의 개발 및 Kuka Industrial Robot의 모션 제어 지침에 대한 마인드 맵입니다. 주요 내용에는 쿠카 산업 로봇의 역사, 쿠카 산업 로봇의 특성, 쿠카 산업 로봇의 응용 분야, 2. 포장 프로세스에서 쿠카 로봇은 빠르고 일관된 포장 작업을 달성하고 포장 효율성을 높이며 인건비를 줄입니다. 2. 인건비 감소 : 자동화는 운영자에 대한 의존성을 줄입니다. 3. 조립 품질 향상 : 정확한 제어는 인간 오류를 줄입니다.
1.1 컴퓨터 네트워크 요약
408 컴퓨터 네트워크가 너무 어렵습니까? 두려워하지 마세요! 나는 피를 구토하고 지식 맥락을 명확히하는 데 도움이되는 매우 실용적인 마인드 맵을 분류했습니다. 컨텐츠는 매우 완전합니다. 네트워크 아키텍처에서 응용 프로그램 계층, TCP/IP 프로토콜, 서브넷 디비전 및 기타 핵심 포인트에 이르기까지 원칙을 철저히 이해하는 데 도움이 될 수 있습니다. 📈 명확한 논리 : Mindmas 보물, 당신은 드문 기회가 있습니다. 서둘러! 이 마인드 맵을 사용하여 408 컴퓨터 네트워크의 학습 경로에서 바람과 파도를 타고 성공적으로 해변을 얻으십시오! 도움이 필요한 친구들과 공유해야합니다!

심리측정학

슈퍼직장인

최근 작업 더 많은 작업 보기>>

추천 사항
개요

우울증 자가 평가 질문
- 12
섹시한 바퀴벌레

심리측정학

기본 사상

심리 측정 및 기본 속성

정의: 특정 심리학 이론을 기반으로 사람들의 심리적 특성을 정량적으로 설명하기 위해 테스트를 사용하는 프로세스입니다.

심리 테스트(도구)는 본질적으로 행동 샘플에 대한 테스트입니다. 4가지 요소를 포함한 객관성과 표준화된 측정

행동 샘플: 행동 영역, 즉 추출 가능한 행동의 모집단

표준화: 시험 내용, 시험 시행 조건(상황별 지침, 기간 등), 채점 규칙, 시험 기준(비교를 위한 기준점 제공)

난이도 또는 응답률

신뢰성(신뢰성, 일관성) 타당성(효과성, 정확성)

몇몇 중요한 사람들

Galton-Quantitative 연구는 개인차 등의 연구를 개척했습니다. 심리검사 첫 번째 사람

Cattell-논문 "심리 테스트 및 측정" 심리검사라는 용어를 최초로 제안

Thorndike - "심리적, 사회적 측정 입문" 테스트 이론에 관한 첫 번째 책

기본 기능

적용의 보편성(가능성: 측정 가능, 측정 가능)

간접성(질문에 대답하는 등의 외부 행동 수행)

심리적 영향 - 객관성(표준화된 질문, 객관적인 결과)

오류는 보편적입니다(모든 측정은 오류를 기반으로 함).

상대성(결과, 위치는 상대적입니다. 예: IQ)

기본 요소

기준점

절대 기준점: 절대 영점, 예: 무게, 키, 반응 시간

상대 기준점: 인위적으로 결정된 영점(예: 고도, 온도)

단위

동등한 가치, 예: 1~2m&2~3m 동등한 가치

등각 투영: 수치 값이 동일하며 실제 의미도 동일합니다.

불평등 간격: 값은 동일하지만 실제 의미는 다릅니다. 예: 강사-부교수-정교수

결정된 의미, 예: 단위 m, kg

척도 유형

사물을 일정한 규칙에 따라 수량화하는 것, 즉 사물의 속성을 일정한 단위와 기준점의 연속체로 표현하는 것을 척도라고 한다.

명명 규모

정의 - 사물의 구성 요소를 나타내기 위해 숫자를 사용하거나 숫자를 분류하는 것

동등한 단위 없음

영점 없음

계산할 수 없습니다

예: 성별 구분, 학번 지정

통계 방법: 빈도, 모드, 백분율, X2 테스트

순서 척도(평가 척도)

정의 - 숫자는 범주를 나타낼 뿐만 아니라 다양한 카테고리 크기 및 수준, 정렬 및 정렬

동등한 단위 없음

영점 없음

계산할 수 없습니다

예: 등급 분류 및 분류, 직위 평가

통계 방법: 중앙값, 백분위수, 순위 상관관계, Kendall 하모니 계수

아이소메트릭 스케일

정의 - 사물의 범주와 등급뿐만 아니라 동일한 거리와 측정 단위, 분류, 순서를 나타낼 수 있습니다.

단위가 동일하다

상대 영점

수 - 산술

예: 온도계, 고도 측정, 분수 측정

통계적 방법: 평균, 표준편차, 제품차이 상관계수, 순위 상관관계, t 테스트, f 테스트

비율 척도(동일 비율 척도)

정의 - 명명된 수준 등을 제외하고 가장 완전한 척도입니다. 거리, 절대 영점 분류, 정렬, - x ¼

단위가 동일하다

절대 영도

캔 - x ¼ 연산

예: 키 측정, 체중계, 부반응 시간

통계적 방법: 등각 기하 평균 변동 계수

퀴즈 유형

측정된 심리적 특성에 따른 분류

적성검사

최고의 행동 테스트

지능 테스트

Binet-Simon, 세계 최초의 지능 척도, 1905년; Dong Zhongshu는 한 손으로 사각형을 그리고 다른 손으로 원을 그립니다(테스트에 주의하세요). 공자: 개별 학생 수의 지능 등급 차이;

적성검사에는 일반능력과 특수능력이 포함됩니다.

일주일을 잡고, 노래하고, 춤추고, SAT, DAT 그리기

성취도 테스트

예: 각종 시험

보충 자료: 창의성 퀴즈

청나라 칠교놀이와 나인링크(중국식 미로)

보충 자료: 교육용 시험

서주(周周)나라의 노예제도-중국학-초기교육시험

한나라-연간 시험 제도-제1회 필기 시험

수(隋) 양제(陽皇)의 과거제도인 양제는 1,300년 이상 지속되었다.

성격 테스트

전형적인 행동 테스트

자기보고 성격 테스트

객관식 문제 - MMPI, 16PF, EPQ, EPPS, YG 인성검사

성격 투사 테스트

로르샤흐 잉크 반점 테스트(최초의 투사 테스트), 주제 통각 테스트(TAT), 하우스 트리맨 테스트, 샌드박스

몇 가지 중요한 수치 및 추가 사항

Kraepelin - 정신질환을 진단하기 위해 자유연상검사를 최초로 사용한 사람 성격 테스트의 선구자

Woodworth - Woodworth 프로필 설문지 최초의 현대 성격 설문지

공자-인격은 3가지로 분류되며, 유소의 성격은 12가지로 분류됩니다. 인성검사에 속합니다.

피험자가 평가 시 사용한 참고기준에 따라 분류

규범 참조 테스트(집단과 비교)

그룹을 기준 배경으로 사용하고 그룹 내 개인의 상대적 위치를 사용하여 개인의 발달 수준을 평가하는 테스트로 지능 테스트와 같이 그룹 내 능력이나 지식의 연속체에 대한 개인의 상대적 위치를 나타냅니다. 능력 시험 및 대학원 입학 시험 재시험;

기준 참조 테스트(표준과 비교)

시험 내용이나 특정 행동 표준 수준을 기준으로 개인을 평가하는 시험으로, 개인의 수준이 현장에서 일정한 기준에 도달했는지 여부만을 기준으로 개인의 발달 수준을 평가하는 시험입니다. 대학원 입시 예비시험, 운전면허 시험, 심리상담 시험 등은 특정 기준에 따라 이루어지며 타인의 점수와는 아무런 관련이 없습니다.

표준화 정도에 따라 분류

표준화된 시험 - 4점 요구사항

시험 준비 과정의 표준화

테스트 구현 표준화

시험 채점 표준화

시험 점수 해석 표준화

비표준화 테스트

실제 측정방법에 따른 분류

컴퓨터 기반 테스트(CBT)

컴퓨터 적응 테스트(CAT)

인터넷 기반 테스트(IBI)

기타 카테고리

측정 방법에 따라

개별 테스트, 예: Stanford-Binet 척도, Wechsler 지능 척도 및 기타 지능 척도, Rorschach 잉크반점, 주제별 통각 테스트, 특수 그룹에 대한 개별 테스트 선택

그룹 테스트, 예: 레이븐의 추론 테스트, 육군 A 및 B 테스트, 높은 효율성과 경제성을 추구하는 선택적 그룹 테스트;

발현 내용과 반응 형태에 따라

언어(종이 및 연필) 테스트-Stanford-Binet Scale/16PF

비언어적(조작) 테스트 까마귀의 추론 테스트/로르샤흐 잉크 반점 테스트

테스트 기능에 따라

성취도 및 예측 테스트

난이도 및 속도 테스트

난이도 테스트 - 난이도 - 다이빙

속도 테스트 - 높고 안정적인 점수; 문제량이 많음 - 반응속도 테스트/100m 경주

기술 및 진단 테스트

질문 유형에 따라

주관식 시험-단답/에세이/작문

객관식 시험 - 단선택/판단

필요에 따라 점수를 매기세요

최고의 행동 테스트 - 가능한 한 잘 대답하고 정답을 맞추십시오. 능력시험과 같은

일반적인 행동 테스트 - 답변 습관을 기반으로 하며 정답은 없습니다. 성격 테스트와 같은

고전적 테스트 이론

심리 측정 오류

의미

측정 과정에서 측정 목적과 무관한 요인의 변화로 인해 발생하는 부정확하고 일관되지 않은 측정 효과

유형

무작위 오류(Random error) - 측정 목적과 무관한 우발적인 요인으로 인해 제어하기 어려운 오류로, 여러 측정 결과가 일치하지 않고 테스트/병렬 테스트를 반복하면 방향과 변화가 완전히 일치하지 않습니다. 여러 번 측정하면 평균값만 0 정규 분포입니다. 측정 결과가 일관되지 않고 부정확합니다.

체계적 오류(Systematic error) - 측정 목적과 관련이 없는 변수로 인해 발생하는 지속적이고 규칙적인 효과입니다. 각 측정에서 안정적이고 일관되며, 여러 측정 결과가 일관되고 부정확하게 나타납니다.

원천

측정 도구(체계적 오류) - 일련의 테스트(설문지)를 중심으로 한 자극-반응 시스템(종종 척도라고 함)

부적절한 질문 샘플링

질문 형식이 부적절합니다

난이도가 너무 높거나 너무 낮음

지침의 부적절한 표현

측정 대상(랜덤오차-개인차) - 대상자의 실제 수준이 정상적으로 발휘되고 있는지 여부

감정, 동기, 반응 경향 등

테스트 프로세스(통제 및 테스트가 가장 쉬움) - 우발적 요인: 물리적 환경, 시간, 예상치 못한 간섭 등

제어

표준화

측정대상

피험자 측 – 피험자의 신체적, 정신적 상태는 측정 중 안정적이었습니다.

메인 테스트 측면에서 메인 테스터는 시스템의 표준화된 운영에 주목합니다.

측정 도구

시험 준비의 과학적 성격을 향상시킵니다.

수집된 정보의 풍부함과 보편성에 주목하세요.

프로젝트 샘플링의 대표성에 주목

프로젝트 난이도에는 특정 분포 범위가 있습니다.

테스트 용어는 간단하고 명확합니다.

테스트 과정

동일한 테스트 상황

같은 지시

동일한 시험 시간 제한

채점은 객관적이어야 하며 테스트 결과의 해석은 표준화되어야 합니다.

고전적인 테스트 이론 모델

CTT

수학적 모델 X(관측 점수) = T(실제 점수) E(무작위 오류)

가설 추론

개인의 심리적 특성을 병렬 테스트를 통해 충분히 반복적으로 측정할 수 있다면 관찰된 점수의 평균은 실제 점수에 가깝습니다. 즉: E(X)=T 또는 E(E)=0

E가 정규분포를 따르는 확률변수라고 가정하자.

참 점수와 오류 점수 사이의 상관관계는 0입니다. 즉, ρ(T, E) = 0

가설은 E가 무작위 오류이며 체계적 오류에 포함되지 않는다는 것입니다.

병렬 테스트의 오류 점수 간의 상관 관계는 0입니다. 즉, ρ(E1, E2) = 0

가설은 E가 무작위 오류이며 체계적 오류에 포함되지 않는다는 것입니다.

차이 관계

Sx²=St²Se²

St²=Sv² Si²

V 테스트 - 실험적 처리와 관련된 변형 관련 없는 변형을 테스트합니다 - 체계적 오류 체계적 오류는 실제 분수에 포함됩니다.

Sx²= Sv² Si² Se²

심리 테스트 품질 지표

신뢰할 수 있음

정의

리터럴 정의

신뢰성이란 측정 결과의 일관성과 안정성의 정도, 즉 시간, 장소, 기타 요인에 따라 시험 점수가 변화함에 따라 시험 결과의 신뢰성을 나타내는 정도를 말합니다.

메모 정리: 신뢰성은 동일한 측정 도구 또는 동등한 도구를 반복적으로 사용하여 동일한 대상의 특정 심리적 특성을 서로 다른 시간과 상황에서 측정하여 얻은 결과의 일관성을 나타냅니다.

세 가지 동등한 수식 정의

신뢰도계수 : 측정점수 집합(대상자군)의 실제 점수변동에 대한 실제 점수변동의 비율(이론적 정의)

rxx= St²/Sx²= (Sx²-Se²)/Sx²=1-Se²/Sx²

신뢰도는 피험자 그룹의 실제 점수와 실제 점수 사이의 상관 계수의 제곱입니다(이론적 정의).

rxx=p²(xt)

신뢰성은 테스트 x와 병렬 테스트 x' 사이의 상관 계수입니다. (조작적 정의)

rxx=p(x,x')

효과

신뢰성은 측정 과정에서 발생하는 무작위 오류의 크기를 반영합니다.

rxx= St²/Sx² = (Sx²-Se²)/Sx²= 1-Se²/Sx²

Se가 작을수록 신뢰도는 높아지고, Se가 클수록 신뢰도는 낮아집니다.

신뢰성은 측정 과정의 체계적 오류 크기를 반영하지 않습니다.

신뢰성은 개별 시험 점수의 의미를 설명하는 데 사용될 수 있습니다.

두 테스트 점수의 차이는 새로운 분포를 형성할 수 있습니다. 이 분포의 표준 편차는 측정의 표준 오류 SE입니다. 이는 측정의 오류 크기를 테스트하는 데 사용할 수 있습니다. 표준 오류를 통해 그룹 내 사람에게 결과에 대한 적절한 설명을 제공합니다. 즉, 실제 점수의 간격 추정치는

SE=Sx√(1-rxx)

시험에서는 일반적으로 rxx 및 Sx를 제공합니다. 먼저 SE를 요청한 다음 T를 요청하세요.

X-Z*SE ≤T ≤X Z*SE

신뢰성은 다양한 테스트의 점수를 비교하는 데 도움이 됩니다.

서로 다른 테스트의 원점수를 직접 비교할 수는 없으며, 이를 표준점수로 변환한 후 비교하는 구체적인 방법은 "차이의 표준오차"를 사용하여 유의성 테스트를 수행하는 것입니다. 관찰된 점수의 차이 검정 x

SEd=S√(2-rxx-ryy)

t=(x1-x2)/SEd

추정방법의 분류

테스트-재테스트 신뢰성

신뢰도 측정/안정성 계수 동일한 피험자 집단에 동일한 척도를 두 번 투여하였을 때 얻은 결과의 일관성 정도를 말한다.

1개 시험, 1개 과목, 2개 시험 예: 성격 테스트, 속도 테스트

오류의 원인: 시간, 예: 성장, 성숙, 학습, 훈련, 행복 등 우연적 요인)

계산 방법: 피어슨 곱의 차이 상관관계

이용 약관

측정 도구로 측정된 개인의 심리적 특성은 시간이 지나도 상대적으로 안정적이어야 합니다.

측정 도구로 측정된 개인의 심리적 특성에는 뚜렷한 연습 효과나 망각 효과가 없어야 합니다.

두 시험 실시 사이에 특별한 훈련이나 훈련을 실시해서는 안 됩니다.

테스트-재테스트 신뢰성을 보고할 때 간격의 길이를 보고해야 합니다.

신뢰성 복제

두 가지 병렬 테스트(복제 테스트)는 동일한 피험자 그룹에서 얻은 결과의 일관성을 측정합니다.

두 개의 복제 테스트가 연속적으로 동시에 수행되며 이를 동등성 계수라고 합니다.

2개 시험, 1개 과목, 1개 시험

오류 원인: 질문 내용

일정 기간 동안 두 개의 중복 테스트를 별도로 실시하는 것을 안정성 및 동등성 계수(엄격한 신뢰도 테스트)라고 합니다.

2개 시험, 1개 과목, 2개 시험

오류 원인: 문제 내용 및 시간

적용 가능: 일반적으로 저울의 연구 개발 단계에서 사용됩니다. 성취도/성취도 시험은 피험자가 한 세트의 시험지를 볼 수 있고 동시에 두 세트를 볼 수 없기 때문에 수행할 수 없습니다.

계산 방법: Pearson 곱 차이 상관 관계

이용 약관

두 개 이상의 진정한 병렬 테스트를 구성할 수 있어야 합니다. 즉, 질문 내용, 수량, 형식, 난이도, 차별화, 지침, 시간 제한 및 모든 예, 공식 등이 동일하거나 유사한지 확인해야 합니다.

동일한 피험자 배치에 대해 두 가지 병렬 테스트를 수행하려면 연습 효과, 피로 효과 및 전이 효과의 영향을 받지 않도록 합리적인 시간 조정이 필요합니다.

테스트 보고서에는 두 테스트 사이의 시간 간격, 테스트 순서, 테스트 중 피험자의 테스트 경험을 자세히 설명합니다(표준화).

내부 일관성 신뢰성

정의 - 질문 샘플 내용의 일관성을 반영하여 테스트의 무작위 구성 요소가 동일한 심리적 특성을 측정하는지 여부를 평가합니다.

분할 신뢰도

시험의 모든 문제를 무작위로 두 부분으로 나누고 두 부분에 대한 피험자 점수의 일관성을 추정합니다. (피험자가 전체 세트를 완료한 후 데이터가 반으로 나뉩니다.)

1회 시험, 1개 과목, 1회 시험 성취도 테스트

계산 방법: 먼저 Pearson 곱 차이 상관 계산을 사용한 다음 Spearman-Brown 공식을 사용하여 확인합니다. rxx=2*rhh/(1 rhh) 시험에서는 일반적으로 ab 곱 차이 rhh를 제공합니다. 예를 들어 rhh=0.5, rxx를 찾습니다. =2*0.5/(1 0.5)=2/3

이용 약관

일반적으로 테스트는 한 번만 실시하거나 사본 없이 사용할 수 있으며 두 번의 절반 테스트에서 피험자 점수의 평균과 분산이 동일해야 합니다. Sa2=Sb2, 그렇지 않으면 Flanagan의 공식 또는 Lullen의 공식을 사용합니다.

테스트는 하프타임으로 나누어서 사용할 수 없습니다.

평가 기간이 길수록 결과가 더 안정적이고 테스트의 신뢰성이 높아집니다.

오류 원인: 내용. 관련 질문은 같은 반에 배치해야 합니다. 상관관계가 높으면 내용을 반으로 나누는 것이 합당한가요?

균질성 신뢰성

내부 일관성 계수, 테스트 내 모든 문제 간의 일관성 정도

1회 시험, 1개 과목, 1회 시험 성취도 테스트

쿠더-리처드슨 신뢰성

K-R20

(0, 1) 제품에만 적용 가능 = 채점, 객관식 질문, 판단 질문

오류의 원인: 질문 내용의 동질성 및 심리적, 행동적 특성

K-R21

(0, 1)곱=점수만 적용 가능하며, 평균 합격률, 단지형, 판단형 문항을 사용하여 계산하기 때문에 모든 문항의 난이도는 가까워야 합니다.

오류의 원인: 질문 내용의 동질성 및 심리적, 행동적 특성

Cronbach의 알파 계수

적용가능 (0, 1, 주관식-단답형, 논술형 등)

오류의 원인: 질문 내용의 동질성 및 심리적, 행동적 특성

사용 조건 - 테스트의 내부 일관성 신뢰성을 평가하기 위한 보다 일반적인 방법인 피험자 그룹에 대해 테스트를 한 번 테스트해야 합니다.

사용을 위한 내부 일관성 신뢰성 조건

모든 질문은 동일한 특성을 측정합니다.

모든 문제의 점수 사이에는 높은 양의 상관관계가 있습니다

속도 테스트에는 적용되지 않습니다.

테스트 신뢰도를 채점할 때 내부 일관성 계수에만 의존할 수 없으며 여러 신뢰도의 조합을 사용합니다.

평가자 간 신뢰도

여러 평가자가 동일한 주제에 대해 답변을 제공했습니다. 채점의 일관성 수준

오류의 원인: 평가자 자신

계산방법

2명의 평가자 - Pearson 제품 차이 상관 관계/Spearman 순위 상관 관계

3명의 평가자 - Kendall 하모니 계수

7명 이상의 평가자 - 카이제곱 검정 x2=k(N-1), df=N-1

적용 가능: 주관식 질문 채점(예: 작문) 완전히 객관적으로 채점할 수 없는 시험, 창의성 테스트, 투사 테스트 등

영향 테스트 신뢰도 및 제어 방법(개선 방법)

신뢰성에 영향을 미치는 요소

과목 요인

피험자 개인의 신체 건강, 시험 응시 동기, 주의력, 인내, 불안, 승리에 대한 열망, 응답 태도 등은 피험자의 심리적 특성의 안정성에 영향을 미칩니다.

대상 그룹: 그룹 이질성과 평균 수준은 신뢰도에 영향을 미치며, 이는 주로 상관 계수를 계산하여 추정됩니다. 그룹 수준의 수가 매우 다르면(이질적) 신뢰도 값이 과대평가되고, 동질성은 신뢰도 값을 과소평가하게 됩니다. .

이기종, 전체 범위 폭, 이산 분포, rxx 높이

균질하고 좁은 범위, 집중된 분포, 낮은 rxx

표준화 개선: 동질성이 강한 그룹에서 테스트의 신뢰성을 높이기 위해 적절한 테스트 그룹을 선택합니다.

주요 테스트 요소

응시자 : 시험 지시 사항을 엄격히 따르지 않거나 시험 과정을 통제하는 등 연령, 성별, 외모, 말투, 표정 등으로 피험자에게 주는 인상/압력/힌트가 점수에 영향을 미칩니다. 다양한 테스트 시나리오에서 테스트 대상의 분포.

채점자: 채점이 객관적이지 않아 점수 계산 시 오류가 발생하였습니다.

표준화 개선: 주 시험관은 시험 관리 절차를 엄격하게 시행하고, 채점자는 지침을 표준화하고, 시험 시간을 통제하고, 시험 문제를 주문하는 등의 표준을 엄격히 준수해야 하며, 채점자에게 필요한 교육을 제공하고, 시험 문제를 엄격하게 통제해야 합니다. 채점 오류, 평가 기준 및 채점 결과의 일관성 보장

측정 도구 - 측정 도구의 안정성이 측정 성공 또는 실패의 열쇠입니다.

시험 문제 샘플링, 문제 수가 많을수록 신뢰도가 높아집니다.

시험 문제의 난이도는 낮거나 높음으로 개인 간의 차이를 측정할 수 없으며 중간 정도의 난이도가 가장 적합하며 시험의 신뢰성을 높일 수 있습니다.

시험문제 간의 동질성 동질성이 높을수록 신뢰도가 높아집니다.

표준화 개선: 신중하게 테스트 척도를 컴파일하고, 큰 체계적 오류 방지

시험 시간을 적절하게 늘리고, 횟수도 적절하게 늘리고, 너무 길지 않게(너무 많이) 피험자에게 연습 효과와 피로 효과를 피하십시오.

새로운 문제의 난이도는 보통, 중간 수준으로 조절되어 모든 문제의 난이도가 정규분포에 가깝고 점수분포의 폭이 넓습니다.

과목별 점수 분포가 더 넓어지도록 문제 변별력을 개선합니다.

새로운 문제는 원래 시험과 내용이 동일합니다.

테스트 과정

테스트 환경

온도, 빛, 소리, 공간 크기 등은 응답 시 피험자의 심리 상태에 영향을 미쳐 시험 점수를 불안정하게 만들고 신뢰도에 영향을 미칩니다.

예상치 못한 중단: 정전, 질병, 용지 인쇄 오류

표준화 개선: 테스트 매뉴얼의 요구 사항에 따라 테스트 사이트를 배치하여 소음, 온도 및 피험자의 심리에 영향을 미칠 수 있는 기타 요소를 제어하는 등 관련 없는 요소의 간섭을 줄입니다.

테스트 간격

시험간격이 짧으면 연습효과와 피로효과가 있을 수 있고, 너무 길면 시험-재시험 신뢰도, 안정성, 동등계수 측면에서 피험자의 행동특성이 크게 변화할 수 있다. 간격이 클수록 신뢰도가 높아집니다.

오류 원인 제어, 표준화

무작위 오류를 제어하고 신뢰성을 향상시키는 방법 - 간략한 요약

위의 모든 영향 요인을 표준화합니다. 자세한 내용은 위의 "표준화 개선 사항"을 참조하세요.

테스트 항목 수를 적절하게 늘립니다.

요인분석(동질성) 및 판별분석(차별성) 전체 간격을 넓히다

대조시험 항목 난이도 - 적정

적절한 주제 그룹 선택 - 대표

약점 수정 - 제어 오류

타당성

정의

리터럴 정의

테스트 또는 척도(테스트 도구)가 측정하려는 심리적 특성 또는 행동 특성(타당성, 정확성, 유용성)을 실제로 측정할 수 있는 효과 및 정도

공식 정의

테스트 점수 집합에서 실제 점수와 관련된 실제 변형 Sv² 대 전체 변형 Sx², r²xy 또는 V의 비율은 유효성을 나타내고, rxy는 유효성 계수, r²xy= Sv²/Sx²를 나타냅니다.

효과

타당성은 측정의 무작위 오류 E와 체계적 오류 I를 포괄적으로 반영합니다.

타당도는 상대적인 개념입니다. 측정의 특정 목적에 따라 측정은 어느 정도의 정확도만 달성할 수 있습니다.

시험 점수와 기준 점수가 선형 관계에 있는 경우, 선형 회귀 지식을 활용하여 시험 점수를 통해 기준 점수를 예측할 수 있습니다.

타당성과 신뢰성의 관계

높은 측정 신뢰도는 높은 타당성을 위한 필요조건이지만 충분조건은 아닙니다.

수식을 사용하여 설명 X 관찰 점수 = T(실제 점수) E(무작위 오류) =V(실험적 처리) I(시스템 오류) E Sx²= Sv² Si² Se²

rxx= St²/Sx²= (Sv² SI²)/Sx²

V=r²xy= Sv²/Sx²

rxx> r²xy(V)

rxx= St²/Sx²= (Sx²-Se²)/Sx²=1-Se²/Sx² 신뢰성은 무작위 오류 E로 인해 발생합니다.

타당성은 무작위 오류 E와 체계적 오류 I에 의해 발생합니다.

타당도가 높다는 것은 신뢰도가 높다는 것을 의미하며, 신뢰성이 높다고 해서 반드시 타당도가 높다는 의미는 아닙니다.

유효성 유형

내용 타당성

정의

시험에서 실제로 측정한 내용과 측정하려는 내용이 일치하는 정도를 말한다(예: 347 대학원 입시 vs 시험요강).

특징

측정 동작의 내용이 명확하고 샘플링이 대표적입니다.

적당한 무게

이용 약관

모든 테스트 항목이 이 범위에 속하도록 범위를 설정해야 합니다.

손해보험 항목은 외부적으로 결정된 내용 범위의 대표적인 표본입니다.

해당 가능

특정 속성에 대한 테스트, 학력검사, 진로검사(선발 및 분류) 등

적성검사, 인성검사에는 적합하지 않음(추상)

결정 방법

논리적 분석방법(전문가 평가방법)

명확한 범위

양방향 분석 시트 준비

예: OK: 후보자 요구 사항 칼럼 : 후보자 심사 내용

평가 척도 개발

일반적인 방법

Bach-Cron 방법(알파계수 방법)

동일한 내용을 측정하는 두 개의 병렬 테스트 점수 집합 간의 상관 관계를 찾습니다(복제 신뢰도).

테스트-재테스트 방법

시험-재시험법이라고도 하며, 특정 지식을 학습하기 전과 후에 동일한 시험을 치르는 것을 말하며, 사전 시험보다 사후 시험이 좋을수록 내용타당도가 높다.

경험적 방법

다양한 피험자 그룹은 시험 점수와 각 질문에 대한 응답이 달랐습니다.

예: 일반적으로 성적이 높을수록 성적이 높을수록 성취도가 높다고 생각됩니다.

내용 타당성과 얼굴 타당성의 관계

안면 타당성의 정의

표면적으로 특정 인물에 대한 일반인의 테스트는 특정 심리적 특성을 측정하는 현상처럼 보입니다.

얼굴 타당성은 피험자의 동기에 영향을 미치고 간접적으로 테스트의 타당성에 영향을 미칩니다.

성취도 테스트는 피험자가 강한 동기를 갖도록 높은 표면 타당성을 요구합니다. 그렇지 않으면 피험자는 불신할 것입니다. 성격 테스트는 낮은 표면 타당성을 요구합니다. 그렇지 않으면 피험자는 속임수를 쓰게 됩니다.

타당성을 구성하다 타당성을 구성하다

정의

이는 시험이 측정하고자 하는 이론적 구조와 특성을 실제로 측정하는 정도를 말하며, 시험 점수가 심리학 이론의 특정 구조나 특성을 설명할 수 있는 정도를 말합니다. 실험과 이론을 기반으로 합니다.

특징

구성 타당도의 크기는 사전에 가정된 심리적 특성 이론에 따라 달라집니다.

경험적 자료가 이론을 확증하지 못한다고 해서 반드시 구성타당도가 높지 않다는 의미는 아니지만 이론적 가정이 타당하지 않다는 의미일 수도 있다.

구조적 타당성은 측정 내용의 선택을 누적하여 결정되는데, 즉 하나의 구성에 대해서는 여러 개의 가설이 있을 수 있으므로 단일한 정량적 지표 구성 타당성을 갖는 것은 불가능하다.

해당 가능

추상적인 개념 퀴즈 지능검사, 성격검사, 자기효능감 검사 등

일반 단계

이론적 가설 제안

이론적 틀을 바탕으로 시험 점수에 대한 가설 도출

가설을 테스트하기 위해 논리적이고 경험적인 방법을 사용하십시오.

구체적인 방법

퀴즈 속에서 증거를 찾아보세요

내용 타당성

균질성 신뢰성

내용타당성을 검토하고 분석한다. 질문에 답하고 동질성 신뢰도를 계산하는 과정

퀴즈 사이에 증거 찾기

호환 타당성 방법

새로 작성된 테스트와 적합성 측정에 효과적이라고 알려진 기존 테스트 간의 상관관계를 찾습니다. 상관관계가 높으면 내용 타당도가 높은 것입니다. 즉, 기존 테스트와 새 테스트 간의 상관 관계를 찾습니다.

판별 타당성

새로 작성된 테스트와 다양한 특성을 측정하는 데 효과적이라고 알려진 이전 테스트 간의 상관 관계를 찾으십시오. 상관 관계가 높으면 내용 타당성이 높지 않습니다.

여러 테스트 간의 상관 관계 정도

경험적 타당성 방법

사람들을 유효성 기준에 따라 두 범주로 나누고 점수의 차이를 조사합니다. 점수에 따라 사람들을 상위 그룹과 하위 그룹으로 나누어 유효성 기준의 차이를 조사합니다. 차이가 유의하면 구성 타당도가 높습니다. - 행동 상태를 검사합니다.

다중 특성 - 다중 방법 매트릭스 방법

호환타당도와 판별타당도의 종합적 적용 -MTMM

수렴타당성-동질차분법

동일한 특성을 측정하는 다양한 테스트 상관 계수가 높을수록 적합성 타당성이 높아집니다.

예: 자기 보고 및 투영을 사용하여 성격 내향성 측정

판별 타당성 - 동일한 방법이지만 동질적이지 않음

유사성 테스트는 다양한 특성을 측정합니다. 상관계수가 낮으면 판별타당도가 높다.

예: 피험자의 외향성과 책임감을 측정하기 위해 자기 보고 척도를 사용합니다.

보충: 유사성 테스트는 유사한 특성을 측정합니다. 상관 계수가 높을수록 신뢰도가 높아집니다.

요인 분석

적은 수의 차원 축소 작업으로 대량의 관찰 데이터를 요약합니다.

CFA 확증요인 분석 확인적 요인 분석

여러 차원을 알고, 테스트하고, 결과를 얻으세요. 해당 치수가 올바른지 확인하세요.

EFA 탐색적 요인 분석 탐색적 요인 분석

몇 가지 차원을 미리 알지 못하더라도 살펴보겠습니다.

경험적 타당성(기준 관련 타당성) 기준 연계 효과

정의

테스트 쌍이 특정 상황에 있음 개인 행동 추정의 효율성

실제 결과를 테스트 표준으로 삼음

예: 대학원 시험 선발, 시험은 시험이며 기준은 과학 연구 능력입니다. 과학 연구 능력이 높다는 것은 효율성 기준이 높다는 것을 의미합니다.

효능기준

타당도 기준이란 추정되는 행동을 말하며 타당성을 검정하기 위한 기준이자 검정의 타당성을 측정하기 위한 외부 기준이다.

효능기준 오염

피험자의 시험 점수를 아는 것에 영향을 받음 효과적인 점수를 평가하기 위해

선정기준

상관관계

유효성 기준은 현재 평가되고 있는 것과 관련된 것입니다.

유효성

기준과 그것이 나타내는 특성 사이에는 높은 수준의 일관성이 있습니다.

오염 없음

기준 측정은 평가되는 측정을 기반으로 하지 않습니다.

객관성

유효성 기준은 주관적인 경험을 바탕으로 평가되므로, 그러니 주관적인 편견을 피하세요

실용적인 사항

실효성 확보를 전제로, 최대한 간단하고 시간을 절약하며 작동 가능하게 만드세요.

특징

독립적으로 존재하고 객관적으로 관련된 행동 특성

일반적으로 사용되는 표준

학업 성취도, 평가, 임상 진단, 전문 교육 결과, 실무 수행 능력, 그룹 간 구별 능력, 기타 쉽게 이용 가능하고 유효한 테스트

해당 가능

인사 선발 등 결과 예측

경험적 타당성의 범주

동시 타당도

기준 데이터와 시험 점수가 동시에 수집됩니다.

진단상태

예측 타당성

먼저 테스트를 받아본 후, 테스트 점수에 따라 유효성 기준을 결정합니다.

미래를 추측해 보세요

결정 방법

명확한 컨셉 표준

효능 표준 측정 결정

측정 점수와 기준 측정 간의 관계를 조사합니다.

구체적인 방법