마인드 맵 갤러리 심리측정학
중국과학원: 심리 상담사 - 기본 개념, 고전적인 테스트 이론, 심리 테스트 품질 지표 등을 포함한 심리 측정학
2024-01-31 16:23:53에 편집됨이것은 (III) 저산소증-유도 인자 프롤릴 하이드 록 실라 제 억제제에 대한 마인드 맵이며, 주요 함량은 다음을 포함한다 : 저산소증-유도 인자 프롤릴 하이드 록 실라 제 억제제 (HIF-PHI)는 신장 빈혈의 치료를위한 새로운 소형 분자 경구 약물이다. 1. HIF-PHI 복용량 선택 및 조정. Rosalasstat의 초기 용량, 2. HIF-PHI 사용 중 모니터링, 3. 부작용 및 예방 조치.
이것은 Kuka Industrial Robots의 개발 및 Kuka Industrial Robot의 모션 제어 지침에 대한 마인드 맵입니다. 주요 내용에는 쿠카 산업 로봇의 역사, 쿠카 산업 로봇의 특성, 쿠카 산업 로봇의 응용 분야, 2. 포장 프로세스에서 쿠카 로봇은 빠르고 일관된 포장 작업을 달성하고 포장 효율성을 높이며 인건비를 줄입니다. 2. 인건비 감소 : 자동화는 운영자에 대한 의존성을 줄입니다. 3. 조립 품질 향상 : 정확한 제어는 인간 오류를 줄입니다.
408 컴퓨터 네트워크가 너무 어렵습니까? 두려워하지 마세요! 나는 피를 구토하고 지식 맥락을 명확히하는 데 도움이되는 매우 실용적인 마인드 맵을 분류했습니다. 컨텐츠는 매우 완전합니다. 네트워크 아키텍처에서 응용 프로그램 계층, TCP/IP 프로토콜, 서브넷 디비전 및 기타 핵심 포인트에 이르기까지 원칙을 철저히 이해하는 데 도움이 될 수 있습니다. 📈 명확한 논리 : Mindmas 보물, 당신은 드문 기회가 있습니다. 서둘러! 이 마인드 맵을 사용하여 408 컴퓨터 네트워크의 학습 경로에서 바람과 파도를 타고 성공적으로 해변을 얻으십시오! 도움이 필요한 친구들과 공유해야합니다!
이것은 (III) 저산소증-유도 인자 프롤릴 하이드 록 실라 제 억제제에 대한 마인드 맵이며, 주요 함량은 다음을 포함한다 : 저산소증-유도 인자 프롤릴 하이드 록 실라 제 억제제 (HIF-PHI)는 신장 빈혈의 치료를위한 새로운 소형 분자 경구 약물이다. 1. HIF-PHI 복용량 선택 및 조정. Rosalasstat의 초기 용량, 2. HIF-PHI 사용 중 모니터링, 3. 부작용 및 예방 조치.
이것은 Kuka Industrial Robots의 개발 및 Kuka Industrial Robot의 모션 제어 지침에 대한 마인드 맵입니다. 주요 내용에는 쿠카 산업 로봇의 역사, 쿠카 산업 로봇의 특성, 쿠카 산업 로봇의 응용 분야, 2. 포장 프로세스에서 쿠카 로봇은 빠르고 일관된 포장 작업을 달성하고 포장 효율성을 높이며 인건비를 줄입니다. 2. 인건비 감소 : 자동화는 운영자에 대한 의존성을 줄입니다. 3. 조립 품질 향상 : 정확한 제어는 인간 오류를 줄입니다.
408 컴퓨터 네트워크가 너무 어렵습니까? 두려워하지 마세요! 나는 피를 구토하고 지식 맥락을 명확히하는 데 도움이되는 매우 실용적인 마인드 맵을 분류했습니다. 컨텐츠는 매우 완전합니다. 네트워크 아키텍처에서 응용 프로그램 계층, TCP/IP 프로토콜, 서브넷 디비전 및 기타 핵심 포인트에 이르기까지 원칙을 철저히 이해하는 데 도움이 될 수 있습니다. 📈 명확한 논리 : Mindmas 보물, 당신은 드문 기회가 있습니다. 서둘러! 이 마인드 맵을 사용하여 408 컴퓨터 네트워크의 학습 경로에서 바람과 파도를 타고 성공적으로 해변을 얻으십시오! 도움이 필요한 친구들과 공유해야합니다!
심리측정학
기본 사상
심리 측정 및 기본 속성
정의: 특정 심리학 이론을 기반으로 사람들의 심리적 특성을 정량적으로 설명하기 위해 테스트를 사용하는 프로세스입니다.
심리 테스트(도구)는 본질적으로 행동 샘플에 대한 테스트입니다. 4가지 요소를 포함한 객관성과 표준화된 측정
행동 샘플: 행동 영역, 즉 추출 가능한 행동의 모집단
표준화: 시험 내용, 시험 시행 조건(상황별 지침, 기간 등), 채점 규칙, 시험 기준(비교를 위한 기준점 제공)
난이도 또는 응답률
신뢰성(신뢰성, 일관성) 타당성(효과성, 정확성)
몇몇 중요한 사람들
Galton-Quantitative 연구는 개인차 등의 연구를 개척했습니다. 심리검사 첫 번째 사람
Cattell-논문 "심리 테스트 및 측정" 심리검사라는 용어를 최초로 제안
Thorndike - "심리적, 사회적 측정 입문" 테스트 이론에 관한 첫 번째 책
기본 기능
적용의 보편성(가능성: 측정 가능, 측정 가능)
간접성(질문에 대답하는 등의 외부 행동 수행)
심리적 영향 - 객관성(표준화된 질문, 객관적인 결과)
오류는 보편적입니다(모든 측정은 오류를 기반으로 함).
상대성(결과, 위치는 상대적입니다. 예: IQ)
기본 요소
기준점
절대 기준점: 절대 영점, 예: 무게, 키, 반응 시간
상대 기준점: 인위적으로 결정된 영점(예: 고도, 온도)
단위
동등한 가치, 예: 1~2m&2~3m 동등한 가치
등각 투영: 수치 값이 동일하며 실제 의미도 동일합니다.
불평등 간격: 값은 동일하지만 실제 의미는 다릅니다. 예: 강사-부교수-정교수
결정된 의미, 예: 단위 m, kg
척도 유형
사물을 일정한 규칙에 따라 수량화하는 것, 즉 사물의 속성을 일정한 단위와 기준점의 연속체로 표현하는 것을 척도라고 한다.
명명 규모
정의 - 사물의 구성 요소를 나타내기 위해 숫자를 사용하거나 숫자를 분류하는 것
동등한 단위 없음
영점 없음
계산할 수 없습니다
예: 성별 구분, 학번 지정
통계 방법: 빈도, 모드, 백분율, X2 테스트
순서 척도(평가 척도)
정의 - 숫자는 범주를 나타낼 뿐만 아니라 다양한 카테고리 크기 및 수준, 정렬 및 정렬
동등한 단위 없음
영점 없음
계산할 수 없습니다
예: 등급 분류 및 분류, 직위 평가
통계 방법: 중앙값, 백분위수, 순위 상관관계, Kendall 하모니 계수
아이소메트릭 스케일
정의 - 사물의 범주와 등급뿐만 아니라 동일한 거리와 측정 단위, 분류, 순서를 나타낼 수 있습니다.
단위가 동일하다
상대 영점
수 - 산술
예: 온도계, 고도 측정, 분수 측정
통계적 방법: 평균, 표준편차, 제품차이 상관계수, 순위 상관관계, t 테스트, f 테스트
비율 척도(동일 비율 척도)
정의 - 명명된 수준 등을 제외하고 가장 완전한 척도입니다. 거리, 절대 영점 분류, 정렬, - x ¼
단위가 동일하다
절대 영도
캔 - x ¼ 연산
예: 키 측정, 체중계, 부반응 시간
통계적 방법: 등각 기하 평균 변동 계수
퀴즈 유형
측정된 심리적 특성에 따른 분류
적성검사
최고의 행동 테스트
지능 테스트
Binet-Simon, 세계 최초의 지능 척도, 1905년; Dong Zhongshu는 한 손으로 사각형을 그리고 다른 손으로 원을 그립니다(테스트에 주의하세요). 공자: 개별 학생 수의 지능 등급 차이;
적성검사에는 일반능력과 특수능력이 포함됩니다.
일주일을 잡고, 노래하고, 춤추고, SAT, DAT 그리기
성취도 테스트
예: 각종 시험
보충 자료: 창의성 퀴즈
청나라 칠교놀이와 나인링크(중국식 미로)
보충 자료: 교육용 시험
서주(周周)나라의 노예제도-중국학-초기교육시험
한나라-연간 시험 제도-제1회 필기 시험
수(隋) 양제(陽皇)의 과거제도인 양제는 1,300년 이상 지속되었다.
성격 테스트
전형적인 행동 테스트
자기보고 성격 테스트
객관식 문제 - MMPI, 16PF, EPQ, EPPS, YG 인성검사
성격 투사 테스트
로르샤흐 잉크 반점 테스트(최초의 투사 테스트), 주제 통각 테스트(TAT), 하우스 트리맨 테스트, 샌드박스
몇 가지 중요한 수치 및 추가 사항
Kraepelin - 정신질환을 진단하기 위해 자유연상검사를 최초로 사용한 사람 성격 테스트의 선구자
Woodworth - Woodworth 프로필 설문지 최초의 현대 성격 설문지
공자-인격은 3가지로 분류되며, 유소의 성격은 12가지로 분류됩니다. 인성검사에 속합니다.
피험자가 평가 시 사용한 참고기준에 따라 분류
규범 참조 테스트(집단과 비교)
그룹을 기준 배경으로 사용하고 그룹 내 개인의 상대적 위치를 사용하여 개인의 발달 수준을 평가하는 테스트로 지능 테스트와 같이 그룹 내 능력이나 지식의 연속체에 대한 개인의 상대적 위치를 나타냅니다. 능력 시험 및 대학원 입학 시험 재시험;
기준 참조 테스트(표준과 비교)
시험 내용이나 특정 행동 표준 수준을 기준으로 개인을 평가하는 시험으로, 개인의 수준이 현장에서 일정한 기준에 도달했는지 여부만을 기준으로 개인의 발달 수준을 평가하는 시험입니다. 대학원 입시 예비시험, 운전면허 시험, 심리상담 시험 등은 특정 기준에 따라 이루어지며 타인의 점수와는 아무런 관련이 없습니다.
표준화 정도에 따라 분류
표준화된 시험 - 4점 요구사항
시험 준비 과정의 표준화
테스트 구현 표준화
시험 채점 표준화
시험 점수 해석 표준화
비표준화 테스트
실제 측정방법에 따른 분류
컴퓨터 기반 테스트(CBT)
컴퓨터 적응 테스트(CAT)
인터넷 기반 테스트(IBI)
기타 카테고리
측정 방법에 따라
개별 테스트, 예: Stanford-Binet 척도, Wechsler 지능 척도 및 기타 지능 척도, Rorschach 잉크반점, 주제별 통각 테스트, 특수 그룹에 대한 개별 테스트 선택
그룹 테스트, 예: 레이븐의 추론 테스트, 육군 A 및 B 테스트, 높은 효율성과 경제성을 추구하는 선택적 그룹 테스트;
발현 내용과 반응 형태에 따라
언어(종이 및 연필) 테스트-Stanford-Binet Scale/16PF
비언어적(조작) 테스트 까마귀의 추론 테스트/로르샤흐 잉크 반점 테스트
테스트 기능에 따라
성취도 및 예측 테스트
난이도 및 속도 테스트
난이도 테스트 - 난이도 - 다이빙
속도 테스트 - 높고 안정적인 점수; 문제량이 많음 - 반응속도 테스트/100m 경주
기술 및 진단 테스트
질문 유형에 따라
주관식 시험-단답/에세이/작문
객관식 시험 - 단선택/판단
필요에 따라 점수를 매기세요
최고의 행동 테스트 - 가능한 한 잘 대답하고 정답을 맞추십시오. 능력시험과 같은
일반적인 행동 테스트 - 답변 습관을 기반으로 하며 정답은 없습니다. 성격 테스트와 같은
고전적 테스트 이론
심리 측정 오류
의미
측정 과정에서 측정 목적과 무관한 요인의 변화로 인해 발생하는 부정확하고 일관되지 않은 측정 효과
유형
무작위 오류(Random error) - 측정 목적과 무관한 우발적인 요인으로 인해 제어하기 어려운 오류로, 여러 측정 결과가 일치하지 않고 테스트/병렬 테스트를 반복하면 방향과 변화가 완전히 일치하지 않습니다. 여러 번 측정하면 평균값만 0 정규 분포입니다. 측정 결과가 일관되지 않고 부정확합니다.
체계적 오류(Systematic error) - 측정 목적과 관련이 없는 변수로 인해 발생하는 지속적이고 규칙적인 효과입니다. 각 측정에서 안정적이고 일관되며, 여러 측정 결과가 일관되고 부정확하게 나타납니다.
원천
측정 도구(체계적 오류) - 일련의 테스트(설문지)를 중심으로 한 자극-반응 시스템(종종 척도라고 함)
부적절한 질문 샘플링
질문 형식이 부적절합니다
난이도가 너무 높거나 너무 낮음
지침의 부적절한 표현
측정 대상(랜덤오차-개인차) - 대상자의 실제 수준이 정상적으로 발휘되고 있는지 여부
감정, 동기, 반응 경향 등
테스트 프로세스(통제 및 테스트가 가장 쉬움) - 우발적 요인: 물리적 환경, 시간, 예상치 못한 간섭 등
제어
표준화
측정대상
피험자 측 – 피험자의 신체적, 정신적 상태는 측정 중 안정적이었습니다.
메인 테스트 측면에서 메인 테스터는 시스템의 표준화된 운영에 주목합니다.
측정 도구
시험 준비의 과학적 성격을 향상시킵니다.
수집된 정보의 풍부함과 보편성에 주목하세요.
프로젝트 샘플링의 대표성에 주목
프로젝트 난이도에는 특정 분포 범위가 있습니다.
테스트 용어는 간단하고 명확합니다.
테스트 과정
동일한 테스트 상황
같은 지시
동일한 시험 시간 제한
채점은 객관적이어야 하며 테스트 결과의 해석은 표준화되어야 합니다.
고전적인 테스트 이론 모델
CTT
수학적 모델 X(관측 점수) = T(실제 점수) E(무작위 오류)
가설 추론
개인의 심리적 특성을 병렬 테스트를 통해 충분히 반복적으로 측정할 수 있다면 관찰된 점수의 평균은 실제 점수에 가깝습니다. 즉: E(X)=T 또는 E(E)=0
E가 정규분포를 따르는 확률변수라고 가정하자.
참 점수와 오류 점수 사이의 상관관계는 0입니다. 즉, ρ(T, E) = 0
가설은 E가 무작위 오류이며 체계적 오류에 포함되지 않는다는 것입니다.
병렬 테스트의 오류 점수 간의 상관 관계는 0입니다. 즉, ρ(E1, E2) = 0
가설은 E가 무작위 오류이며 체계적 오류에 포함되지 않는다는 것입니다.
차이 관계
Sx²=St²Se²
St²=Sv² Si²
V 테스트 - 실험적 처리와 관련된 변형 관련 없는 변형을 테스트합니다 - 체계적 오류 체계적 오류는 실제 분수에 포함됩니다.
Sx²= Sv² Si² Se²
심리 테스트 품질 지표
신뢰할 수 있음
정의
리터럴 정의
신뢰성이란 측정 결과의 일관성과 안정성의 정도, 즉 시간, 장소, 기타 요인에 따라 시험 점수가 변화함에 따라 시험 결과의 신뢰성을 나타내는 정도를 말합니다.
메모 정리: 신뢰성은 동일한 측정 도구 또는 동등한 도구를 반복적으로 사용하여 동일한 대상의 특정 심리적 특성을 서로 다른 시간과 상황에서 측정하여 얻은 결과의 일관성을 나타냅니다.
세 가지 동등한 수식 정의
신뢰도계수 : 측정점수 집합(대상자군)의 실제 점수변동에 대한 실제 점수변동의 비율(이론적 정의)
rxx= St²/Sx²= (Sx²-Se²)/Sx²=1-Se²/Sx²
신뢰도는 피험자 그룹의 실제 점수와 실제 점수 사이의 상관 계수의 제곱입니다(이론적 정의).
rxx=p²(xt)
신뢰성은 테스트 x와 병렬 테스트 x' 사이의 상관 계수입니다. (조작적 정의)
rxx=p(x,x')
효과
신뢰성은 측정 과정에서 발생하는 무작위 오류의 크기를 반영합니다.
rxx= St²/Sx² = (Sx²-Se²)/Sx²= 1-Se²/Sx²
Se가 작을수록 신뢰도는 높아지고, Se가 클수록 신뢰도는 낮아집니다.
신뢰성은 측정 과정의 체계적 오류 크기를 반영하지 않습니다.
신뢰성은 개별 시험 점수의 의미를 설명하는 데 사용될 수 있습니다.
두 테스트 점수의 차이는 새로운 분포를 형성할 수 있습니다. 이 분포의 표준 편차는 측정의 표준 오류 SE입니다. 이는 측정의 오류 크기를 테스트하는 데 사용할 수 있습니다. 표준 오류를 통해 그룹 내 사람에게 결과에 대한 적절한 설명을 제공합니다. 즉, 실제 점수의 간격 추정치는
SE=Sx√(1-rxx)
시험에서는 일반적으로 rxx 및 Sx를 제공합니다. 먼저 SE를 요청한 다음 T를 요청하세요.
X-Z*SE ≤T ≤X Z*SE
신뢰성은 다양한 테스트의 점수를 비교하는 데 도움이 됩니다.
서로 다른 테스트의 원점수를 직접 비교할 수는 없으며, 이를 표준점수로 변환한 후 비교하는 구체적인 방법은 "차이의 표준오차"를 사용하여 유의성 테스트를 수행하는 것입니다. 관찰된 점수의 차이 검정 x
SEd=S√(2-rxx-ryy)
t=(x1-x2)/SEd
추정방법의 분류
테스트-재테스트 신뢰성
신뢰도 측정/안정성 계수 동일한 피험자 집단에 동일한 척도를 두 번 투여하였을 때 얻은 결과의 일관성 정도를 말한다.
1개 시험, 1개 과목, 2개 시험 예: 성격 테스트, 속도 테스트
오류의 원인: 시간, 예: 성장, 성숙, 학습, 훈련, 행복 등 우연적 요인)
계산 방법: 피어슨 곱의 차이 상관관계
이용 약관
측정 도구로 측정된 개인의 심리적 특성은 시간이 지나도 상대적으로 안정적이어야 합니다.
측정 도구로 측정된 개인의 심리적 특성에는 뚜렷한 연습 효과나 망각 효과가 없어야 합니다.
두 시험 실시 사이에 특별한 훈련이나 훈련을 실시해서는 안 됩니다.
테스트-재테스트 신뢰성을 보고할 때 간격의 길이를 보고해야 합니다.
신뢰성 복제
두 가지 병렬 테스트(복제 테스트)는 동일한 피험자 그룹에서 얻은 결과의 일관성을 측정합니다.
두 개의 복제 테스트가 연속적으로 동시에 수행되며 이를 동등성 계수라고 합니다.
2개 시험, 1개 과목, 1개 시험
오류 원인: 질문 내용
일정 기간 동안 두 개의 중복 테스트를 별도로 실시하는 것을 안정성 및 동등성 계수(엄격한 신뢰도 테스트)라고 합니다.
2개 시험, 1개 과목, 2개 시험
오류 원인: 문제 내용 및 시간
적용 가능: 일반적으로 저울의 연구 개발 단계에서 사용됩니다. 성취도/성취도 시험은 피험자가 한 세트의 시험지를 볼 수 있고 동시에 두 세트를 볼 수 없기 때문에 수행할 수 없습니다.
계산 방법: Pearson 곱 차이 상관 관계
이용 약관
두 개 이상의 진정한 병렬 테스트를 구성할 수 있어야 합니다. 즉, 질문 내용, 수량, 형식, 난이도, 차별화, 지침, 시간 제한 및 모든 예, 공식 등이 동일하거나 유사한지 확인해야 합니다.
동일한 피험자 배치에 대해 두 가지 병렬 테스트를 수행하려면 연습 효과, 피로 효과 및 전이 효과의 영향을 받지 않도록 합리적인 시간 조정이 필요합니다.
테스트 보고서에는 두 테스트 사이의 시간 간격, 테스트 순서, 테스트 중 피험자의 테스트 경험을 자세히 설명합니다(표준화).
내부 일관성 신뢰성
정의 - 질문 샘플 내용의 일관성을 반영하여 테스트의 무작위 구성 요소가 동일한 심리적 특성을 측정하는지 여부를 평가합니다.
분할 신뢰도
시험의 모든 문제를 무작위로 두 부분으로 나누고 두 부분에 대한 피험자 점수의 일관성을 추정합니다. (피험자가 전체 세트를 완료한 후 데이터가 반으로 나뉩니다.)
1회 시험, 1개 과목, 1회 시험 성취도 테스트
계산 방법: 먼저 Pearson 곱 차이 상관 계산을 사용한 다음 Spearman-Brown 공식을 사용하여 확인합니다. rxx=2*rhh/(1 rhh) 시험에서는 일반적으로 ab 곱 차이 rhh를 제공합니다. 예를 들어 rhh=0.5, rxx를 찾습니다. =2*0.5/(1 0.5)=2/3
이용 약관
일반적으로 테스트는 한 번만 실시하거나 사본 없이 사용할 수 있으며 두 번의 절반 테스트에서 피험자 점수의 평균과 분산이 동일해야 합니다. Sa2=Sb2, 그렇지 않으면 Flanagan의 공식 또는 Lullen의 공식을 사용합니다.
테스트는 하프타임으로 나누어서 사용할 수 없습니다.
평가 기간이 길수록 결과가 더 안정적이고 테스트의 신뢰성이 높아집니다.
오류 원인: 내용. 관련 질문은 같은 반에 배치해야 합니다. 상관관계가 높으면 내용을 반으로 나누는 것이 합당한가요?
균질성 신뢰성
내부 일관성 계수, 테스트 내 모든 문제 간의 일관성 정도
1회 시험, 1개 과목, 1회 시험 성취도 테스트
쿠더-리처드슨 신뢰성
K-R20
(0, 1) 제품에만 적용 가능 = 채점, 객관식 질문, 판단 질문
오류의 원인: 질문 내용의 동질성 및 심리적, 행동적 특성
K-R21
(0, 1)곱=점수만 적용 가능하며, 평균 합격률, 단지형, 판단형 문항을 사용하여 계산하기 때문에 모든 문항의 난이도는 가까워야 합니다.
오류의 원인: 질문 내용의 동질성 및 심리적, 행동적 특성
Cronbach의 알파 계수
적용가능 (0, 1, 주관식-단답형, 논술형 등)
오류의 원인: 질문 내용의 동질성 및 심리적, 행동적 특성
사용 조건 - 테스트의 내부 일관성 신뢰성을 평가하기 위한 보다 일반적인 방법인 피험자 그룹에 대해 테스트를 한 번 테스트해야 합니다.
사용을 위한 내부 일관성 신뢰성 조건
모든 질문은 동일한 특성을 측정합니다.
모든 문제의 점수 사이에는 높은 양의 상관관계가 있습니다
속도 테스트에는 적용되지 않습니다.
테스트 신뢰도를 채점할 때 내부 일관성 계수에만 의존할 수 없으며 여러 신뢰도의 조합을 사용합니다.
평가자 간 신뢰도
여러 평가자가 동일한 주제에 대해 답변을 제공했습니다. 채점의 일관성 수준
오류의 원인: 평가자 자신
계산방법
2명의 평가자 - Pearson 제품 차이 상관 관계/Spearman 순위 상관 관계
3명의 평가자 - Kendall 하모니 계수
7명 이상의 평가자 - 카이제곱 검정 x2=k(N-1), df=N-1
적용 가능: 주관식 질문 채점(예: 작문) 완전히 객관적으로 채점할 수 없는 시험, 창의성 테스트, 투사 테스트 등
영향 테스트 신뢰도 및 제어 방법(개선 방법)
신뢰성에 영향을 미치는 요소
과목 요인
피험자 개인의 신체 건강, 시험 응시 동기, 주의력, 인내, 불안, 승리에 대한 열망, 응답 태도 등은 피험자의 심리적 특성의 안정성에 영향을 미칩니다.
대상 그룹: 그룹 이질성과 평균 수준은 신뢰도에 영향을 미치며, 이는 주로 상관 계수를 계산하여 추정됩니다. 그룹 수준의 수가 매우 다르면(이질적) 신뢰도 값이 과대평가되고, 동질성은 신뢰도 값을 과소평가하게 됩니다. .
이기종, 전체 범위 폭, 이산 분포, rxx 높이
균질하고 좁은 범위, 집중된 분포, 낮은 rxx
표준화 개선: 동질성이 강한 그룹에서 테스트의 신뢰성을 높이기 위해 적절한 테스트 그룹을 선택합니다.
주요 테스트 요소
응시자 : 시험 지시 사항을 엄격히 따르지 않거나 시험 과정을 통제하는 등 연령, 성별, 외모, 말투, 표정 등으로 피험자에게 주는 인상/압력/힌트가 점수에 영향을 미칩니다. 다양한 테스트 시나리오에서 테스트 대상의 분포.
채점자: 채점이 객관적이지 않아 점수 계산 시 오류가 발생하였습니다.
표준화 개선: 주 시험관은 시험 관리 절차를 엄격하게 시행하고, 채점자는 지침을 표준화하고, 시험 시간을 통제하고, 시험 문제를 주문하는 등의 표준을 엄격히 준수해야 하며, 채점자에게 필요한 교육을 제공하고, 시험 문제를 엄격하게 통제해야 합니다. 채점 오류, 평가 기준 및 채점 결과의 일관성 보장
측정 도구 - 측정 도구의 안정성이 측정 성공 또는 실패의 열쇠입니다.
시험 문제 샘플링, 문제 수가 많을수록 신뢰도가 높아집니다.
시험 문제의 난이도는 낮거나 높음으로 개인 간의 차이를 측정할 수 없으며 중간 정도의 난이도가 가장 적합하며 시험의 신뢰성을 높일 수 있습니다.
시험문제 간의 동질성 동질성이 높을수록 신뢰도가 높아집니다.
표준화 개선: 신중하게 테스트 척도를 컴파일하고, 큰 체계적 오류 방지
시험 시간을 적절하게 늘리고, 횟수도 적절하게 늘리고, 너무 길지 않게(너무 많이) 피험자에게 연습 효과와 피로 효과를 피하십시오.
새로운 문제의 난이도는 보통, 중간 수준으로 조절되어 모든 문제의 난이도가 정규분포에 가깝고 점수분포의 폭이 넓습니다.
과목별 점수 분포가 더 넓어지도록 문제 변별력을 개선합니다.
새로운 문제는 원래 시험과 내용이 동일합니다.
테스트 과정
테스트 환경
온도, 빛, 소리, 공간 크기 등은 응답 시 피험자의 심리 상태에 영향을 미쳐 시험 점수를 불안정하게 만들고 신뢰도에 영향을 미칩니다.
예상치 못한 중단: 정전, 질병, 용지 인쇄 오류
표준화 개선: 테스트 매뉴얼의 요구 사항에 따라 테스트 사이트를 배치하여 소음, 온도 및 피험자의 심리에 영향을 미칠 수 있는 기타 요소를 제어하는 등 관련 없는 요소의 간섭을 줄입니다.
테스트 간격
시험간격이 짧으면 연습효과와 피로효과가 있을 수 있고, 너무 길면 시험-재시험 신뢰도, 안정성, 동등계수 측면에서 피험자의 행동특성이 크게 변화할 수 있다. 간격이 클수록 신뢰도가 높아집니다.
오류 원인 제어, 표준화
무작위 오류를 제어하고 신뢰성을 향상시키는 방법 - 간략한 요약
위의 모든 영향 요인을 표준화합니다. 자세한 내용은 위의 "표준화 개선 사항"을 참조하세요.
테스트 항목 수를 적절하게 늘립니다.
요인분석(동질성) 및 판별분석(차별성) 전체 간격을 넓히다
대조시험 항목 난이도 - 적정
적절한 주제 그룹 선택 - 대표
약점 수정 - 제어 오류
타당성
정의
리터럴 정의
테스트 또는 척도(테스트 도구)가 측정하려는 심리적 특성 또는 행동 특성(타당성, 정확성, 유용성)을 실제로 측정할 수 있는 효과 및 정도
공식 정의
테스트 점수 집합에서 실제 점수와 관련된 실제 변형 Sv² 대 전체 변형 Sx², r²xy 또는 V의 비율은 유효성을 나타내고, rxy는 유효성 계수, r²xy= Sv²/Sx²를 나타냅니다.
효과
타당성은 측정의 무작위 오류 E와 체계적 오류 I를 포괄적으로 반영합니다.
타당도는 상대적인 개념입니다. 측정의 특정 목적에 따라 측정은 어느 정도의 정확도만 달성할 수 있습니다.
시험 점수와 기준 점수가 선형 관계에 있는 경우, 선형 회귀 지식을 활용하여 시험 점수를 통해 기준 점수를 예측할 수 있습니다.
타당성과 신뢰성의 관계
높은 측정 신뢰도는 높은 타당성을 위한 필요조건이지만 충분조건은 아닙니다.
수식을 사용하여 설명 X 관찰 점수 = T(실제 점수) E(무작위 오류) =V(실험적 처리) I(시스템 오류) E Sx²= Sv² Si² Se²
rxx= St²/Sx²= (Sv² SI²)/Sx²
V=r²xy= Sv²/Sx²
rxx> r²xy(V)
rxx= St²/Sx²= (Sx²-Se²)/Sx²=1-Se²/Sx² 신뢰성은 무작위 오류 E로 인해 발생합니다.
타당성은 무작위 오류 E와 체계적 오류 I에 의해 발생합니다.
타당도가 높다는 것은 신뢰도가 높다는 것을 의미하며, 신뢰성이 높다고 해서 반드시 타당도가 높다는 의미는 아닙니다.
유효성 유형
내용 타당성
정의
시험에서 실제로 측정한 내용과 측정하려는 내용이 일치하는 정도를 말한다(예: 347 대학원 입시 vs 시험요강).
특징
측정 동작의 내용이 명확하고 샘플링이 대표적입니다.
적당한 무게
이용 약관
모든 테스트 항목이 이 범위에 속하도록 범위를 설정해야 합니다.
손해보험 항목은 외부적으로 결정된 내용 범위의 대표적인 표본입니다.
해당 가능
특정 속성에 대한 테스트, 학력검사, 진로검사(선발 및 분류) 등
적성검사, 인성검사에는 적합하지 않음(추상)
결정 방법
논리적 분석방법(전문가 평가방법)
명확한 범위
양방향 분석 시트 준비
예: OK: 후보자 요구 사항 칼럼 : 후보자 심사 내용
평가 척도 개발
일반적인 방법
Bach-Cron 방법(알파계수 방법)
동일한 내용을 측정하는 두 개의 병렬 테스트 점수 집합 간의 상관 관계를 찾습니다(복제 신뢰도).
테스트-재테스트 방법
시험-재시험법이라고도 하며, 특정 지식을 학습하기 전과 후에 동일한 시험을 치르는 것을 말하며, 사전 시험보다 사후 시험이 좋을수록 내용타당도가 높다.
경험적 방법
다양한 피험자 그룹은 시험 점수와 각 질문에 대한 응답이 달랐습니다.
예: 일반적으로 성적이 높을수록 성적이 높을수록 성취도가 높다고 생각됩니다.
내용 타당성과 얼굴 타당성의 관계
안면 타당성의 정의
표면적으로 특정 인물에 대한 일반인의 테스트는 특정 심리적 특성을 측정하는 현상처럼 보입니다.
얼굴 타당성은 피험자의 동기에 영향을 미치고 간접적으로 테스트의 타당성에 영향을 미칩니다.
성취도 테스트는 피험자가 강한 동기를 갖도록 높은 표면 타당성을 요구합니다. 그렇지 않으면 피험자는 불신할 것입니다. 성격 테스트는 낮은 표면 타당성을 요구합니다. 그렇지 않으면 피험자는 속임수를 쓰게 됩니다.
타당성을 구성하다 타당성을 구성하다
정의
이는 시험이 측정하고자 하는 이론적 구조와 특성을 실제로 측정하는 정도를 말하며, 시험 점수가 심리학 이론의 특정 구조나 특성을 설명할 수 있는 정도를 말합니다. 실험과 이론을 기반으로 합니다.
특징
구성 타당도의 크기는 사전에 가정된 심리적 특성 이론에 따라 달라집니다.
경험적 자료가 이론을 확증하지 못한다고 해서 반드시 구성타당도가 높지 않다는 의미는 아니지만 이론적 가정이 타당하지 않다는 의미일 수도 있다.
구조적 타당성은 측정 내용의 선택을 누적하여 결정되는데, 즉 하나의 구성에 대해서는 여러 개의 가설이 있을 수 있으므로 단일한 정량적 지표 구성 타당성을 갖는 것은 불가능하다.
해당 가능
추상적인 개념 퀴즈 지능검사, 성격검사, 자기효능감 검사 등
일반 단계
이론적 가설 제안
이론적 틀을 바탕으로 시험 점수에 대한 가설 도출
가설을 테스트하기 위해 논리적이고 경험적인 방법을 사용하십시오.
구체적인 방법
퀴즈 속에서 증거를 찾아보세요
내용 타당성
균질성 신뢰성
내용타당성을 검토하고 분석한다. 질문에 답하고 동질성 신뢰도를 계산하는 과정
퀴즈 사이에 증거 찾기
호환 타당성 방법
새로 작성된 테스트와 적합성 측정에 효과적이라고 알려진 기존 테스트 간의 상관관계를 찾습니다. 상관관계가 높으면 내용 타당도가 높은 것입니다. 즉, 기존 테스트와 새 테스트 간의 상관 관계를 찾습니다.
판별 타당성
새로 작성된 테스트와 다양한 특성을 측정하는 데 효과적이라고 알려진 이전 테스트 간의 상관 관계를 찾으십시오. 상관 관계가 높으면 내용 타당성이 높지 않습니다.
여러 테스트 간의 상관 관계 정도
경험적 타당성 방법
사람들을 유효성 기준에 따라 두 범주로 나누고 점수의 차이를 조사합니다. 점수에 따라 사람들을 상위 그룹과 하위 그룹으로 나누어 유효성 기준의 차이를 조사합니다. 차이가 유의하면 구성 타당도가 높습니다. - 행동 상태를 검사합니다.
다중 특성 - 다중 방법 매트릭스 방법
호환타당도와 판별타당도의 종합적 적용 -MTMM
수렴타당성-동질차분법
동일한 특성을 측정하는 다양한 테스트 상관 계수가 높을수록 적합성 타당성이 높아집니다.
예: 자기 보고 및 투영을 사용하여 성격 내향성 측정
판별 타당성 - 동일한 방법이지만 동질적이지 않음
유사성 테스트는 다양한 특성을 측정합니다. 상관계수가 낮으면 판별타당도가 높다.
예: 피험자의 외향성과 책임감을 측정하기 위해 자기 보고 척도를 사용합니다.
보충: 유사성 테스트는 유사한 특성을 측정합니다. 상관 계수가 높을수록 신뢰도가 높아집니다.
요인 분석
적은 수의 차원 축소 작업으로 대량의 관찰 데이터를 요약합니다.
CFA 확증요인 분석 확인적 요인 분석
여러 차원을 알고, 테스트하고, 결과를 얻으세요. 해당 치수가 올바른지 확인하세요.
EFA 탐색적 요인 분석 탐색적 요인 분석
몇 가지 차원을 미리 알지 못하더라도 살펴보겠습니다.
경험적 타당성(기준 관련 타당성) 기준 연계 효과
정의
테스트 쌍이 특정 상황에 있음 개인 행동 추정의 효율성
실제 결과를 테스트 표준으로 삼음
예: 대학원 시험 선발, 시험은 시험이며 기준은 과학 연구 능력입니다. 과학 연구 능력이 높다는 것은 효율성 기준이 높다는 것을 의미합니다.
효능기준
타당도 기준이란 추정되는 행동을 말하며 타당성을 검정하기 위한 기준이자 검정의 타당성을 측정하기 위한 외부 기준이다.
효능기준 오염
피험자의 시험 점수를 아는 것에 영향을 받음 효과적인 점수를 평가하기 위해
선정기준
상관관계
유효성 기준은 현재 평가되고 있는 것과 관련된 것입니다.
유효성
기준과 그것이 나타내는 특성 사이에는 높은 수준의 일관성이 있습니다.
오염 없음
기준 측정은 평가되는 측정을 기반으로 하지 않습니다.
객관성
유효성 기준은 주관적인 경험을 바탕으로 평가되므로, 그러니 주관적인 편견을 피하세요
실용적인 사항
실효성 확보를 전제로, 최대한 간단하고 시간을 절약하며 작동 가능하게 만드세요.
특징
독립적으로 존재하고 객관적으로 관련된 행동 특성
일반적으로 사용되는 표준
학업 성취도, 평가, 임상 진단, 전문 교육 결과, 실무 수행 능력, 그룹 간 구별 능력, 기타 쉽게 이용 가능하고 유효한 테스트
해당 가능
인사 선발 등 결과 예측
경험적 타당성의 범주
동시 타당도
기준 데이터와 시험 점수가 동시에 수집됩니다.
진단상태
예측 타당성
먼저 테스트를 받아본 후, 테스트 점수에 따라 유효성 기준을 결정합니다.
미래를 추측해 보세요
결정 방법
명확한 컨셉 표준
효능 표준 측정 결정
측정 점수와 기준 측정 간의 관계를 조사합니다.
구체적인 방법
관련법률
시험 점수와 기준 측정 간의 상관 계수 누적차이 관련, 등급관련
구별
역추적 T 테스트
피험자들은 먼저 시험을 치르고 일정 기간 동안 일을 한 후 업무 성과에 따라 그룹을 나누어 분석하고 이전 시험 점수와 비교하면 타당성이 높다. .
공과금 방식
기업의 비용 및 이익 측정
기대표 방법
예측점수와 기준점수를 이용하여 2차원 차트를 만들고, 각 변수를 수준에 따라 여러 수준으로 나눈 후, 각 수준에 속한 사람들의 비율을 예시하고, 표에서 기준타당도 수준을 확인한다.
적중률 방식
시험 점수 및 기준 해석
시험 점수
높은 점수(성공)
낮은 점수(실패)
효능기준
높은 에너지 (성공)
바보 (실패)
결과 우리는 높은 점수를 원하지만 낮은 점수는 원하지 않습니다. 더 높은 점수를 선택한 후 성능이 일치하는지 확인하세요.
높은 점수와 높은 에너지 = 올바른 수용(A)
높은 점수와 낮은 능력 = 잘못된 수용 (B)
설명 : 점수가 높은 사람을 채용했는데, 과학 연구 능력이 낮아 허위 보고를 한 것입니다.
낮은 점수와 높은 능력 = 거짓 거절 (C)
설명: 점수가 높은 사람은 강력한 과학 연구 능력을 가지고 있습니다. 하지만 우리는 거절했고, 재능을 놓쳤고, 보고도 놓쳤습니다.
낮은 점수와 낮은 에너지 = 올바른 거부(D)
긍정적인 적중률
원하는 것 = 고득점
A/(A B)
마이너스 적중률
원하지 않는 것을 원하지 않음 = 낮은 점수를 받음
D/(CD D)
총 적중률
올바르게 선택됨/총 인원수
(A D)/(A B C D)
기본 요금
고에너지/총인원
(A C)/(A B C D)
감광도
고에너지 부문에서 높은 점수를 받은 비율
A/(AC)
확인
에너지가 낮은 학생의 낮은 점수 비율
D/(B D)
타당성에 영향을 미치는 요인
측정되는 심리적 특성 자체의 특성
관련 연구가 충분히 심층적이지 않음
개념이 명확하게 정의되어 있지 않습니다.
측정 도구 구조가 불안정합니다.
측정 도구를 구축하는 과정
심리적 특성의 정의
측정 문항 수집, 사전 테스트, 문제 분석 및 심사, 테스트 품질 분석, 문제 조정, 정식 테스트
체계적인 편견을 피하기 위한 표준화
측정 도구 자체의 신뢰성
신뢰성은 타당도의 필요조건입니다. 측정 도구는 불안정하며 신뢰성에 영향을 미칠 경우 타당성을 보장할 수 없습니다.
타당성 검증 대상군
동일한 측정 도구라도 측정 대상의 특성이 다르기 때문에 심리적 특성 구조가 다를 수 있습니다.
과목군이 이질적일수록 점수 분포 범위가 넓어지고 신뢰도와 타당도가 높아집니다.
효과적인 목표의 선택
측정 도구의 예측 능력을 검증할 때 기준 자체의 신뢰성과 타당성은 매우 중요합니다.
다른 요인
주요 심사 측면
지침을 따르지 않거나 채점 시 오류가 발생하면 유효성이 감소합니다.
과목
개인의 신체적, 정신적 상태, 집단의 동질성, 필요한 동질성
측정 도구
샘플에 예측된 내용 및 구조의 대표성이 부족합니다.
불분명한 지침, 불분명한 질문 의미, 너무 높거나 너무 낮은 난이도는 타당성을 감소시키며 테스트 기간은 적절합니다.
테스트 과정
예상치 못한 간섭, 환경, 물리적 요인
개선 방법
표준화
주요 심사 측면
테스트 프로세스를 엄격하게 구현하고 평가자는 표준에 따라 엄격하게 점수를 부여합니다.
과목
샘플링은 대표적이고 동질적이며 피험자가 정상적인 수준에서 수행할 수 있도록 표준 시험 응시 상황이 만들어집니다.
측정 도구
큰 체계적 오류를 방지하기 위해 테스트 척도를 주의 깊게 준비하십시오.
테스트 과정
테스트를 적절하게 구성하고 무작위 오류를 제어하세요.
다른 측면
테스트 신뢰성 보장
올바른 벤치마크를 선택하세요
적절한 효능 표준 측정 설정
관련 수식의 올바른 사용
어려움
정의
난이도는 프로젝트의 난이도를 말하며, 일반적으로 합격률 P로 표시됩니다.
난이도 분석은 주로 특정 항목에 올바르게 답할 수 있는 인구 집단의 비율을 나타내는 상위 행동 테스트에 사용됩니다.
응답률-전형적 행동 테스트
계산 방법 및 공식
채점방식
이 주제에 대한 모든 과목의 평균 점수는 문제의 전체 점수에 대한 백분율이며 공식은 다음과 같습니다.
Pi(0, 1) 값은 0, 1 채점 질문에 적합합니다.
극단적인 그룹화 방법(0,1) 점수 매기기 채점 및 비(0,1) 모두 수행 가능
피험자들은 총 시험 점수에 따라 상위 그룹과 하위 그룹으로 나뉘었습니다. 문제의 난이도는 두 그룹의 평균 득점률을 사용합니다.
피험자가 많을 경우에는 상위 27%와 하위 27%를 세 그룹으로 나누어 최종적으로 두 그룹의 평균 득점률을 다음과 같이 계산한다. 아이템의 난이도.
공식
P= (PH PL)/2= (RH/NH RL/NL)/2
PH와 PL은 각각 상위그룹과 하위그룹의 합격률을 나타냅니다. RH와 RL은 각각 높은 그룹과 낮은 그룹의 정답 수를 나타냅니다. NH와 NL은 각각 상위 그룹과 하위 그룹의 총 인원 수를 나타냅니다.
사람이 적다 - P=R/N, R은 정답 수, N은 전체 과목 수
(0,1) 점수
비이분법적 채점 프로젝트의 공식
P 값이 작을수록 난이도가 높아집니다.
합리적인 난이도 배분 및 제어
난이도 분포가 테스트에 미치는 영향
난이도가 시험 점수 분포 형태에 미치는 영향
시험이 너무 어렵고 점수 분포가 긍정적으로 편향되어 있습니다.
영어대회 등 전형시험에 적합
시험이 너무 쉬웠고 점수 분포가 부정적으로 치우쳐 있었습니다.
고등학교 입시 등 표준 시험에 적합
난이도 보통, 점수 분포는 정규 분포입니다. (피험자의 표본은 대표성임)
난이도 대 시험 점수 분산 및 신뢰성
난이도가 너무 어렵고, 점수가 하위권에 집중되어 있고, 전체 범위가 작고, 신뢰도가 낮습니다.
난이도가 너무 쉬우며, 점수가 상위권에 집중되어 있고, 전체 범위가 작고, 신뢰도가 낮습니다.
난이도는 0.5 부근에 집중되는 것이 가장 좋습니다. 점수 분포 범위가 넓고, 전체 범위가 크고, 신뢰도가 높습니다.
난이도가 시험 차별에 미치는 영향
평균 난이도는 0.5로 모든 레벨의 사람들을 구별할 수 있습니다.
어려움은 먹이사슬의 최상위에 있다
P=0, 어려움, 식별 D=0, 전체 범위 좁음, 양의 바이어스, rxx는 작고 r²xy는 작습니다.
바닥 효과
P=1, 쉬움, 식별 D=0, 전체 범위 좁음, 음의 바이어스, rxx는 작고, r²xy는 작습니다.
천장 효과
P=0.5, 중간, 식별 D=1, 전체 범위, 정규 분포, rxx는 크고, r²xy는 큽니다.
난이도 결정은 다음에 따라 달라집니다. 시험의 목적/문항 형식/시험의 성격 만점의 의미가 불분명하므로 만점을 피하세요.
규범 참조 시험의 경우 합리적인 문항 난이도는 0.5 정도이고 분포 범위는 (0.3~0.7) 사이에서 조절되어야 합니다. 0.3은 고급 학생에게 적합하고 0.7은 고급 학생에게 적합합니다(이론적으로는 시험 문제의 난이도는 0.5/-0.2로 조절되어야 합니다.
기준 참조 테스트 - 난이도 테스트가 필요하지 않습니다. 과목이 숙달되었는지 여부를 테스트하는 데 사용되기 때문에
선택시험의 경우 대학원 입시, 공립 입시 등 입학률에 따라 난이도를 조절한다.
객관식 문제 난이도, 난이도 > 추측률
속도 테스트의 난이도는 너무 높지 않아야 하며, 각 항목의 난이도는 기본적으로 동일해야 합니다.
합리적인 난이도 분포 제어
문제의 난이도 조절
질문 평가에서 지식 포인트를 암기하는 기능을 제어합니다. 문제의 난이도를 조절할 수 있는 수준
시험지의 난이도 분포 제어
문제의 난이도 조절을 전제로, 요구되는 난이도 분포를 달성하기 위해 다양한 난이도의 문제 비율을 조절합니다.
객관식 문제에 대한 추측 수정
추측 수정의 목적은 추측으로 인해 특정 질문에 올바르게 답할 가능성을 제거하여 합격률을 높이는 것입니다.
특정 항목 수에 대한 전체 과목의 합격률 수정
CP=KP-1/K-1
CP 수정 후 합격률, K 옵션 수, P 합격률
피험자는 여러 항목으로 구성된 시험을 봅니다. 시험 점수 정정
S=R-(W/K-1)
S는 수정된 점수, R은 정답 항목, W는 오답이 있는 항목입니다.
구별
정의
D로 표현되는 피험자의 특성 차이를 구별하는 질문의 능력
분류
D>0, 긍정적 구별, 높은 점수는 높은 에너지, 낮은 점수는 낮은 에너지
D<0, 음의 구별, 높은 점수는 낮은 에너지, 낮은 점수는 높은 에너지
D=0, 구별 없음, 구별 없음
계산방법
상관계수법
기본 아이디어
문제의 변별력이 좋으면 능력이 높으면 항상 높은 점수를 받고, 능력이 낮으면 항상 낮은 점수를 받습니다.
기본 가정(모든 질문과 관련됨)
문항점수와 기준점수의 상관관계는 문항 변별력의 지표로 사용되며, 상관관계가 클수록 변별력이 크다.
두 가지 계산 방법
점 2열 상관관계
(0,1) 점수, 진정한 이분형 변수에 적합, 객관식 질문, 참 또는 거짓 질문
이중 열 상관
(0,1) 스코어링, 연속변수의 두 열에 적용 가능, 하나의 열을 인위적으로 두 범주로 나눔
제품 차이 상관관계
문항의 총점이 이분법적이지 않은 채점 관련 연구에 적용 가능
주관적인 질문
품목 식별 지수 방법
D=PH-PL
분산 방법
특정 항목에 대한 피험자의 점수가 분산되어 있고 분산이 클수록 시험 문제의 변별력이 커집니다.
에벨-이벨 표시기
D>0.4
훌륭한
D=0.3-0.39
좋아요 수정하고 나면 더 좋아질 것 같아요
D=0.2-0.29
알겠습니다. 수정이 필요합니다
D<0.19
불량하다, 없애야 한다
차별에 영향을 미치는 요인
질문 난이도
너무 어렵거나 너무 어려운 질문은 해당 질문에 대한 피험자의 점수에 거의 또는 전혀 차이가 없게 됩니다. 즉, 차별의 정도가 작습니다.
주제 그룹의 동질성
과목이 동질적일수록 수준과 점수가 더 가까워집니다. 차이가 작을수록 차별은 낮아진다
각 시험 문제로 측정된 심리적 특성의 일관성
일치하지 않는 경우 총 시험 점수는 능력이 높거나 낮은 사람을 대신하는 기준으로 사용됩니다. 가정은 유효하지 않으며 차별 정도도 낮습니다.
질문 자체의 표현과 내용 품질
질문에 대한 설명의 차이, 질문의 의미가 불분명한 경우, 잘못된 답변으로 인해 질문의 차별성이 감소됩니다.
차별 개선 - 차별평가 표준화
문제의 난이도를 조절하세요
질문에 의해 측정된 심리적 특성이 다음과 일치하는지 확인하십시오. 모든 테스트에서 심리적 특성의 일관성 = 동질성
질문의 언어는 정확하고 표준화되어 있으며, 질문 줄기와 답변 사이에 모호함이 없습니다.
옵션 분석을 통해 제공된 정보를 사용하여 잘못된 옵션 수정
난이도 = (0.3-0.7)
차별=에벨지수