Psychometrics
Psychometrics
Wikipedia에서, 자유로운 백과사전
Psychometrics은 지견, 능력, 태도, 및
개성 특색의 측량을 포함하는 교육과
심리학 측량의 이론 그리고 기술에 관계하는
학문의 분야 이다. 분야는 개인과 개인의
그룹사이 다름의 학문에 1 차로 관계한다.
그것은 2개의 중요한 연구 업무를,
관련시킨다 즉: (i) 측량을 위해 계기
그리고 절차의 건축; 그리고 (ii) 측량에
이론 접근의 발달 그리고 세렬.
원천과 배경
정보를 측정하기
위하여psychometrics안에 이른 이론과 적용되는 일의
다량은 착수했다.
FrancisGalton은psychometrics의 아버지로 수시로,
알려지고 이용한 지능 검사 고안한.
그런데,psychometrics의 원천에는 또한 정신
물리학의 관계있는 분야에 연결이 있는다.
찰리 창병,WilhelmWundt의 밑에 공부된
정보의 측량에 접근을 개발하고 정신
물리학안에 훈련된psychometrics안에 개척자.
늦게 측량에 이론 접근이라고 개발되고
적용된psychometricianL.L.Thurstone은 비교
판단의
법률,ErnstHeinrichWeber과GustavFechner에의해
개발되는 정신물리학 이론에 가까운 연결이
있는 접근에는으로를 가리켰다. 더하여,
양쪽 창병과Thurstone은 인자
분석,psychometrics안에 광대하게 개발되고
사용된 통계적인 방법의 이론 그리고 응용에
중요한 기여금을 기여했다.
최근에, 심리 측정 이론은 개성, 태도 및
신념 의 학업 성과의 측량
그리고health-related분야안에 적용되었다. 이
현상의 측량은 곤란하, 적당하게 그런
현상을 정의하, 양을 재기 위하여 이 분야안에
연구 그리고 축적된 예술의 다량은
개발되었다. 그런 정의 및 정량화가
불가능하게 곤란한 것, 그리고 그런 측량이
수시로 오용되는 것과 비평가는, 물리학안에
개업자 및 사회적인 행동주의자를 포함하여,
변론했다. 오용한다, 그리고 또한 고
물리학안에 각종 양이 많은 현상, 열과 힘 것
을 그들의 비평가는 심리 측정 표준을
적용하서 수시로 데이터를 고, 직접적으로
관측되어도 않않 그러나 그들 표현에서
추정되어야 해도 이긴 하지만, 심리 측정 기술의
제안자는 회답할 수 있는다.
주psychometrics에 획기적인
공헌에KarlPearson,L.L.Thurstone,GeorgRasch,
존슨O'Connor,FrederickM.및 아서Jensen을 포함한
숫자.
사회 과학안에 측량의 정의
사회 과학안에 측량의 정의에는
오래된 병력이 있는다.
Stanley스미스Stevens(1946년)이 제시하는 현재
대폭적인 정의는, 측량이 "객체에 숫자 어떤
규칙에 따르면 사건의 지정" 이다 고 이다. 이
정의는Stevens이 측량의 4개 수준을 제시한
종이안에 도입되었다. 넓게 채택해, 이
정의는 물리학을 통하여 채택되는 또 다른
한개에 관하여 저 측량 이는 1개 양의 크기의 수
의견 그리고 표정 이는 측량의 더 고아한 정의와
중요한 존경안에 틀린다, (Michell1997년).
참으로,Stevens측량의 정의는 그의
의자A.Ferguson을 물리학자가 이던Ferguson영국
위원회에 응하여 제안되었다. 양이 많게
감각 사건을 견적하기의 가능성을 수사하기
위하여 위원회는 과학의 전진을 위해 영국
협회에의해1932년에 임명되었다. 그것의
의자 및 다른 일원이 물리학자 이었, 위원회는
또한 몇 심리학자를 함유했다. 위원회
보고는 측량의 정의의 중요성을 강조했다.
Stevens응답이 분야안에 상당한 영향이
있은 새로운 정의에는 제시하는 동안, 이것은
절대로 안되는 보고에 유일한 응답 이었다. 또
다른 한개는, 저명하게 달랐던, 응답 뒤에 오는
계산서안에 반영되는것과 같이 고아한
정의를, 받아들이는 이었다:
"심리학안에 측량과 물리학은 의미 없
다르지 않다. 필요한 표준에 부합할 수
있는 작동을 발견할 수 있을 때 물리학자는
측정할 수 있는다; 심리학자는 그러나
동일물을 하기 위하여 있는다. 그들은 2개의
과학안에 측량의 의미사이 신비한 다름에 관하여
고민한것을 필요로 하지 않는다."
(Reese1943년,p.49은)
이 갈라지는 응답은 측량에 양자
택일 접근안에 대부분은 반영된다. 예를
들면, 공분산 행렬에 기초를 두는 방법은
평가에서 파생되는 익지않는 점수같은
수가, 측량 이는 전제에 전형적으로
채택한다. 그런 접근은
절대적으로Stevens단 수는 어떤 규칙에 따르면
할당되는 것을 요구하는 측량의 정의를
수반한다. 주요한 연구 업무는, 그때,
점수사이 협회 그리고 그런 협회를 밑에 있기
위하여 가정되는 요인의 발견 것 일반적으로
여긴다. 이와 반대로, 측량이Rasch모형
만들l 때, 수 할당하지 않는다 규칙에 기초를
둬 고용된다. 의 위에의 대신,Reese's계산서와
일치되어, 측량을 위해 명확한 표준은
진술되고, 목적은 타당한 표준에 부합하는
데이터를 제공하는 작동 또는 절차을
건설하는 이다. 계속 타당한 표준에
부합하는것은 측량은 모형에 기초를 뒀다
견적되고, 가능하다 판명하기 위하여 시험은
시행한다.
계기와 절차
정보의 개념을 측정하기 위하여
첫번째 심리 측정 계기는 디자인되었다.
AlfredBinet잘 있있던 역사적인 접근은
프랑스 심리학자가 원래 개발하는
스탠포드binetIQ시험을 관련시킨다.
경험에 의하여 타고 나는 배우는 수용량의
감안에 그런 계기를 통해서 타고 나는 정보를,
측정하는것은 공정하게 대폭적인 오해에
반대는, 거기서 그들이 개발될 때 가능하다, 도
아니다 이것이 원래 기도 이었다 고 강력한 증거.
역시,IQ시험은 각종 목적을 위해 유용한
공구 이다. 정보의 양자택일 개념작용은,
또는 일반적인 정보 요인, 개인안에 인식
수용량이 일반적인 분대의 표현 이다 고 이다 준
도메인에 인식 수용량 특성아울러.
Psychometrics은 독서, 쓰기, 및 수학 도메인안에
측정 능력에 교육 평가안에 넓게
적용된다. 이 도메인안에 시험을
적용하기안에 주요한 접근은 고아한 시험 이론 및
현대 품목 응답 이론과Rasch측량 계속
모형 이다. 이 현대 접근은 개발 연속체의
지도로 나타내기를 위해 연속체에 따라서 각종
점에 보이는 특기의 묘사를 허용해서 기초를
제공하는 사람과 평가 품목의 합동
스케일링을 허가한다. 그런 접근은 각종
도메인안에 개발 성장의 성격대하여 강력한
정보를 제공한다.
psychometrics안에 다른 중요한 초점은 개성
시험에 있었다. 개념화하고 측정 개성에
이론 접근의 범위 계속 있는다. 더 잘
알려지는 계기의 어떤은 미네소타Multiphasic개성
재고목록 및 M여rsMyers-Briggs유형 지시자를
포함한다. 태도는psychometrics안에 또한
광대하게 공부되었다. 태도의 측량에
일반적인 접근은Likert가늠자의 사용 이다.
양자 택일 접근은 전개 측량 모형의
응용응용, 일반적인 과장되는 여현 모형
이다을것을 관련시킨다 (Andrich&Luo1993년).
이론 접근
심리 측정 이론은 몇 명료한
학문 분야를 관련시킨다.
첫째로,psychometricians은 이 시험에서 모으는
데이터의 지능 검사 그리고 분석의 발달안에
이용하는 이론의 큰 몸을 개발했다. 이 일은
고아한 시험 이론 (CTT) 및 최근 품목 응답 이론
(IRT)으로 거칠게 분할될 수 있는다. 접근
이 유사하 에irt그러나 또한 확실히 특유하, 의
점에서 그것의 원천 그리고 특징, 이 대표하 에
의하여 r앗ch 모형 를 위해 측량.
Rasch모형의 발달, 및 속하는 모형의 더
넓은 종류는 물리학 (Rasch1960년)안에
측량의 필요조건에, 명백하게 발견했다.
둘째로,psychometricians은 상호 관계와
공분산의 큰 모체를 사용하기를 위해 방법을
개발했다. 이 일반적인 전통안에 기술은
인자 분석을 포함한다. 각종 인자 분석안에
주요한 부족의 한개은 절단 점의 부족 이다.
원래 구체가 긴축하기 때문에 고유치가
것의 밑에 떨어질 때 흔한 절차는 인수 분해
멈춘것을 이다. 절단 점의 부족도 다른
다변량 방법을 도 관계한다. 바닥에, 심리
측정 공간은Hilbertian이다 그러나 데카르트 철학
처럼을 다룬다. 그런 까닭에, 문제는 이어
(데이터안에 중요한 근본적인 차원을
발견하는) 방법, (높 차원 데이터를 위해
간단한 대표를 발견하는) 다차원 스케일링
그리고 발견하는 데이터 이용한보다는 해석의 더
(서로같이 이는) 객체를 송이를 이르기. 이
다변량 기술적인 방법안에, 사용자는 다량
데이터를 간단하게 한것을 해본다. 최근에,
만들 경로 분석 구조상 방정식은 큰
공분산 행렬의 이 문제를 해결하기에 더
정교한 접근을 대표한다. 이 방법은
통계적으로 세련시킨 모형을 데이터에
적합하, 충분한 적합 이으면 결정하기 위하여
시험되는 둔다.
중요한 개념
고아한 시험 이론안에 중요한
전통적인 개념은 신뢰도와 타당성 이다.
측정하기 위하여 가정하는 것을 유효한
측정은 측정하고 있는 그러나, 견실한
측정은 무언가를 일관하 측정하고 있다.
견실한 측정은 유효함없이 일관할
필요하게 지도 모른다, 예를들면 부서지는
통치자가 동일 분량에 의하여 항상 양 의
밑에 측정 매번 일지모른는 처럼, 측량 계기
(일관하), 그러나 유래 양은 아직도 틀린다,i.e,
부당한. 다른 유례를 위해, 다발은 단단한
것 이다 유효한 것개은 표적의 센터의 주위에
그것의 다발을 중심에 두는 그러나, 견실할
소총은 표적안에 탄알의 단단할 다발을 비치할
것이다.
신뢰도와 타당성은 모두 수학으로 사정될
수 있는다. 내부 견실함은 시험 (쪼개 반
신뢰도)의 2개 반에 성과를 상관해서 사정될
수 있는다; Pearson제품 순간 상호 관계
계수의 가치는 창병 브라운 예측 공식에
2개의 전장 시험사이 상호 관계에 해당하기
위하여 조정한다. 다른 접근은 안 종류 상호
관계 (모든 표적의 차이에 준 표적의 측량의
차이의 비율)을 포함한다. 일반적으로 사용한
측정은Cronbach's? 이다, 모든 가능한 쪼개 반
계수의 평균과 동등한 까 어느것이.
동일한 측정 (기능 검사의 다른 양식,
예를 들면)의 다른 버전의 등가가 이다것과 같이,
안정성 정상은Pearson계수에 측정을
사정된다 반복했다. 다른 측정은 또한
사용된다.
타당성은 있있는 표준 측정과 측정을
상관해서 유효하기 위하여 사정될 수 있는다.
목표이라고 유효하게 할 측정이 동시
타당성을 설치할것을 이을 동시에 표준
측정이 모을 때; 표준이 늦게 모을 때
목표는 예언하는 타당성을 설치하는 이다.
이론의 요청대로 다른 가변에 관련시키면
측정에는 구조물 타당성이 있는다.
시험의 품목이 측정하는 도메인에서
당긴다 고 만족한 타당성은 간단하게 논증
이다. 인원 선택 보기안에, 시험 내용은 지견,
특기, 능력, 또는 작업 분석에서 얻는 다른
특성의 계산서의 정의된 계산서 또는
세트에 기초를 둔다.
예언하는 동시 타당성은 동일한 측정의
2개의 버전사이 상호 관계의 사각을 초과할.
품목 응답 이론은 시험 품목에 잠재성
특색과 응답사이 관계를 만들n다. 다른
이점사이에,IRT은 저 위치의 표준 측정 오차아울러
준 잠재성 특색에 시험 수취인의 위치의
견적을 얻기를 위해 기초를 제공한다. 예를
들면, 대학생 역사의 지견은 대학 시험에 그의
혹은 그녀의 점수에서 연역하, 보다 적게 곤란한
시험에서 연역되는 고등학교 학생 지견에
그때 견실하게 비교될 수 있는다. 점수는
고아한 시험 이론에 의하여 있지 않는다 이 특성을
파생하고, 실제적인 능력 (오히려 다른 시험
수취인에 관하여 능력)의 평가는 무작위로
인구에게서 선정되는 규범 그룹의 그들에
점수를 비교해서 사정되어야 한다. ,
원리안에, 품목 응답 이론에서 파생되는
그들은 그러나, 실제로, 고아한 시험 이론에서
파생되는 모든 측정은 시험되는 견본에
의존한다.
질의 기준
타당성과 신뢰도의 고려사항은
전형적으로 대로 어떤 시험의 질을 결정하기를
위해 근본적인 성분 전망된다. 그런데
기준을 개발하고 계속 준 문맥안에 어떤
시험의 질에 관n 전부 판단을 총괄하여 만들l
것이다 때, 전문가와 개업자 협회는 빈번하게 더
넓은 문맥안에 이 관심사를 둔다.
시험 기준
psychometrics의 분야, 시험 건축,
평가 및 문서 제시의 일반적인 화제의 밑에
그리고 관계있는 고려사항 측정 오차와 함께
타당성 그리고 신뢰도에 관하여 교육과 심리
테스트 장소 기준을 위해 기준안에. 제 2
중요한 화제는 무력으로, 시험 수취인의 시험
그리고 시험 사용, 다양한 언어 배경을 포함하여
시험안에 공정성에 관련시키는 기준을 및
시험 개인의 개인을 시험하는 권리 및 책임안에
공정성 충당한다. 제 3 의 그리고 마지막
중요한 화제는 시험 사용자의 책임을
포함하여 시험 응용, 고용안에 심리 테스트
그리고 평가, 교육 시험 그리고 평가, 시험
그리고, 프로그램 평가와 공중 질서안에
시험플러스credentialing에 관련시키는 기준을
충당한다.
평가 기준
평가의 분야, 및 특히 교육
평가안에, 교육 평가를 위해 기준에 양원
합동 위원회는 평가를 위해 기준의 3 세트를
간행했다. 인원 평가 기준은1988년에
간행되었다, 프로그램 평가 기준 (제 2
판)은1994년 및 학생에 간행되었다 평가
기준이2003년에 간행된.
각 간행물은 다양한 교육 조정안에
사용을 위해 기준의 세트 선물하고 정성들여
만들n다. 기준은 평가의 확인한 양식을
디자인하고기, 실행하고기, 사정하고기
개량하기를 위해 지침서를 제공한다.
적당하고, 유용하고, 가능하고, 정확한
교육 평가를 승진시키기 위하여 기준의
각자는 4개의 기본적인 종류의 한안에 두었다.
기준의 이 세트안에, 타당성과 신뢰도
고려사항은 정확도 화제의 밑에 충당된다.
예를 들면, 학생 정확도 기준은 학생
평가가 정확할 학생 배우기 그리고 성과에
관하여 소리, 그리고 신용할 수 있을 정보를
제공할 것을 지킨것을.


Post new comment