어떤 테스트가 최소한 그들의 가능한 점수 범위입니다. Cisco's300-1000 점 범위,그리고 토's200-800 점당 섹션 범위에 와서 마음입니다.
어떤 목적이 봉사하는가? 나는 가정이 일부 통계적 논리합니다. 어쩌면 그것은 더 이해하는 경우 나 이해하는 방법들을 계산하는 방법에 대한 점수를 주어진 숫자의(에서)올바른 질문이 있습니다.
에 따라백과사전 연구 디자인(페이지629),그것은 신호를 하는 이들은 간격 변수,지 비율 변수:
는 표준화된 테스트를 포함하여 지능 지수(IQ),학업 성취도 시험(토),대학원을 기록 검사(GRE),영 대학원 입학 테스트(GMAT),그리고 밀러 비유 테스트(MAT)도 예의 간격으로 규모입니다. 예를 들어,IQ 규모 사이에 차이가 150 160 하는 것과 동일 사이 80 90. 마찬가지로,거리에서는 sat 점수 350 400 와 같은 거리를 사이 500 550.
는 표준화된 테스트를 기반으로 하지 않"진정한 제"점을 나타내는 정보의 부족. 이러한 표준화된 테스트를 수행되지 않도로 점이다. 가능한 가장 낮은 점수에 대한 이러한 표준화된 테스트가 없습니다. 의 부족 때문에 a"진정한 제"점,표준화 된 테스트를 만들 수 없습에 대한 진술의 비율이 그들의 점수가 있습니다. 사람들 IQ score of150 지로 두 번이 지능형으로 사람들이 있 IQ 점수의 75. 마찬가지로,이러한 비용을 적용할 수 없이 다른 표준화된 테스트를 포함하여 SAT,GRE,GMAT,또는 매트입니다.
Salkind,Neil J.,ed. 백과사전 연구의 설계. Vol. 1. Sage,2010.
내가 도움을 줄 수 있습니다 이 대답에서 배경측정이론. 제가 작업하고 우리는 많은 생산 검사는 모든 표준화한 다음 동일시에 넣어 같은 규모입니다. 이러한 스케일 그러나,하나의 테스트를,또는 unrelateble 지 않는 한의 코스는 두 개의 서로 다른 테스트는 비교 연구를 완료를 확인 변화 요소를 전송하려면 규모에서 말하는 테스트 1 위 규모의 테스트 2.
을 구성하는 가늠자,우리는 먼저한 분석 테스트 데이터를,그래서 학생들의 반응과 데이터 항목(는 질문)데이터. 우리가 사용하여 분석을 수행합 Rasch 모델만으로 계정을 두 변수,학생들이'능력과 항목이'어려움이 있습니다. 이것은 우리를 구성하는 데이터 집합을 포함하는 로짓 레벨의 학생'능력과 항목이'어려움이 있습니다.
의 정의는 로짓:
는 로짓은 측정 단위를 보고 상대적인 차이가 난 후 견적 능력과 항목에 어려움이 있습니다. Logits 은 간격 동등한 수준의 측정,즉 사이의 거리에 스케일과 동일(1-2=99-100).
면 로짓 테이블을 생성할 수 있을 만드는 데 사용되는 스케일을 적용하여 간단한 선형 변환과 같은:
점수=10*로짓는 어려움+250
에서 작업의 일부가 우리가 규모의 점수는 실제로는 아래 0,그러나 대부분의 작업 할,확장 점수는 건설하는 최소한 200 니다. 건설 규모의 대부분에 완전히 임의로 지정되었습니다.
려면 어떻게 logits 의 학생들과 항목은 계산 읽어 보시기 바랍니다:
또한 추가 참고:수 있는 다른 모델을 하기를 위한 테스트와 같은 분석 2PL(을 소개하는 추가적인 매개 변수를 Rasch 모델(1PL),항목 차별)에 3PL(을 소개하는 추가적인 매개변수를 2PL 는 추적 요인이 만드는 최소한의 확률을 받고 잘못된 항목에 따라 다름을 추측한 값),도 4PL 는 추가적인 매개변수(paremeter 를 미끄러짐,을 만드는 천장,확률지 않는 1, 을 얻기 위해 올바른 항목).
도움이 되기를 바랍니다 제공하는 몇 가지 추가 정보를 사용 될 수 있습니다.
이에 따라 달라질 수 있습니다.
-정답은 점수를 증가시킬로점 -빈 답변도 적립하도 잃게 포인트 -잘못된 응답을 줄여 점수를 일부 지점입니다.
를 선택하여 적절한 부분에 대한 처벌이 있는지 확인할 수 있습니다 추측로 예상되는 값입니다. 그러나지 않는 한,오프셋을 추가,과목 수 있는 잠재적으로 받는 점수를 아래로 수행할 경우 보다 더 기회입니다. 이러한 매우 낮은 결과할 수 없습 특히 유익하고,그래서 아마도 ETS 보고서 뭔가 다음과 같 max(취득 점수를,기회).