학위논문_ref

[Reference] A zero- and K-inflated mixture model for health questionnaire data

자유로운포도씨 2022. 12. 2. 16:29

Finkelman, M. D., Green, J. G., Gruber, M. J., & Zaslavsky, A. M. (2011). A zero- and K-inflated mixture model for health questionnaire data. Statistics in medicine, 30(9), 1028–1043. https://doi.org/10.1002/sim.4217

 

서론

- 잠재특성스펙트럼의 극단적 위치에 응답자의 상당 부분이 있는 경우가 있음. Zero-와 K-inflated Mixture Model은 이를 설명하기 위해 개발됨

- EM 알고리즘을 이용하여 양극단에서 모집단의 백분율을 추정하고, Graded component을 이용하여 분석

The model is fitted using an expectation-maximization (EM) algorithm to estimate the percentage of the population at each end of the continuum, concurrently analyzing the remaining “graded component” via IRT. 

 

- IRT분석에서 대부분 MML(Marginal Maximum Likelihood)를 사용

- 사전분포를 어떻게 가정하느냐에 따라 MML로 문항 모수를 추정할 때 정에 영향을 미칠 수 있음. EAP나 MAP 방법도 마찬가지로 능력모수 추정에 영향을 미칠 수 있고, 또한 CAT에서 문항 선택에 영향을 미칠 수 있음. 또한, 모두 동의하거나 모두 동의하지 않는 응답자의 finite latent trait estimates를 얻는 데 필요함.

The assumed prior distribution may impact results when estimating item parameters via MML. The prior can also affect estimated person parameters when using expected a posteriori (EAP) or maximum a posterior (MAP) estimates, as well as the selection of items for a computerized adaptive test. Moreover, the prior is actually necessary to obtain finite latent trait estimates when there are respondents who either agree or disagree with all of the items.

 

- Zero, K-inflated mixture model은 극단 응답자와 중간 응답자를 별도의 class로 분할한다는 점에서 이전의 혼합모델과 구분됨; 인구의 매우 특정집단에 적용될 수 있으며 매우 직관적이고 간결하며 적합함.

-교육적 맥락에서 완벽한 지식을 가지고 있거나, 그 과목에 대해 아얘 지식이 없는 학생을 찾는 것은 어려움. 반면, psychiatric 도구에서는 일반적임. 이러한 도구는 질병이 나타나는 것을 결정하는 컷포인트 주변에서 민감하도록 설계되었지만, 병을 가지고 있지 않은 개인의 isolated symptoms를 식별하는 것에는 관심이 없음

In educational contexts, it is unusual to find a student who has perfect knowledge or no knowledge of the subject; hence, zero scores and perfect scores are rare as long as the items adequately span the ability scale. On the other hand, it is common for psychiatric instruments to elicit response patterns with no or all items endorsed when applied to a general population in which prevalence of the disorder is low. These instruments are designed to be sensitive around the cutpoint determining whether the disorder is present (based on standard diagnostic criteria), but identifying isolated symptoms in individuals who do not have the disorder is of no scientific interest.

 

 적용- 혼합모델의 적합도를 반항장애(ODD), 품행장애 (CD) 증상 척도 데이터에 대한 IRT 모델의 적합도와 비교(n=6483)

 

- 반항장애 11문항, 8 criteria ; 부모 6483명중에 4335명이 none of the 8 criteria, 274명이 all 8.- 2-Class Mixture(none, graded component), 3-Class Mixture(none, all, graded component)로 2PL graded component fit- standard 2PL보다 2-class, 3-class가 slope(a), threshold(b)가 낮게 나타남

- 모집단이 전체 표본에서 채점된 graded component로 변화했기 때문에

- none을 제거하게 되면, 그 비율이 all-reporter class보다 훨씬 크기 때문에,  threshold(b), slope(a)가 낮아지게 됨

- none과 all은 내적 일관성을 높이기 때문에 slope(a) 모수가 높아지게 되고, 이 그룹을 제거하게 되면 a모수가 낮아짐

- 카이 검정 결과, 2class Mixture model이 채택되었음

 

- 반항장애로 선별된(screener?) 학생(N=2212)들을 대상으로 2PL, 2-class, 3-class를 시행한 결과, 추정 모수 사이에 차이가 적었음

-품행장애 18문항, 15 criteria; 부모 6483명 중 단 3명만이 15개 항목에 all 대답

- 2class와 3class에 차이가 적었고, standard 2PL은 마찬가지로 크게 나타났음

- 품행장애로 선별된 학생(N=3518)들을 대상으로 시행한 결과(3class를 제외하고 2PL과 2class만 시행) 추정모수의 차이가 적었음

 

- Tetrachoric Factor Analysis도 함,,

 

결론

The fitting of a standard IRT model like the 2-PL, when the mixture model would be more suitable, has adverse consequences in parameter estimation. As we have demonstrated empirically, the standard 2-PL generally results in higher slope and threshold parameters than the two-class model consisting of non-reporters and the graded component.(2PL의 추정치가 높게 나타난다)

In both of the above scenarios, negative ramifications would also occur in the estimation of person parameters: because of the standard IRT model's unduly high slopes, the standard error of a respondent's θˆ would often be too small, especially when θˆ fell near the estimated thresholds. As a result, practitioners would potentially have false confidence in the precision of estimated θˆ values, compared to the results that would be obtained from the mixture model.