تئوری سؤال- پاسخ و تئوری-کلاسیک- تست: یک مقایسه تجربی از آمارههای آزمودنی/ سؤال (قسمت چهارم)
سؤال پژوهش 4
چهارمین سؤال پژوهش ('' برآوردهای دشواری سؤال تئوری کلاسیک - تست و تئوری سؤال- پاسخ در میان نمونههای متفاوت آزمودنی چگونه باثباتند؟'' ) یک سؤال تعیین کننده را در مورد دو تئوری پاسخ میدهد همانگونه که قبلاً بحث شد، فرضیه که ثبات پارامتر سؤال در میان نمونههای متفاوت آزمودنی مهمترین نقش را در توسعه و کاربرد مدلهای تئوری سؤال- پاسخ دارد را ارائه نموده است.
جدول 7 نتایج این سؤال پژوهش را ارائه میکند. توجه داشته باشید که همبستگیهای معدل گرفته شده در این جدول (و مشابهاً در جدول 8) همبستگیهای بین برآوردهای دشواری سؤال از دو نمونه متفاوت ناشی شده از همان چارچوب اندازهگیری است. برای مثال رقم ثبت شده تحت تئوری کلاسیک - تست بین نمونههای مذکر و مؤنث آزمون ریاضی معدل همبستگیها بین مقادیر p تئوری کلاسیک - تست حاصل از نمونه مونث و مقادیر p تئوری کلاسیک - تست حاصل از نمونه مذکر است. یکصد جفت نمونه مذکر- مونث شکل گرفت و مقادیر p در میان هر جفت نمونه با یکدیگر همبستگی گرفته شد. معدل این 100 ضریب همبستگی 0/945 (0/007 =SD) بود. ارقام ثبت شده دیگر در جدول 7 به همین روش حاصل شدند.
این مهم است که اشاره شود ویژگی ثبات پارامترهای سؤال فقط با اجرای همان سؤالات در نمونههای متفاوت و سپس مقایسه برآوردهای پارامترهای سؤال در نمونههای متفاوت بررسی میشود.
جدول 7: ثبات آمارههای سؤال دو چارچوب اندازهگیری: معدل همبستگیهای بین نمونهها شاخصهای دشواری سؤال تئوری کلاسیک - تست و تئوری سؤال- پاسخ
تـوجه :
CTT = تئوری کلاسیک - تست: IRT= تئوری سؤال- پاسخ.
1p = یک پارامتری
دو =2p پارامتری
3p = سه پارامتری
یک معدل ضریب همبستگی حاصل شده از طریق :
الف- تبدیل ضرایب همبستگی مجزا به Fisher Zs
ب) معدل ها Fisher Zs
ح) تبدیل معدل Fisher به ضریب همبستگی پیرسون. انحرافات معیار در پرانتزها ارائه شده است.
a- اینها معدل بین همبستگیهای نمونه بین مقادیر p نرمال هستند.
جدول 8: ثبات آماره سؤال دو چارچوب اندازهگیری : معدل بین همبستگیهای نمونه شاخصهای تمییز سؤال تئوری کلاسیک تست و تئوری سؤال- پاسخ
تـوجه :
CTT = تئوری کلاسیک - تست: IRT= تئوری سؤال- پاسخ.
1p = یک پارامتری
دو = 2p پارامتری
3p = سه پارامتری
یک معدل ضریب همبستگی حاصل شده از طریق :
الف- تبدیل ضرایب همبستگی مجزا به Fisher Zs
ب) معدل ها Fisher Zs
ح) تبدیل معدل مرده Fisher z به ضریب همبستگی پیرسون. انحرافات معیار در پرانتزها ارائه شده اند.
الف) معدلهای بین همبستگیهای نمونه بین شاخصهای تمییزسؤال مبدل Fisher z وجود دارد.
مقایسه ارقام ثبت شده تئوری سؤال - پاسخ و تئوری کلاسیک - تست نشان میدهد که برآوردهای دشواری سؤال تئوری کلاسیک - تست بسیار نزدیک قابل مقایسه (همانند) برآوردهای دشواری تئوری سؤال پاسخ هستند و در اصطلاح ویژگیهای ثباتشان در بیان این حس که معدل بین ضرایب همبستگی نمونههای برآورد دشواری سؤال خیلی بالا و قابل مقایسه (همانند) بین تئوری کلاسیک-تست و تئوری سؤال پاسخ هستند. اگر هیچ روندی هم وجود نداشته باشد، بنظر میرسد برآوردهای دشواری سؤال تئوری کلاسیک - تست یک مقدار جزئی باثباتتر از برآوردهای دشواری سؤال تئوری سؤال پاسخ تقریباً در همهی شرایط هستند، زیرا معدل بین همبستگیهای نمونههای مقدار P به نظر میرسد مقداری خفیف نسبت به معدل بین همبستگیهای نمونههای پارامتری موضعی تئوری سؤال پاسخ در هر سه مدل (یک- دو - و سه پارامتری ) بالاتر است. این مشاهدهی تجربی در مورد ویژگی ثبات شاخصهای دشواری سؤال در چارچوب اندازهگیری در بحث قوی طرفداران چارچوب تئوری سؤال و پاسخ به دلیل امتیاز آشکار در موضوع ثبات نسبت به تئوری کلاسیک - تست جالب به نظر میرسد.
معدل بین همبستگیهای نمونهها در مقادیر p اصلی تئوری کلاسیک - تست و آنهایی که برای مقادیر p نرمال بدست آمد یک کمی فرق دارد. همچنین برآوردهای دشواری سؤال مدل یک پارامتری تئوری سؤال پاسخ به نظر میرسد مقدار خفیفی در میان نمونهها نسبت به برآوردهای دشواری سؤال مدلهای دو و سه پارامتری با ثباتتر باشد با این نظر که تنها ثبات هنگام برازش مدل با دادهها درست و دقیق در جامعه است. (Hambleton etal;1991.p.33)
آیا این نتیجه دلالت بر این دارد که مدل یک پارامتری برای برازش با دادهها یک مقداری خفیف بهتر از مدلهای دو و سه پارامتری است؟ نتایج جدول سه در ارزشیابی برازش مدل نشان میدهد برعکس این نظریه احتمالاً درست است. همچنین از نقطه نظر مدل آماری این به نظر غیر ممکن میرسد. چون مدل یک پارامتری به سادگی به نظر میرسد یک زیر شاخه مدل دو و سه پارامتری است. از لحاظ تئوری، یک مدل در سلسله مراتب بالاتر تمایل به برازش بهتر با دادهها نسبت به مدل زیر شاخه دارد. چون مدل پائینتر محدودیتهای بیشتر دارد. یک پارامتر اجباری تمایل به افزایش عدم تجانس با مدل و معمولاً سؤال را دارد، چه مقدار ؟ اگر این عدم تجانس ایجاد شده توسط پارامتر اجباری حداقل ربط در کسب کاربرد مدلها باشد، مدل اجباریتر و سادهتر معمولاً ترجیح داده میشود.
ادامه دارد:
منبع:
(Education and psychological Measurement jun 1998 v 58 p357 (25
- ۹۴/۰۶/۲۴