تئوری سؤال- پاسخ و تئوری-کلاسیک- تست: یک مقایسه تجربی از آماره‌های آزمودنی/ سؤال (قسمت چهارم)

سه شنبه, ۲۴ شهریور ۱۳۹۴، ۰۸:۰۰ ق.ظ

سؤال پژوهش 4

چهارمین سؤال پژوهش ('' برآوردهای دشواری سؤال تئوری کلاسیک - تست و تئوری سؤال- پاسخ در میان نمونه‌های متفاوت آزمودنی چگونه باثباتند؟'' ) یک سؤال تعیین کننده را در مورد دو تئوری پاسخ می‌دهد همانگونه که قبلاً بحث شد، فرضیه که ثبات پارامتر سؤال در میان نمونه‌های متفاوت آزمودنی مهمترین نقش را در توسعه و کاربرد مدل‌های تئوری سؤال- پاسخ دارد را ارائه نموده‌ است.

جدول 7 نتایج این سؤال پژوهش را ارائه می‌کند. توجه داشته باشید که همبستگی‌های معدل گرفته شده در این جدول (و مشابهاً در جدول 8) همبستگی‌های بین برآوردهای دشواری سؤال از دو نمونه متفاوت ناشی شده از همان چارچوب اندازه‌گیری است. برای مثال رقم ثبت شده تحت تئوری کلاسیک - تست بین نمونه‌های مذکر و مؤنث آزمون ریاضی معدل همبستگی‌ها بین مقادیر p تئوری کلاسیک - تست حاصل از نمونه مونث و مقادیر p تئوری کلاسیک - تست حاصل از نمونه مذکر است. یکصد جفت نمونه مذکر- مونث شکل گرفت و مقادیر p در میان هر جفت نمونه با یکدیگر همبستگی گرفته شد. معدل این 100 ضریب همبستگی 0/945 (0/007 =SD) بود. ارقام ثبت شده دیگر در جدول 7 به همین روش حاصل شدند.

این مهم است که اشاره شود ویژگی ثبات پارامترهای سؤال فقط با اجرای همان سؤالات در نمونه‌های متفاوت و سپس مقایسه برآوردهای پارامترهای سؤال در نمونه‌های متفاوت بررسی می‌شود.

جدول 7: ثبات آماره‌های سؤال دو چارچوب اندازه‌گیری: معدل همبستگی‌های بین نمونه‌ها شاخص‌های دشواری سؤال تئوری کلاسیک - تست و تئوری سؤال- پاسخ

تـوجه :

CTT = تئوری کلاسیک - تست: IRT= تئوری سؤال- پاسخ.

1p = یک پارامتری

دو =2p پارامتری

3p = سه پارامتری

یک معدل ضریب همبستگی حاصل شده از طریق :

الف- تبدیل ضرایب همبستگی مجزا به Fisher Zs

ب) معدل ها Fisher Zs

ح) تبدیل معدل Fisher به ضریب همبستگی پیرسون. انحرافات معیار در پرانتز‌ها ارائه شده است.

a- این‌ها معدل بین همبستگی‌های نمونه بین مقادیر p نرمال هستند.

جدول 8: ثبات آماره سؤال دو چارچوب اندازه‌گیری : معدل بین همبستگی‌های نمونه شاخص‌های تمییز سؤال تئوری کلاسیک تست و تئوری سؤال- پاسخ

تـوجه :

CTT = تئوری کلاسیک - تست: IRT= تئوری سؤال- پاسخ.

1p = یک پارامتری

دو = 2p پارامتری

3p = سه پارامتری

یک معدل ضریب همبستگی حاصل شده از طریق :

الف- تبدیل ضرایب همبستگی مجزا به Fisher Zs

ب) معدل ها Fisher Zs

ح) تبدیل معدل مرده Fisher z به ضریب همبستگی پیرسون. انحرافات معیار در پرانتز‌ها ارائه شده اند.

الف) معدل‌های بین همبستگی‌های نمونه بین شاخص‌های تمییزسؤال مبدل Fisher z وجود دارد.

مقایسه ارقام ثبت شده تئوری سؤال - پاسخ و تئوری کلاسیک - تست نشان می‌دهد که برآوردهای دشواری سؤال تئوری کلاسیک - تست بسیار نزدیک قابل مقایسه (همانند) برآوردهای دشواری تئوری سؤال پاسخ هستند و در اصطلاح ویژگی‌های ثباتشان در بیان این حس که معدل بین ضرایب همبستگی نمونه‌های برآورد دشواری سؤال خیلی بالا و قابل مقایسه (همانند) بین تئوری کلاسیک-تست و تئوری سؤال پاسخ هستند. اگر هیچ روندی هم وجود نداشته باشد، بنظر می‌رسد برآوردهای دشواری سؤال تئوری کلاسیک - تست یک مقدار جزئی باثبات‌تر از برآوردهای دشواری سؤال تئوری سؤال پاسخ تقریباً در همه‌ی شرایط هستند، زیرا معدل بین همبستگی‌های نمونه‌های مقدار P به نظر می‌رسد مقداری خفیف نسبت به معدل بین همبستگی‌های نمونه‌های پارامتری موضعی تئوری سؤال پاسخ در هر سه مدل (یک- دو - و سه پارامتری ) بالاتر است. این مشاهده‌ی تجربی در مورد ویژگی ثبات شاخص‌های دشواری سؤال در چارچوب اندازه‌گیری در بحث قوی طرفداران چارچوب تئوری سؤال و پاسخ به دلیل امتیاز آشکار در موضوع ثبات نسبت به تئوری کلاسیک - تست جالب به نظر می‌رسد.

معدل بین همبستگی‌های نمونه‌ها در مقادیر p اصلی تئوری کلاسیک - تست و آن‌هایی که برای مقادیر p نرمال بدست آمد یک کمی فرق دارد. همچنین برآوردهای دشواری سؤال مدل یک پارامتری تئوری سؤال پاسخ به نظر می‌رسد مقدار خفیفی در میان نمونه‌ها نسبت به برآوردهای دشواری سؤال مدل‌های دو و سه پارامتری با ثبات‌تر باشد با این نظر که تنها ثبات هنگام برازش مدل با داده‌ها درست و دقیق در جامعه است. (Hambleton etal;1991.p.33)

آیا این نتیجه دلالت بر این دارد که مدل یک پارامتری برای برازش با داده‌ها یک مقداری خفیف بهتر از مدل‌های دو و سه پارامتری است؟ نتایج جدول سه در ارزشیابی برازش مدل نشان می‌دهد برعکس این نظریه احتمالاً درست است. همچنین از نقطه نظر مدل آماری این به نظر غیر ممکن می‌رسد. چون مدل یک پارامتری به سادگی به نظر می‌رسد یک زیر شاخه مدل دو و سه پارامتری است. از لحاظ تئوری، یک مدل در سلسله مراتب بالاتر تمایل به برازش بهتر با داده‌ها نسبت به مدل زیر شاخه دارد. چون مدل پائین‌تر محدودیت‌های بیشتر دارد. یک پارامتر اجباری تمایل به افزایش عدم تجانس با مدل و معمولاً سؤال را دارد، چه مقدار ؟ اگر این عدم تجانس ایجاد شده توسط پارامتر اجباری حداقل ربط در کسب کاربرد مدل‌ها باشد، مدل اجباری‌تر و ساده‌تر معمولاً ترجیح داده می‌شود.

ادامه دارد:

منبع:

(Education and psychological Measurement jun 1998 v 58 p357 (25

۰ ۰
۹۴/۰۶/۲۴

مجید شفیعیان

irt medical education

irt medical education

کاربرد نظریه ی سؤال - پاسخ در حیطه های مختلف آموزش پزشکی

مقالات

IRT

پروژه Monte Carlo

یک مقایسه بین تئوری کلاسیک – تست و تئوری سؤال – پاسخ

تئوری سؤال- پاسخ و تئوری-کلاسیک- تست: یک مقایسه تجربی از آماره‌های آزمودنی سؤال بوسیله Xitao Fan

آموزش پزشکی

پاسخگویی اجتماعی

حداقل الزامات و استاندارد ها در آمورش پزشکی

پیامدهای یادگیری دوره پزشکی عمومی در اسکاتلند پایه ای برای توانمندی در پزشکی عمومی

ادغام آموزش پزشکی و سیستم مراقبت سلامت در کشور

کنفرانس Outcome Based Education

کتاب

آموزش پزشکی

برنامه ریزی درسی

کارگاه

تئوری سؤال- پاسخ و تئوری-کلاسیک- تست: یک مقایسه تجربی از آماره‌های آزمودنی/ سؤال (قسمت چهارم)

نظرات (۰)

ارسال نظر