تئوری سؤال- پاسخ و تئوری-کلاسیک- تست: یک مقایسه تجربی از آمارههای آزمودنی/ سؤال (قسمت سوم)
سؤال پژوهشی 1
برای اولین سؤال پژوهشی (برآوردهای توانایی آزمودنیها براساس تئوری کلاسیک - تست و تئوری سؤال- پاسخ چگونه با هم قابل مقایسهاند (همانندند؟)،جدول 4 نتایج هم آزمونهای ریاضی و درک مطلب و هم نمونههای تحت شرایط متفاوت نمونهگیری را ارائه میکند. سه مرحله در ورود ارقام دادهها در جدول 4 انجام شدند:
الف- از هر نمونه آزمودنیها، برآوردهای توانایی تئوری کلاسیک - تست و مدلهای یک – دو – سه پارامتری تئوری سؤال- پاسخ به ترتیب اخذ شدند.
ب- برآوردهای توانایی تئوری کلاسیک - تست و تئوری سؤال- پاسخ از هر نمونه یکسان با یکدیگر همبستگی گرفته شدند.
ح- از همبستگیهای بین برآوردهای توانایی تئوری کلاسیک - تست و تئوری سؤال- پاسخ هر نمونههای مجزا معدل گرفته شد در نمونههای همان آزمون و تحت همان شرایط نمونهگیری داخل هر جدول معدل بیست ضریب همبستگی اخذ شده از 20 نمونه اتفاقی است. (هر کدام 1000=n) . در جدول 4 و تمام جداول متعاقب یک معدل ضریب همبستگی اخذ شده بوسیله :
الف) تبدیل ضرایب همبستگی انفرادی به ها Fisher z
ب) معدل Fisher Zs
ج) تبدیل معدل Fisher Z به ضریب همبستگی پیرسون
جدول 4 : قابلیت قیاس آمارههای آزمودنی در دو چارچوب اندازهگیری: معدل همبستگیها بین برآوردهای توانایی آزمودنی تئوری کلاسیک - تست و تئوری سؤال- پاسخ
تـوجه :
CTT = تئوری کلاسیک تست؛ IRT = تئوی سؤال- پاسخ. یک معدل ضریب همبستگی اخذ شد از طریق
الف) تبدیل ضرایب همبستگی مجزا به ها ها Fisher z
ب) معدل ها Fisher Zs و
ج) تبدیل معدل Fisher z به ضریب همبستگی پیرسون. انحراف های معیار در پرانتزها ارائه شده است.
الف) اینها معدل همبستگیها بین برآوردهای توانایی تئوری کلاسیک - تست و برآوردهای توانایی مشتق شده از مدلهای یک – دو – و سه پارامتری تئوری سؤال- پاسخ به ترتیب میباشند.
جدول 4 نشان میدهد که برآوردهای توانایی آزمودنیهای تئوری کلاسیک - تست و تئوری سؤال- پاسخ فوقالعاده با یکدیگر همبستگی دارند در هم آزمون ریاضی و هم آزمون درک مطلب در نمونههای متفاوت و برای هر سه مدل (یک – دو و سه پارامتری) تئوری سؤال- پاسخ با معدل همبستگیهای بین برآوردهای توانایی آزمودنی تئوری کلاسیک - تست و تئوری سؤال- پاسخ بالاتر از 0/96 در همه شرایط این همبستگیهای خیلی بالا نشان میدهد که برآوردهای توانایی آزمودنی تئوری کلاسیک - تست و سؤال- پاسخ با یکدیگر خیلی قابل مقایسهاند (همانندند). بعبارت دیگر صرفنظر از چارچوب اندازهگیری که ما به آن تکیه میکنیم، نتایج یکسان یا خیلی مشابه در ارتباط با سطوح توانایی آزمودنیهای مجزا اخذ خواهد شد.
سؤال پژوهشی 2
جدول 5 نتایج مرتبط با دومین سؤال پژوهش را ارائه میکند (''برآوردهای دشواری سؤال تئوری کلاسیک - تست و تئوری سؤال- پاسخ چگونه قابل مقایسهاند''؟ (همانند). دوباره، از همان نمونه برآوردهای دشواری سؤال تئوری کلاسیک - تست همبستگیهایش مقایسه میشود، برآوردهای دشواری سؤال منتج شده مدلهای (یک – دو – و سه پارامتری) تئوری سؤال- پاسخ و هر رقم ثبت شده در جدول معدل همبستگیهای در نمونه بین برآوردهای دشواری سؤال در تئوری کلاسیک - تست و تئوری سؤال- پاسخ از 20 نمونه میباشد. برآوردهای دشواری سؤال تئوری سؤال- پاسخ همبستگی گرفته شد هم با مقادیر p اصلی تئوری کلاسیک - تست و هم مقادیر p نرمال تئوری کلاسیک - تست، مقادیر p تئوری کلاسیک - تست در جهت برعکس بودند طوریکه هر چه مقدار بالاتر بود، سؤال مشکلتر بود. این جهت خطی معکوس مقادیر p هیچ اثر آماری به غیر از اینکه همبستگیها را در جدول 5 از لحاظ علامت مثبت کند نداشت.
جدول 5 . قابلیت قیاس آمارههای سؤال دو چارچوب اندازهگیری: معدل همبستگیها بین شاخصهای دشواری سؤال تئوری کلاسیک - تست و تئوری سؤال- پاسخ
تـوجه :
CTT = تئوری کلاسیک - تست: IRT= تئوری سؤال- پاسخ.
یک معدل ضریب همبستگی اخذ شده از طریق:
الف- تبدیل ضرایب همبستگی مجزا به Fisher Zs
ب) معدل ها Fisher Zs و
ح) تبدیل معدل Fisher zs به ضریب همبستگی پیرسون. انحراف معیار در پرانتزها ارائه شده است.
الف) همبستگیهای بین دشواری سؤال تئوری کلاسیک - تست با برآوردهای دشواری سؤال منتج شده از مدلهای یک- دو- و سه پارامتری مدلهای تئوری سؤال- پاسخ بترتیب.
ب) همبستگی بین برآوردهای دشواری سؤال تئوری سؤال- پاسخ و مقادیر p سؤال تئوری کلاسیک - تست
ج) همبستگی بین برآوردهای دشواری سؤال تئوری سؤال- پاسخ و مقادیر p نرمال سؤال
همانطور که نتایج جدول نشان میدهد، برای مدل راش تئوری سؤال- پاسخ (که مدل یک پارامتری است) رابطه بین برآوردهای دشواری سؤال تئوری کلاسیک - تست و تئوری سؤال- پاسخ تقریباً کامل است. برای مدلهای 2و 3 پارامتری تئوری سؤال- پاسخ، روابط بین برآوردهای دشواری سؤال تئوری کلاسیک - تست و تئوری سؤال- پاسخ بنظر تا حدودی ضعیفتر است، اگر چه هنوز نسبتاً قوی است، زیرا اکثر ضرایب بالا 0/90 تحت اغلب شرایط بودند. جالب توجه است که اشاره شود رابطه بین برآوردهای دشواری سؤال تئوری کلاسیک - تست و تئوری سؤال- پاسخ در مدل 2 پارامتری نسبت به مدل 3 پارامتری بنظر بسیار جزیی اما بطور باثبات ضعیفتر است.
اینکه چرا این مورد است واضح نیست یا اینکه ممکن است بدلیل ویژگی فردی سؤال نمونههای مورد استفاده در مطالعه باشد. در مجموع بجز تعداد اندکی موارد که در آنها معدل همبستگیها بین برآوردهای دشواری سؤال تئوری سؤال- پاسخ و تئوری کلاسیک - تست در 0/80 بودند، برآوردهای دشواری سؤال تئوری کلاسیک - تست و تئوری سؤال- پاسخ در دو آزمون متفاوت و تحت شرایط نمونه گیری متفاوت کاملاً با یکدیگر قابل مقایسه (هم مانند) بودند.
از آنجا که مدل راش (یک پارامتری ) تئوری سؤال- پاسخ تمییزسؤال را ثابت فرض میکند و هیچ حدس برای همهی سؤالات ندارد، مدل فقط برآورد برای پارامتر دشواری سؤال دارد. چون برآوردهای پارامتر دشواری سؤال مدل راش تقریباً بطور کامل مرتبط با شاخصهای دشواری سؤال (هم مقدار p اصلی و هم مقدار p نرمال) تئوری کلاسیک - تست است، بنظر میرسد مدل یک پارامتری تقریباً اطلاعات یکسال همانند تئوری کلاسیک - تست راجع به دشواری سؤال فراهم مینماید اما به قیمت پیچیدگی قابل ملاحظه مدل. نتایج اینجا بیان میدارد که مدل راش ممکن نیست هیچ امتیازی تجربی نسبت به چارچوب خیلی سادهتر تئوری کلاسیک - تست ارائه کند، مگر اینکه برآوردهای مدل راش میتوانستند عملکرد بدتر را به اصطلاح ثبات را در بین نمونههای متفاوت نسبت به شاخصهای دشواری سؤال تئوری کلاسیک - تست نشان دهند. درجه ثبات آمارههای سؤال دو چارچوب اندازهگیری مختصراً تحت سؤال پژوهشی 4 و 5 بحث خواهد شد.
ادامه دارد:
منبع:
(Education and psychological Measurement jun 1998 v 58 p357 (25
- ۹۴/۰۶/۲۳