تئوری سؤال- پاسخ و تئوری-کلاسیک- تست: یک مقایسه تجربی از آماره‌های آزمودنی/ سؤال (قسمت اول)

شنبه, ۲۱ شهریور ۱۳۹۴، ۰۸:۰۰ ق.ظ

با وجود تفاوت‌های نظری بین تئوری سؤال- پاسخ و تئوری کلاسیک- تست، فقدان دانش تجربی در مورد اینکه چگونه و تا چه حدی آماره‌های آزمودنی و سؤال بطور متفاوت رفتار می‌کنند وجود دارد. این مطالعه بطور تجربی رفتار آماره‌های سؤال و آزمودنی مشتق شده از این دو چارچوب اندازه‌گیری را بررسی کرد. مطالعه بر دو موضوع تأکید داشت:

الف) چه روابط تجربی بین آماره‌های سؤال و آزمودنی تئوری سؤال- پاسخ و تئوری کلاسیک - تست وجود دارد؟

ب) آماره‌های سؤال تئوری سؤال- پاسخ و آمارهای سؤال تئوری کلاسیک - تست در نمونه‌های متفاوت آزمودنی‌ها در چه حدی باثبات هستند؟ یک پایگاه داده‌های سنجش سطح ایالتی مقیاس وسیع در این مطالعه استفاده شد. یافته‌ها نشان دادند که آماره‌های سؤال و آزمودنی مشتق شده از دو چارچوب اندازه‌گیری کاملاً با همدیگر قابل مقایسه بودند. درجه ثبات آماره‌های سؤال در نمونه‌ها، معمولاً بعنوان برتری تئوریکی مدل‌های تئوری سؤال- پاسخ را نشان داد، همچنین برای دو چارچوب اندازه‌گیری شبیه هم بدست آمد.

COPYIGHI 1998 Sage publication. Inc

تئوری کلاسیک - تست و تئوری سؤال- پاسخ بطور گسترده درک شده است که دو چارچوب اندازه‌گیری خیلی متفاوت هستند با این وجود، مطالعات کمی بطور تجربی شباهات و تفاوت‌های پارامترهای برآورد شده بوسیله این دو چارچوب را به طور تجربی بررسی کرده است. قبل از وارد شدن به این موضوع، یکسری خوانندگان ممکن است یک مرور کوتاه از تئوری‌های مرتبط را در نظر بگیرند. جزئیات بیشتر در جای دیگر موجود است.

(Cf. Crocker & Alging, 1986; Mckinley, Mills,1989)

مرور کوتاه تئوری کلاسیک - تست و تئوری سؤال- پاسخ

اگر چه تئوری کلاسیک - تست به جامعه اندازه‌گیری بیشتر این قرن خدمت کرده است، تئوری سؤال- پاسخ شاهد رشد تعریفی در دهه‌های اخیر بوده است. امتیاز اصلی تئوری کلاسیک - تست مفروضات تئوریکی مربوط ضعیفش است که تئوری کلاسیک - تست را برای کاربرد در موقعیات آزمون‌های زیادی آسان می‌سازد (1993و Hambleton & Jones). مفروضات تئوریک ضعیف مربوطه نه تنها تئوری کلاسیک - تست را مشخص می‌کند بلکه بسط‌های آن را نیز توصیف می‌نماید (برای مثال تئوری تعمیم‌پذیری). اگر چه موضوعات اصلی تئوری کلاسیک - تست بر اطلاعات سطح آزمون تأکید دارد، آماره‌های سؤال (که دشواری سؤال و تمییزسؤال است) هم قسمت مهمی از مدل تئوری کلاسیک - تست هستند.

در سطح سؤال، مدل تئوری کلاسیک - تست نسبتاً ساده است. تئوری کلاسیک - تست یک مدل تئوریکی پیشرفته‌ای برای ارتباط دادن توانایی یک آزمودنی برای موفق شدن در یک سؤال مشخص بکار نمی‌برد.

در عوض، تئوری کلاسیک - تست مجموعاً یک عده از آزمودنی‌ها را در نظر می‌گیرد و بطور تجربی میزان موفقیت‌شان در یک سؤال (با فرض اینکه دو ارزشی نمره‌گذاری شدند) را بررسی می‌نماید. این میزان موفقیت یک عده مشخص آزمودنی‌ها در یک سؤال، بعنوان مقدار p سؤال شناخته شده و بعنوان شاخص دشواری سؤال استفاده می‌شود (در واقع، آن یک نشانگر معکوس دشواری سؤال است. هر چه مقدار بالاتر نشانگر سؤال آسان‌تر می باشد). توانایی یک سؤال و تمییز بین آزمودنی‌های با توانایی بالاتر و آزمودنی‌های با توانایی پایین‌تر بعنوان تمییزسؤال شناخته شده است که اغلب بطور آمار ضریب همبستگی پیرسون بین نمرات در سؤال (برای مثال 0 و 1 در یک سؤال نمره‌گذاری شده صحیح – غلط) و نمرات در کل آزمون است. هنگامی که یک سؤال بطور دو ارزش نمره‌گذاری شود، این برآورد اغلب بعنوان یک ضریب همبستگی دو رشته‌ای نقطه‌ای محاسبه می‌گردد.

محدودیت اصلی تئوری کلاسیک - تست بطور خلاصه می‌تواند در وابستگی مدور خلاصه شود:

الف) آمار آزمودنی (نمره مشاهده شده) وابسته به نمونه (سؤال) است.

ب) آماره سؤال (دشواری سؤال و تمییزسؤال) وابسته به نمونه (آزمودنی) هستند. این وابستگی مدور یکسری مشکلات تئوریکی در کاربرد تئوری کلاسیک - تست در یکسری موقعیات اندازه‌گیری (مثل همتراز سازی آزمون‌ها، آزمون انطباق کامپیوتری) را تحمیل می‌نماید.

با وجود ضعف تئوری کلاسیک- تست در اصطلاح وابستگی مدورش به آماره‌های سؤال و آزمودنی، متخصصان اندازه‌گیری راه‌حل‌های عملی را تمرین کرده‌اند در راستای چارچوب تئوری کلاسیک - تست برای حل مشکلات اندازه‌گیری دیگری، برای مثال، همتراز سازی آزمون بطور تجربی در چارچوب تئوری کلاسیک- تست (برای مثال همترازسازی معادل رتبه‌ای) می‌تواند حاصل شود. مشابهاً رویکردهای تجربی برای اندازه‌گیری ثبات سؤال (برای مثال مقیاس مطلق Thurstone ) پیشنهاد شده است (Englehard , 1990). نسبتاً می‌توان گفت اگر چه یکسری موضوعات را در قالب تئوری کلاسیک - تست ممکن است پاسخ داده نشده باشند، خیلی از موضوعات از طریق روش‌های تجربی تک کاره پاسخ داده شده اند.

از طرف دیگر تئوری سؤال- پاسخ بیشتر بر پایه تئوری است و توزیع احتمالی موفقیت‌ آزمودنی را در سطح سؤال طرح ریزی می‌نماید. همانطور که نامش نشان می‌دهد، تئوری سؤال- پاسخ اصولاً بر اطلاعات سطح سؤال تأکید می‌کند در مقایسه با تئوری کلاسیک - تست که اصولاً بر اطلاعات سطح آزمون تأکید دارد. چارچوب تئوری سؤال- پاسخ یک گروهی از مدل‌ها را در بر می‌گیرد و کاربرد هر مدل در یک موقعیت ویژه بستگی به ذات سؤالات آزمون و پایداری مفروضات متفاوت تئوریکی در مورد سؤالات آزمون دارد. برای سؤال آزمون که به روش دو ارزش نمره‌گذاری می‌شوند، سه مدل تئوری سؤال- پاسخ به نام‌های یک، دو و سه پارامتری مدل تئوری سؤال- پاسخ وجود دارند. اگر چه مدل یک پارامتری ساده‌ترین مدل‌هاست، ممکن است بهتر باشد از مشکل‌ترین، مدل سه پارامتری تئوری سؤال- پاسخ شروع کرد؛ دلیل این نتیجه بحث بزودی آشکار خواهد شد. مدل سه پارامتری تئوری سؤال- پاسخ فرم متعاقب را دارد:

جایی که c عامل حدس و a پارامتر تمییزسؤال عموماً شیب سؤال نامیده می‌شود و b پارامتر دشواری سؤال که عموماً پارامتر موضع سؤال نامیده می‌شود و D یک ثابت قراردادی (بطور نرمال و D=1.7) و (θ) توانایی سطحی از یک آزمودنی شخص است، پارامتر موضع سؤال در همان مقیاس توانایی ، (θ) هست و مقدار θ را در نقطه‌ای که یک آزمودنی با سطح تواناییθ احتمال 50/50 در پاسخ به سؤال بدرستی دارد را بدست می‌آورد. پارامتر تمییزسؤال شیب خط مماس منحنی ویژگی سؤال در نقطه‌ای از پارامتر موضع سؤال است.

هنگامی که عامل حدس فرض یا محدود به صفر (0=C) شود ، مدل سه پارامتری به مدل دو پارامتری که فقط پارامترهای موضع سؤال و شیب سؤال نیاز به برآورد دارند کاهش می‌یابد:

اگر محدودیت دیگر اعمال شود و قید کند که همه سؤالات تمییز ثابت و برابر داشته باشند، آنگاه a یک ثابت می‌شود تا یک متغیر و این پارامتر نیاز به برآورد نخواهد داشت و تئوری سؤال- پاسخ به مدل یک پارامتری کاهش می‌یابد:

بنابراین در مدل یک پارامتری، محدودیت‌ها برد و تا سه تا پارامتر ممکن سؤال اعمال می‌شود و دشواری سؤال تنها پارامتری می‌ماند که نیاز به برآورد دارد. این مدل یک پارامتری که اغلب مدل راش نامیده می‌شود، بعد از محققین که کار پیشگامانه در این حیطه را انجام دادند نام گرفت. از بحث واضح است که مدل سه پارامتری عمومی‌ترین مدل است و دو مدل دیگر تئوری سؤال- پاسخ (دو و یک پارامتری) بعنوان مدل‌های رده بندی و انتخابی تحت مدل سه پارامتری در نظر گرفته شده‌اند.

هدف مطالعه

تئوری سؤال- پاسخ بطور نظری بر ضعف‌های اصلی تئوری کلاسیک - تست که وابستگی مدور به آماره‌های سؤال/آزمودنی تئوری کلاسیک - تست هست فائق آمده است، در نتیجه مدل‌های سؤال- پاسخ در تئوری آماره‌های سؤال مستقل از نمونه‌های آزمودنی و آماره‌های آزمودنی مستقل از سری ویژه سؤالات اجراء شده تولید می‌نمایند. این ویژگی ثبات آماره‌های سؤال و آزمودنی تئوری سؤال- پاسخ بطور تئوریکی به تصویر کشیده شده است و در جامعه اندازه‌گیری بطور وسیعی قابل قبول شده استa(Hambleton & swaminathan, 1985; Hembleton, swaminathan & Rogers,1991).

ویژگی ثبات پارامترهای مدل تئوری سؤال- پاسخ از لحاظ نظری این امکان را برای آن فراهم ساخت که یکسری مشکلات اندازه‌گیری مهم که در چارچوب تئوری کلاسیک - تست حل آنها مشکل بوده است همچون مشکلات مواجهه شده با همتراز سازی آزمون و آزمون انطباقی کامپیوتری را برطرف نماید. (Hambleton etal; 1991) با این وجود، بعنوان سنگ بنای تئوری سؤال- پاسخ، اهمیت ویژگی ثبات پارامترهای مدل تئوری سؤال- پاسخ نباید اغراق آمیز گردد زیرا بدون این ویژگی تعیین کننده، پیچیدگی مدل‌های تئوری سؤال- پاسخ هم در زمینه‌های تئوری و هم در زمینه‌های عملی به سختی می‌تواند قانع کننده باشد.

چون تئوری سؤال- پاسخ بطور قابل ملاحظه‌ای با تئوری کلاسیک - تست در تئوری فرق دارد، و تعداد امتیازات تئوریکی تعیین کننده را نسبت به تئوری کلاسیک - تست حکم می‌نماید، انتظار تفاوت‌های محسوس بین آماره‌های آزمودنی و سؤال تئوری سؤال- پاسخ و تئوری کلاسیک - تست منطقی است. به لحاظ تئوری، چنین روابطی به طور کامل واضح نیست، بجز اینکه دو نوع از آماره‌ها بایستی بطور یکنواخت تحت شرایط ویژه مرتبط گردند (Crocker& Algina , 1986; Lord,1980) اما چنین روابطی بندرت بطور تجربی بررسی شده است در نتیجه آنها واقعاً ناشناخته‌اند.

مطالعات تجربی در دسترس در این حیطه اصولاً بر کاربرد دو روش در همترازسازی آزمون تأکید کرده‌اند (Becker& Forsyth,1992; Herris,1991 مثل) در ارتباط با همترازسازی آزمون Hambleton etal (1991) پیشنهاد کرد، از لحاظ تئوری ویژگی ثبات آماره‌های سؤال تئوری سؤال- پاسخ نیاز به همترازسازی آزمون‌ها را مرتفع ساخته است و در عوض، آن یک مقیاس خطی است، نسبت به همترازسازی، که در چارچوب تئوری سؤال- پاسخ ضروری است. بحث دلالت بر این دارد که مدل‌های تئوری سؤال- پاسخ تکالیف همترازسازی را بهتر از رویکردهای همترازسازی تئوری کلاسیک - تست انجام می‌دهند. مطالعات تجربی در این حیطه اگر چه یک تصویر آمیخته‌ای، با تعدادی که برتری رویکردهای تئوری سؤال- پاسخ را نشان دادند (Peterson,Cook & stockin 1983 مثل) ، تعداد نتایج بهتری از رویکردهای یک کاره تئوری کلاسیک - تست پیشنهاد کردند.

(Clemans, 1993; kolen, 1981, Skaggs & lissitz, 1986a شد) و یکسری نتایج هر دو روش همترازسازی تئوری سؤال- پاسخ و تئوری کلاسیک - تست را که نتایج خیلی قابل مقایسه همانند تولید می‌کنند را نشان می‌دهند. این نتایج تصویر آمیخته پژوهشگران را برمی انگیزد که پیشنهاد نمایند ممکن است غیر واقع‌گرایانه باشد که انتظار داشت یک روش، بهترین نتایج همترازسازی برای همه انواع آزمون‌ها را فراهم نماید (Skaggs & Lissitz, 1986؛ مثل).

یک پژوهش مطالعاتی معلوم ساخت که فقط یک مطالعه بود که بطور تجربی قابلیت قیاس آماره های سؤال و آزمودنی تئوری کلاسیک - تست و تئوری سؤال- پاسخ را بررسی نمود (1991)Lawson که آماره‌های سئوال و آزمودنی سه سری از داده‌های متفاوت براساس تئوری کلاسیک - تست و مدل راش یک پارامتری تئوری سؤال- پاسخ را مقایسه کرد، و روابط فوق العاده قوی را بین آماره‌های سؤال و آماره‌های آزمودنی تئوری کلاسیک - تست و تئوری سؤال- پاسخ نشان داد. اگر چه مطالعه براساس یک سری داده‌های تا حدودی کوچک بوده و فقط محدودترین مدل یک پارامتری تئوری سؤال- پاسخ بررسی شد، اما نتایج مطالعه پیشنهاد کرد که اطلاعات دو رویکرد در مورد آماره‌های سؤال و آزمودنی ممکن است خیلی زیاد یکسان باشند.

مشابهاً، ویژگی ثبات پارامترهای سؤال/ آزمودنی تئوری سؤال- پاسخ بطور تجربی جزئی‌ بررسی شده است و اگر چه ثبات بطور تئوری اثبات شده است. (Hambleton& Swaminathan , 1985; Rudner,1983 مثل) اگر چه (1988) Miller , linn با استفاده از یک نسخه سری داده‌های وسیع، نتایج یک مطالعه را در بررسی تغییرات کارکردهای ویژگی سؤال در زمینه تغییرات آموزشی گزارش کردند.

آنها تفاوت‌های نسبتاً زیادی را در پاسخ‌های منحنی سؤال، که فقدان ثبات را در پارامترهای سؤال تئوری سؤال- پاسخ را گزارش کردند. فقدان ثبات همچنین بوسیله Cook و Eignor و Taft (1988) هم برای برآوردهای دشواری سؤال تئوری سؤال- پاسخ و هم تئوری کلاسیک - تست گزارش شد.

با تعداد محدودی از مطالعات تجربی که مستقیماً یا غیر مستقیم به موضوع ثبات پاسخ می‌دادند یک فقدان واضح بررسی نظام مند در مورد ثبات مطلق آماره‌های سؤال و آزمودنی هم در چارچوب تئوری کلاسیک - تست و هم تئوری سؤال- پاسخ و فقدان مطالعات که بطور تجربی ثبات نسبی آماره‌های سؤال و آزمودنی بدست آمده از تئوری کلاسیک - تست را با آنهایی که از تئوری سؤال- پاسخ بدست آمده مقایسه کند، مشهود است. انتقاد اصلی به تئوری کلاسیک - تست ناتوانی‌اش در تولید آماره‌های سؤال/ آزمودنی است که در نمونه‌های سؤال/ آزمودنی بی‌ثبات می‌باشد. این انتقاد یک نیروی محرکه اصلی برای توسعه مدل‌های تئوری سؤال- پاسخ و رشد استثنایی پژوهش تئوری سؤال- پاسخ و کاربردهایش در دهه‌های اخیر بوده است.

تا حدودی تعجب آور است که مطالعات تجربی که ثبات ویژگی‌های آماره‌های سؤال را در دو چارچوب اندازه‌گیری بررسی و مقایسه می‌نمایند بسیار نادر هستند. بنظر می‌رسد برتری تئوری سؤال- پاسخ نسبت به تئوری کلاسیک - تست در این خصوص بوسیله جامعه اندازه‌گیری مورد تصدیق قرار گرفته است و هیچ بررسی دقیق تجربی ضروری پنداشته نشده است. سکوت تجربی در این موضوع بنظر نابهنجار می‌رسد. این فقدان بررسی‌های تجربی یکسری پژوهشگران را برانگیخت تا بیان کنند که مدل تئوری سؤال- پاسخ بیش از حد بر بسط ریاضی به هزینه نبود مطالعات تجربی تأکید کرده است. (Goldstin & wood , 1989)

مطالعه حاضر طراحی شده است که بطور مفهومی مطالعه (Gall, Borg& Gall,1996;u/kken,1968) و مطالعه Lawson 1991. را تکرار نماید مطالعه حاضر بر دو موضوع اصلی تأکید دارد:

الف) آماره‌های سؤال و آزمودنی چارچوب تئوری کلاسیک - تست با آنهایی که از چارچوب تئوری سؤال- پاسخ هستند چگونه با یکدیگر قابل مقایسه‌اند (همانندند)؟

ب) آماره‌های سؤال تئوری کلاسیک - تست و تئوری سؤال- پاسخ در نمونه‌های آزمودنی چگونه باثباتند؟ اختصاصی‌تر، مطالعه پنج سؤال پژوهشی ذیل را پاسخ می دهد:

1- برآوردهای توانایی آزمودنی تئوری کلاسیک - تست و تئوری سؤال- پاسخ چگونه با یکدیگر قابل مقایسه‌اند؟

2- برآوردهای دشواری سؤال تئوری کلاسیک - تست و تئوری سؤال- پاسخ چگونه با یکدیگر قابل مقایسه‌اند؟

3- برآوردهای تمییزسؤال تئوری کلاسیک - تست و تئوری سؤال- پاسخ چگونه با یکدیگر قابل مقایسه‌اند؟

4- برآوردهای دشواری سؤال تئوری کلاسیک - تست و تئوری سؤال- پاسخ در نمونه‌های متفاوت آزمودنی‌ها چگونه باثباتند؟

5- برآوردهای تمییزسؤال تئوری کلاسیک - تست و تئوری سؤال- پاسخ در نمونه‌های متفاوت آزمودنی چگونه باثباتند.

ادامه دارد:

منبع:

(Education and psychological Measurement jun 1998 v 58 p357 (25

۰ ۰
۹۴/۰۶/۲۱

مجید شفیعیان

irt medical education

irt medical education

کاربرد نظریه ی سؤال - پاسخ در حیطه های مختلف آموزش پزشکی

مقالات

IRT

پروژه Monte Carlo

یک مقایسه بین تئوری کلاسیک – تست و تئوری سؤال – پاسخ

تئوری سؤال- پاسخ و تئوری-کلاسیک- تست: یک مقایسه تجربی از آماره‌های آزمودنی سؤال بوسیله Xitao Fan

آموزش پزشکی

پاسخگویی اجتماعی

حداقل الزامات و استاندارد ها در آمورش پزشکی

پیامدهای یادگیری دوره پزشکی عمومی در اسکاتلند پایه ای برای توانمندی در پزشکی عمومی

ادغام آموزش پزشکی و سیستم مراقبت سلامت در کشور

کنفرانس Outcome Based Education

کتاب

آموزش پزشکی

برنامه ریزی درسی

کارگاه

تئوری سؤال- پاسخ و تئوری-کلاسیک- تست: یک مقایسه تجربی از آماره‌های آزمودنی/ سؤال (قسمت اول)

نظرات (۰)

ارسال نظر