* مکاتبات باید به آن - ویل کرامر ، گروه روانشناسی: روانشناسی رشد ، دانشگاه آمستردام ، پس ازبوس 15916 ، 1001 NK ، آمستردام ، هلند (ایمیل: ln. avu@remark. a) خطاب شود.
کپی رایت © 2021 نویسندگان. مجله روانشناسی توسعه انگلیس که توسط جان ویلی و پسران با مسئولیت محدود به نمایندگی از جامعه روانشناسی انگلیس منتشر شده است
این یک مقاله دسترسی آزاد تحت شرایط http://creativeecommons. org/licenses/by/4. 0/ مجوز است ، که امکان استفاده ، توزیع و تولید مثل در هر رسانه را فراهم می کند ، مشروط بر اینکه کار اصلی به درستی استناد شود.
داده های مرتبط
اشتراک داده ها برای این مقاله قابل استفاده نیست زیرا هیچ داده جدیدی در این مطالعه ایجاد نشده است.
چکیده
مطالعات توسعه بیشماری توانایی شناختی کلی را ارزیابی می کند ، نه به عنوان متغیر اصلی علاقه ، بلکه به عنوان یک متغیر پس زمینه. ماتریس های مترقی Raven یک آزمایش غیر کلامی آسان است که به طور گسترده برای اندازه گیری توانایی شناختی عمومی استفاده می شود. با این حال ، زمان تجویز نسبتاً طولانی (حداکثر 45 دقیقه) هنوز هم اشکال برای مطالعات توسعه است زیرا اغلب زمان کمی برای ارزیابی متغیر اصلی علاقه می گذارد. بنابراین ، ما از یک رویکرد یادگیری ماشین - رگرسیون منظم در ترکیب با اعتبار سنجی متقابل - برای تهیه یک نسخه کوتاه 15 - استفاده کردیم. ما این کار را برای دو گروه سنی ، یعنی 9 تا 12 سال و 13 تا 16 سال انجام دادیم. نسخه های کوتاه نمرات موجود در نسخه های استاندارد 60 - استاندارد را به درجه بسیار بالا R = 0. 89 (9-12 سال) و R = 0. 93 (13-16 سال) پیش بینی کردند. بنابراین ، ما استفاده از نسخه کوتاه را برای اندازه گیری توانایی شناختی عمومی به عنوان متغیر زمینه در مطالعات توسعه توصیه می کنیم.
واژههای کلیدی: ماتریس های مترقی ، فرم کوتاه ، تحقیقات رشد ، توانایی شناختی عمومی ، رگرسیون مجازات
صورت سهم
چه چیزی در این زمینه شناخته شده است؟
ماتریس پیشرونده استاندارد Raven به طور گسترده ای برای اندازه گیری توانایی شناختی به عنوان متغیر پس زمینه در مطالعات توسعه استفاده می شود.
اشکال در مدت زمان طولانی مدت آن (حداکثر 45 دقیقه) است ، بنابراین تهیه نسخه کوتاه شده مفید خواهد بود.
اگرچه نسخه های کوتاه RSPM وجود دارد ، هیچ نسخه کوتاه برای کودکان و نوجوانان مناسب نیست.
این مطالعه چه چیزی را اضافه می کند؟
ما از یک رویکرد یادگیری ماشین برای توسعه نسخه های کوتاه مدت 15 inded برای دو گروه سنی (9-12 و 13-16 سال) استفاده کردیم.
نتایج نشان داد که نسخه های کوتاه نمرات نسخه اصلی را تا حد بالایی پیش بینی کرده اند و از این رو به عنوان جایگزینی برای نسخه اصلی مناسب خواهد بود.
مقدمه
در مطالعات رشدی ، توانایی شناختی عمومی اغلب به جای متغیر مورد علاقه به عنوان یک متغیر پس زمینه اندازه گیری می شود (به عنوان مثال ، Cheung ، Chan ، & Tsui ، 2016 ؛ Meinhardt - Injac ، Daum ، & Meinhardt ، 2020). از این رو ، یک تست توانایی شناختی کلی به باتری آزمایش اضافه می شود و به طور قابل توجهی تجویز آزمایش را طولانی تر می کند. به خصوص برای کودکان و نوجوانان ، این ممکن است مسئله ای به دلیل محدودیت توجه و زمان محدود برای شرکت در تحقیقات باشد. در نتیجه ، اندازه گیری توانایی شناختی عمومی ممکن است به طور قابل توجهی در اندازه گیری علاقه تداخل داشته باشد. بنابراین ، از اهمیت ویژه ای برخوردار است که یک آزمایش کوتاه برای کودکان و نوجوانان در دسترس است. در اینجا ، ما چنین تست هایی را بر اساس ماتریس های مترقی متداول Raven (RPM) انجام می دهیم.
RPM یک آزمایش غیر کلامی است که به طور گسترده برای ارزیابی "توانایی شناختی عمومی" استفاده می شود (راون ، 1989). سه نسخه مختلف از دور در دقیقه وجود دارد ، ماتریس های پیشرونده استاندارد Raven (RSPM) ، ماتریس های مترقی رنگی (CPM) ، که آسان تر است ، و ماتریس های پیشرفته پیشرفته (APM) ، که دشوارتر است. RSPM اصلی 60 - مورد استفاده بیشترین نسخه است و می تواند برای همه گروه های سنی مورد استفاده قرار گیرد. هر مورد یک الگوی هندسی را با یک قطعه گمشده نشان می دهد. شرکت کنندگان باید گزینه پاسخ صحیح را که الگوی را تکمیل می کند ، انتخاب کنند. این آزمون شامل پنج مجموعه (A ، B ، C ، D و E) هر یک با 12 مورد است. هر مجموعه به تدریج دشوارتر می شود. در ابتدا در سال 1938 منتشر شد ، این آزمون طی سالها مورد تجزیه و تحلیل قرار گرفته است و به عنوان یک شاخص معتبر از توانایی شناختی عمومی در سراسر جهان در نظر گرفته می شود (Pind ، Gunnarsdóttir ، & Jóhannesson ، 2003 ؛ Raven ، 2000). اگرچه در استفاده از یک ابزار روان سنجی معتبر به خوبی مزایای زیادی وجود دارد ، اما یک محدودیت زمان طولانی مدت دولت است که اغلب برای جمعیت های رشد ممنوع است.
RSPM های کوتاه شده برای نمونه های بالغ پیشنهاد شده است. الست و همکاران(2013) یک نسخه کوتاه شده را با 36 مورد (مجموعه B، C، D) از RSPM ارزیابی کرد و Bilker و همکاران.( 2012 ) یک نسخه کوتاه از RSPM با تنها 9 مورد ایجاد کرد. با توجه به اینکه هر دو نسخه کوتاه بر اساس نمونه بزرگسالان بودند، ممکن است برای کودکان و نوجوانان مناسب نباشد. برای مثال، آیتمهای موجود در ستهای آسانتر (A، B) ممکن است در مقایسه با بزرگسالان (که احتمالاً همه این موارد را درست میدانند) برای امتیاز نهایی کودکان پیشبینیتر باشند. نسخه های کوتاه مشابهی برای CPM و APM وجود دارد (به عنوان مثال، آرتور و دی، 1994؛ بورز و استوکس، 1998؛ اسمیت، اسمیت، ون دن هوول، و جونکر، 1997)، اما هیچ یک از اینها در جمعیت های رشدی مشتق نشده اند. در نهایت، یک نسخه زمانبندیشده از RPSM با محدودیت زمانی 20 دقیقهای وجود دارد که در یک نمونه بزرگسال تایید شده است (Hamel & Schmittmann، 2006). با این حال، یک اشکال بالقوه نسخه زمان بندی شده این است که ممکن است به جای ساختار یک بعدی، ساختاری دو بعدی داشته باشد، یعنی توانایی و کارایی فکری، توانایی (Hamel & Schmittmann, 2006). در نتیجه، هیچ نسخه کوتاهی از RSPM در حال حاضر وجود ندارد که برای کودکان و نوجوانان مناسب باشد.
روش
مشخصات نمونه
ما داده های موجود را از چندین گروه تحقیقاتی درخواست کردیم. برای گروه سنی جوانتر (حدود 9 تا 12 سال)، ما یک مجموعه داده (298 = n) را از مطالعه اورول (یادگیری زبان شفاهی و نوشتاری) در دانشگاه آمستردام، هلند دریافت کردیم (ون کورت و همکاران، 2019).). مشخصات نمونه را می توان در جدول 1 یافت. در هلند، کودکان 9 تا 12 ساله صرف نظر از ظرفیتهایشان با هم به مدرسه میروند. بنابراین، ما انتظار داریم میانگین و واریانس توانایی شناختی عمومی نماینده جمعیت عمومی باشد.
میز 1
مجموعه داده ها را مرور کنید
مجموعه داده ها | ن | سن | امتیاز RSPM | |||||
---|---|---|---|---|---|---|---|---|
M (SD) | دقیقه | حداکثر | M (SD) | دقیقه | حداکثر | |||
گروه سنی جوان تر | مطالعه اورول | 289 | N. A. (N. A.)* | N. A.* | N. A. * | 37. 17 (6. 91) | 15 | 56 |
گروه سنی بالاتر | مجموعه داده 1 | 557 | 13. 14 (0. 36) | 12. 52 | 14. 55 | 44. 43 (6. 63) | 10 | 59 |
مجموعه داده 2 | 157 | 13. 99 (0. 39) | 12. 61 | 14. 65 | 44. 59 (6. 82) | 19 | 56 | |
مجموعه داده 3 | 273 | 14. 75 (0. 72) | 13. 03 | 17. 3 | 42. 15 (7. 45) | 11 | 58 | |
جمع | 987 | 13. 72 (0. 86) | 12. 52 | 17. 3 | 43. 83 (6. 97) | 10 | 59 |
N پس از حذف مقادیر از دست رفته محاسبه می شود.
برای گروه سنی بالاتر (حدود 13 تا 16 سال) ، ما سه مجموعه داده دریافت کردیم (1،071 = n ؛ به تأییدات مراجعه کنید). مشخصات نمونه در جدول 1 نشان داده شده است. بیشتر شرکت کنندگان (4 /82 ٪) از سطح مدرسه قبل از (کاربردی) دانشگاه در هلند (HAVO یا VWO) بودند. سایر شرکت کنندگان (6 /17 ٪) از سطح مدرسه قبل از ارتباطات در هلند (MAVO) بودند. توجه داشته باشید که در مجموعه داده سوم ، نسخه به موقع RSPM (Hamel & Schmittmann ، 2006) استفاده شده است ، و بنابراین ، داده ها ممکن است به جای یک ساختار یک بعدی ، یک ساختار دو بعدی داشته باشند.
شرکت کنندگان با مقادیر گمشده (گروه سنی جوانتر: N = 11 ، گروه سنی بالاتر: N = 43 ،) و کپی های موجود در مجموعه داده ها (گروه سنی جوانتر: N = 0 ، گروه سنی بالاتر: N = 4) از تجزیه و تحلیل خارج شدندوادبرای گروه سنی بالاتر ، شرکت کنندگان که از 12. 5 سال جوان تر بودند (37 نفر) نیز برای جلوگیری از همپوشانی در سنین مختلف در دو گروه سنی مختلف از مطالعه خارج شدند. موارد A1 و A2 (مورد اول و دوم مجموعه A) به عنوان موارد عملی در گروه سنی جوانتر مورد استفاده قرار گرفتند و به همین دلیل حذف شدند.
انتخاب مورد با رگرسیون مجازات
ما برای انتخاب زیر مجموعه ای از مواردی که می تواند نمره تست کل هر شرکت کننده را پیش بینی کند ، از رگرسیون مجازات استفاده کردیم. سپس این زیر مجموعه از موارد می تواند به جای RSPM 60 مورد استفاده شود. رگرسیون مجازات شده یک پارامتر مجازات و تنظیم را به مدل رگرسیون خطی اضافه می کند و از این طریق ضرایب موارد کمتر ضروری را به صفر کاهش می دهد (Tibshirani ، 1996 ؛ Zou & Hastie ، 2005). بنابراین ، ما زیر مجموعه ای از مواردی را بدست می آوریم که نمره کل در RSPM را پیش بینی می کند. رگرسیون مجازات نیاز دارد که ما یک پارامتر پنالتی (λ) را انتخاب کنیم. علاوه بر این ، ما باید یک پارامتر تنظیم (α) را انتخاب کنیم ، که تأثیر نسبی مجازات به اصطلاح خط الراس و لاسو را تعیین می کند. در پاراگراف بعدی توضیح داده شده است که چگونه این پارامترهای مجازات و تنظیم انتخاب می شوند. هنگامی که α برابر با یک است ، فقط از پنالتی لاسو استفاده می شود ، و هنگامی که α برابر با صفر است ، فقط از مجازات خط الراس استفاده می شود. مقدار بین صفر و یک به این معنی است که مجازات خالص الاستیک انتخاب می شود ، که به این ترتیب پنالتی لاسو و ریج را ترکیب می کند (Zou & Hastie ، 2005). تمام محاسبات در R با بسته GLMNET انجام شد (Friedman ، Hastie ، & Tibshirani ، 2010).
ما مجموعه داده های خود را به طور تصادفی در یک مجموعه توسعه (80 ٪) و اعتبار سنجی (20 ٪) تقسیم می کنیم (شکل 1). برای گروه سنی جوان (9-12) ، مجموعه اعتبار سنجی شامل 58 شرکت کننده و برای گروه سنی بالاتر (13-16) 199 شرکت کننده بود. به منظور یافتن بهترین پارامترهای مجازات و تنظیم (Lambda و Alpha) ، ما به طور تصادفی مجموعه توسعه را دوباره در یک مجموعه قطار (40 ٪) و مجموعه تست (40 ٪) تقسیم کردیم.
تقسیم مجموعه داده.
با هدف یافتن بهترین مقدار برای پارامترهای مجازات و تنظیم ، از الگوریتم نشان داده شده در شکل 2 استفاده کردیم. ابتدا یک مقدار اولیه را برای پارامترهای مجازات و تنظیم تنظیم می کنیم. دوم ، ما مدل رگرسیون مجازات شده را تخمین می زنیم. با این کار ، ما برای هر مورد ضریب به دست آوردیم. برخی از ضرایب به صفر کاهش یافته اند ، و بنابراین ، اینها در نسخه کوتاه اولیه گنجانده نشده اند. سوم ، ما همبستگی بین نسخه کوتاه اولیه و نسخه طولانی در مجموعه آزمون را بررسی کردیم (شکل 2). ما این الگوریتم را برای ترکیب های مختلف پارامترهای مجازات و تنظیم تکرار کردیم (λ = 2 تا 3. 5 ، α = 0. 5 تا 1). یک پارامتر پنالتی بالاتر وزن ضرایب بیشتر را به صفر می رساند. بنابراین ، یک پارامتر پنالتی بالاتر منجر به انتخاب موارد کمتری می شود. بنابراین ، با تغییر پارامترهای مجازات و تنظیم ، نسخه های کوتاه مختلفی را در تعداد موارد انتخاب شده متفاوت می کنیم. نسخه های کوتاه با طول یکسان ممکن است حاوی موارد مختلفی باشد. در نتیجه ، ما پارامترهای مجازات و تنظیم را انتخاب کردیم که منجر به نسخه کوتاه با بالاترین همبستگی در مجموعه آزمون می شود. به دلایل عملی (مدت زمان محدود ، محدوده توجه محدود) ، ما تصمیم گرفتیم که نسخه کوتاه ما نباید از طول 15 مورد تجاوز کند.
الگوریتم برای انتخاب بهترین پارامتر تنظیم.
اعتبار سنجی
ما در اعتبار سنجی همبستگی بین نمره جمع در فرم کوتاه نهایی و نمره جمع در نسخه اصلی 60 - را بررسی کردیم.
علاوه بر این ، ما یک تجزیه و تحلیل اضافی ، یعنی اعتبار سنجی متقاطع مونت کارلو انجام دادیم تا بررسی کنیم که آیا نتایج ما قوی است یا خیر. یعنی ما دوباره همان رویه را همانطور که در بالا توضیح داده شد فقط با یک تقسیم تصادفی متفاوت از قطار و مجموعه آزمون اعمال کردیم (شکل 3). به این معنی که ما توسعه خود را به طور تصادفی در یک قطار متفاوت و مجموعه آزمایش برای هر تکرار تقسیم می کنیم. پس از آن ، ما دوباره بهترین پارامترهای مجازات و تنظیم را همانطور که در بالا توضیح داده شد محاسبه کردیم. ما 100 بار این روش را دوباره امتحان کردیم و بررسی کردیم که آیا موارد مشابه انتخاب شده اند یا خیر.
اعتبار سنجی متقاطع مونت کارلو.
علاوه بر این ، ما اثرات کف و سقف را بررسی کردیم. بنابراین ، ما بررسی کردیم که آیا نسخه کوتاه ما برای دامنه توانایی پایین و بالا به خوبی اندازه گیری می کند یا خیر. بنابراین ، ما طرح چگالی نمره راون را در نسخه کوتاه بررسی کردیم. یک طرح چگالی کمرنگ در سمت چپ مستلزم این است که این آزمون ممکن است برای شرکت کنندگان که نمره پایین تر از میانگین دارند ، اندازه گیری خوبی نداشته باشد. به طور مشابه ، یک طرح چگالی کمرنگ به سمت راست مستلزم آن است که این آزمون برای شرکت کنندگان که بالاتر از حد متوسط نمره دارند ، اندازه گیری نمی کند ، که این نشان دهنده اثر سقف است.
در مرحله بعد ، ما بررسی کردیم که چگونه روش انتخاب شده ما در مقایسه با یک تکنیک سنت ی-مورد کاهش ، یعنی نظریه پاسخ به مورد ، عملکرد خوبی دارد (IRT ؛ Hambleton & Van der Linden ، 1982). لطفاً برای اطلاعات بیشتر در مورد انتخاب مورد با IRT ، به پیوست S1 مراجعه کنید.
سرانجام ، ما بررسی کردیم که چگونه فرم کوتاه توسعه یافته ما در مقایسه با 15 مورد منحصر به فرد به طور تصادفی انتخاب شده است. برای این منظور ، ما به طور تصادفی زیر مجموعه ای از 15 مورد منحصر به فرد را از 60 مورد انتخاب کردیم. پس از آن ، ما همبستگی بین فرم کوتاه تصادفی به دست آمده و فرم کامل در مجموعه اعتبار سنجی را بررسی کردیم. ما این 100 بار این کار را کردیم.
نتایج
رگرسیون مجازات شده
برای گروه سنی اول ، پانزده مورد زیر برای نسخه کوتاه انتخاب شده است: A12 ، B5 ، B9 ، B10 ، B11 ، C8 ، C9 ، D4 ، D5 ، D6 ، D7 ، D9 ، D10 ، E1 و E5. برای گروه سنی دوم ، موارد زیر انتخاب شدند: A6 ، B10 ، B12 ، C11 ، D1 ، D2 ، D4 ، D6 ، D9 ، D10 ، E2 ، E3 ، E4 ، E5 و E6. این نتیجه حاکی از آن است که برای جوانترین گروه سنی ، در مقایسه با قدیمی ترین گروه سنی ، موارد آسان تری درج شده است.
اعتبار سنجی
ما به طور تصادفی مجموعه داده های خود را در یک مجموعه داده توسعه و اعتبار سنجی تقسیم می کنیم. دومی در فرآیند ساخت و ساز مشارکت نداشت. برای جوانترین گروه سنی ، همبستگی بین نمره جمع در نسخه کوتاه و نمره جمع در نسخه اصلی 60 - 89/0 = r بود. برای قدیمی ترین گروه سنی ، همبستگی بین نمره جمع در نسخه کوتاه و نسخه اصلی 60 - 93/0 = r بود.
جدول 2 همبستگی مجموعه اعتبارسنجی بین نمره در نسخه کوتاه و نمره در نسخه اصلی 60 - را به عنوان تابعی از تعداد متفاوتی از موارد (طول) نشان می دهد. ما نیاز داشتیم که نسخه کوتاه نباید از 15 مورد تجاوز کند. در واقع ، جدول 2 نشان می دهد که شامل موارد بیشتر اطلاعات زیادی را اضافه نمی کند.
جدول 2
نمای کلی از طول های مختلف نسخه کوتاه
گروه سنی | لامبدا | الفا | همبستگی (اعتبار سنجی) | طول |
---|---|---|---|---|
گروه سنی جوان تر | 3. 15 | 0. 55 | 0. 93 | 20 |
2. 45 | 0.7 | 0. 92 | 19 | |
3.4 | 0. 55 | 0. 91 | 18 | |
2. 35 | 0.8 | 0. 90 | 17 | |
3.4 | 0.6 | 0. 90 | 16 | |
3. 15 | 0. 65 | 0. 89 | 15 | |
2. 95 | 0.7 | 0. 89 | 14 | |
2. 15 | 0. 95 | 0. 88 | 13 | |
3. 45 | 0. 65 | 0. 84 | 12 | |
2.8 | 0.8 | 0. 83 | 11 | |
گروه سنی بالاتر | 3.3 | 0. 55 | 0. 95 | 20 |
2. 15 | 0. 85 | 0. 95 | 19 | |
2 | 0.9 | 0. 95 | 18 | |
2. 85 | 0.7 | 0. 94 | 17 | |
2. 35 | 0. 85 | 0. 93 | 16 | |
2.2 | 0.9 | 0. 93 | 15 | |
3. 35 | 0. 65 | 0. 91 | 13 | |
2.9 | 0. 75 | 0. 91 | 12 | |
3.4 | 0.7 | 0. 90 | 11 |
برای بررسی بیشتر استحکام مجموعه موارد منتخب ما ، از اعتبار سنجی متقاطع مونت کارلو استفاده کردیم. همانطور که در شکل 4 مشاهده می شود ، بیشتر موارد حداقل 50 ٪ موارد انتخاب شده اند. فقط مورد D5 فقط در 4 ٪ موارد انتخاب شد. بنابراین ، اگرچه برخی از تنوع وجود دارد ، نشان می دهد که سایر نسخه های کوتاه ممکن است به همان اندازه عملکرد خوبی داشته باشند ، مجموعه ای از موارد انتخاب شده برای نسخه کوتاه نسبتاً سازگار است. شکل 4 نشان می دهد که چند بار یک مورد از 100 بار در نسخه کوتاه گنجانده شده است.
نتایج معتبر متقاطع مونت کارلو. مواردی که برای نسخه کوتاه استفاده می شوند به رنگ سیاه نشان داده شده اند.
برای بازرسی از اثرات بالقوه سقف ، شکل 5 نمودار چگالی نمره راون را در نسخه کوتاه و نسخه استاندارد نشان می دهد. نمره نسخه استاندارد به خصوص برای گروه سنی قدیمی تر به سمت راست است. این نشان می دهد که بسیاری از افراد به درستی به بسیاری از موارد پاسخ داده اند. فرم کوتاه ما این اثر را برای گروه سنی بالاتر به ارث می برد. بنابراین ، این احتمال وجود دارد که صرف نظر از استفاده از نسخه کوتاه یا طولانی ، یک اثر سقف در گروه سنی بالاتر ظاهر شود.
تراکم نمره کل راون در نسخه استاندارد (سمت چپ) و کوتاه (راست).
علاوه بر این ، ما نسخه کوتاه به دست آمده توسط رگرسیون مجازات شده را با نسخه کوتاه به دست آمده توسط IRT مقایسه کردیم (به پیوست S1 مراجعه کنید). در مجموعه اعتبار سنجی ، فرم کوتاه به دست آمده با پاسخ مورد همبستگی کمی پایین تر با نسخه اصلی 60 - (جوانترین گروه سنی r = 0. 88 ؛ گروه سنی بالاتر R = 0. 87 برای IRT در حالی که آنها 89/0 و 93 بودند. برای رگرسیون مجازات). علاوه بر این ، نسخه کوتاه به دست آمده توسط IRT دارای آلفای کرونباخ پایین تر از نسخه کوتاه به دست آمده توسط رگرسیون مجازات شده است (جوانترین گروه سنی α = 0. 65 ؛ گروه سنی بالاتر α = 0. 73 برای IRT در حالی که آنها برای رگرسیون مجازات 78 و 80 بودند.) ، که نشان می دهد نسخه کوتاه انتخاب شده توسط رگرسیون مجازات شده دارای قوام داخلی بالاتری است.
در نهایت، عملکرد فرم کوتاه توسعهیافته خود را با عملکرد یک زیرمجموعه 15 موردی بهطور تصادفی انتخاب کردیم. ما این کار را 100 بار انجام دادیم. برای گروه سنی جوانتر، میانگین همبستگی زیرمجموعههای انتخاب شده بهطور تصادفی 85/0 = r (77/0 حداقل، 93/0 = حداکثر) است. در اینجا، زیر مجموعه انتخاب شده ما با رگرسیون جریمه شده (r = 0. 89) از 94٪ موارد بهتر عمل می کند. برای گروه سنی بالاتر، میانگین همبستگی زیرمجموعه های انتخاب شده به طور تصادفی 85/0 = r است (72/0 حداقل، 91/0 = حداکثر). زیرمجموعه انتخاب شده ما با رگرسیون جریمه شده (r = 0. 93) از همه زیرمجموعه های انتخاب شده تصادفی بهتر عمل می کند. شکل 6 توزیع 100 همبستگی را در مقایسه با فرم کوتاه به دست آمده از رگرسیون جریمه نشان می دهد. این نشان میدهد که فرمهای کوتاه انتخابی ما بهتر از زیرمجموعهای از موارد انتخاب شده بهطور تصادفی عمل میکنند.
نمودار جعبه ای از همبستگی بین نسخه کوتاه و نسخه اصلی برای زیرمجموعه هایی از موارد که به طور تصادفی انتخاب شده اند. خط عمودی سیاه همبستگی یکسانی را برای فرم کوتاه به دست آمده با رگرسیون جریمه نشان می دهد.
بحث
We developed two short versions of the RSPM that showed high predictive validity of the score on the original 60‐item version ( r ’s >. 89). این نسخه ها شامل 15 مورد به جای 60 مورد بود که زمان مدیریت RSPM را کاهش می دهد. بنابراین، این نسخه های کوتاه می توانند با اطمینان توسط محققان توسعه ای که علاقه مند به داشتن یک پروکسی کوتاه اما قابل اعتماد برای توانایی شناختی عمومی به عنوان متغیر پس زمینه هستند، استفاده شوند.
ما نسخه کوتاه خود را با رویکرد اعتبار سنجی متقاطع تأیید کردیم. اکثر موارد حداقل در 50 درصد موارد انتخاب شدند. با این حال، برخی از موارد کاملا مشابه هستند. بنابراین، ممکن است برخی از آنها به راحتی قابل تعویض باشند. بیلکر و همکاران(2012) یک نسخه کوتاه 9 موردی را برای یک نمونه بزرگسال ایجاد کرد و به طور مشابه به این نتیجه رسید که ممکن است بیش از یک فرم کوتاه بهینه وجود داشته باشد. بنابراین، به نظر می رسد که انتخاب آیتم به تقسیم تصادفی قطار و مجموعه آزمایشی بستگی ندارد. با این حال، ممکن است ترکیبات بیشتری وجود داشته باشد که به عنوان یک نسخه کوتاه از RSPM کافی باشد.
ما رگرسیون جریمهشده را در یک تنظیم اعتبار متقابل بهعنوان یک تکنیک کاهش آیتم پیشنهاد کردیم. برای ارزیابی اینکه آیا این روش مناسبی است یا خیر، ما این روش را با یکی دیگر از روشهای شناخته شده کاهش آیتم IRT مقایسه کردیم. در واقع، ما دریافتیم که آیتمهای انتخابشده با رگرسیون جریمهشده، مقادیر پیشبینی بالاتری نسبت به آیتمهای انتخابشده توسط IRT نشان دادند.
چندین محدودیت احتمالی بحث را ایجاب می کند. یکی از محدودیتهای مطالعه ما این است که اکثریت نمونه (86%) از گروه سنی بالاتر (16-13) ترکیبی از دانشآموزان سطح متوسط و پیش دانشگاهی بودند که به این معنی است که موارد انتخاب شده ممکن است کمتر باشد. نماینده برای دانش آموزان سطح متوسطبرای تحقیقات آینده، ممکن است جالب باشد که افراد از سایر سطوح مدرسه، عمدتاً دانشآموزان مدارس پیشحرفهای را در بر گیرد.
دوم، نسخه اصلی 60 موردی RSPM جلوه های سقف را نشان می دهد. پیند و همکاران(2003) هنجارهای مدرسه را بررسی کرد و اثرات سقف را در کلاس های دبیرستان ایسلند (دانش آموزان حدودا 13 تا 16 ساله) گزارش کرد. آنها به این نتیجه رسیدند که این آزمون فقط برای کودکان هفت کلاس اول (سن دانش آموزان در حدود 6 تا 13 سال) مناسب است. ریون (2000) اثرات سقف را نیز در میان بزرگسالان جوان گزارش کرد. باید توجه داشته باشیم که نسخه کوتاه ما برای گروه سنی بالاتر به احتمال زیاد این اثر سقفی را به ارث برده است. بنابراین، برای تحقیقات آینده، به منظور تمایز قائل شدن بین توانایی شناختی عمومی در یک نمونه نوجوان بالاتر از حد متوسط، توصیه میکنیم نسخه کوتاهی برای ماتریسهای پیشرونده پیشرفته Raven نیز ایجاد کنید.
سوم، به دلیل تعداد کمتر موارد، شرکت کنندگان نمی توانند قبل از رسیدن به موارد دشوارتر در نسخه های کوتاه، با آیتم های آسان تمرین کنند. این ممکن است امتیاز آنها را در نسخه کوتاه کاهش دهد. از سوی دیگر، این ممکن است منجر به خستگی و/یا کسالت کمتری نیز شود (Gonthier & Roulin, 2019). در تحقیقات آینده، بررسی اینکه آیا عملکرد در نسخه های بلند و کوتاه متفاوت است یا خیر، ممکن است ارزشمند باشد.
در آخر، ما تستی را توسعه دادیم که می تواند به عنوان یک آزمون کاغذی-مدادی برای ارزیابی توانایی شناختی در نوجوانان استفاده شود. این مزیت را دارد که استفاده از آزمون آسان است، اما ممکن است فرصتهایی را که نیاز به اجرای آزمون روی رایانه دارند، از دست بدهد. در تحقیقات آتی، توسعه یک فرم کوتاه بر اساس تست تطبیقی کامپیوتری ممکن است مفید باشد. تست تطبیقی کامپیوتری به صورت پویا مورد بعدی را بر اساس پاسخ شرکتکننده در مورد قبلی انتخاب میکند. Makransky، Dale، Havmose، and Bleses (2016) از تست تطبیقی کامپیوتری برای ایجاد فرم کوتاهی از فهرست توسعه ارتباطی مک آرتور-بیتس استفاده کردند و شواهد قوی یافتند که این میتواند ابزار مفیدی برای کاهش طول آزمون باشد.
برای نتیجه گیری، ما دو نسخه کوتاه از RSPM را توسعه دادیم. ما این کار را برای کودکان و نوجوانان جداگانه انجام دادیم. نسخه های کوتاه، متشکل از 15 به جای 60 مورد، نمره آزمون تمام طول را تا حد زیادی پیش بینی می کنند، و بنابراین می توانند در تحقیقات رشدی که توانایی شناختی عمومی به عنوان یک متغیر پس زمینه ارزیابی می شود، استفاده شوند.
تضاد علاقه
همه نویسندگان هیچ تضاد منافعی را اعلام نمی کنند.
مشارکت نویسنده
آنا ماریا لانگنر، M. Sc. اقتصاد، کارشناسی ارشد. روانشناسی (تحقیق) (تحقیق دادهها؛ تحلیل رسمی؛ روششناسی؛ نرمافزار؛ تجسم؛ نوشتن – پیشنویس اصلی؛ نگارش – بررسی و ویرایش) آن ویل کرامر (مفهومسازی؛ مدیریت داده؛ تحقیق؛ مدیریت پروژه؛ منابع؛ نظارت؛ اعتبارسنجی؛ نگارش– بررسی و ویرایش) Wouter van den Bos (مفهومسازی؛ منابع؛ نظارت؛ اعتبارسنجی؛ نوشتن – بررسی و ویرایش) هیلد هویزنگا (مفهومسازی؛ کسب سرمایه؛ نظارت؛ اعتبارسنجی؛ نوشتن – بررسی و ویرایش).
اطلاعات پشتیبانی
ضمیمه S1 انتخاب آیتم با نظریه پاسخ آیتم.
قدردانی ها
ما از مطالعه اورول (یادگیری زبان شفاهی و نوشتاری) در دانشگاه آمستردام هلند (ون کورت و همکاران، 2019) برای به اشتراک گذاشتن دادههای Raven جمعآوریشده با ما که برای توسعه نسخه کوتاه برای سنین پایینتر استفاده کردیم، تشکر میکنیم. گروهعلاوه بر این، ما از دکتر لیدیا کراببندام، دکتر نیکی لی، دکتر ماریات ون بورن، میریام هولارک، روبس والش، هستر سیتسما، ربکا ون راین و نیکی لوت برای به اشتراک گذاشتن دادههای Raven جمعآوریشدهشان با ما تشکر میکنیم. نسخه کوتاه برای گروه سنی بزرگتر (تیم #Soconnect).
بیانیه در دسترس بودن داده ها
اشتراک داده ها برای این مقاله قابل استفاده نیست زیرا هیچ داده جدیدی در این مطالعه ایجاد نشده است.