لقد قرأت الكثير من الأبحاث التقييمية خلال العام الماضي، ولا تزال هناك ورقة بحثية واحدة تسحبني إلى الوراء. الأمر لا يتعلق بالذكاء الاصطناعي. تمت كتابته قبل أن يغير ChatGPT طريقة تفكير كل معلم في الامتحانات والمقالات. ولكن كلما عدت إلى ذلك، كلما رأيته يتحدث مباشرة إلى اللحظة التي نعيشها جميعًا.

الورقة هي تاي وعجاوي وبيرمان وبود وداوسون وجوري دي سانت جوريس (2023) التقييم من أجل الإدماج، نشرت في البحث والتطوير في التعليم العالي. وحجتهم بسيطة وغير مريحة: تصميم التقييم ليس محايدًا على الإطلاق. كل خيار نتخذه بشأن ما يفعله الطلاب، وكيف وأين وتحت أي ظروف، سيشمل بعض المتعلمين ويدفع آخرين بعيدًا عن العمل الذي نقول إننا نقيسه.

إنني أعيد استخدام الورقة هنا لأن معظم خطوات التقييم “المقاومة للذكاء الاصطناعي” التي يسعى إليها المعلمون في عام 2026 تستبعد الطلاب الخطأ بصمت، حتى عندما لا يقصدهم أحد. يجذب هذا المنشور عدسة Tai وآخرين إلى محادثة الذكاء الاصطناعي ويمنحك إستراتيجيات عملية يمكنك تجربتها في فصلك الدراسي هذا الفصل الدراسي.

لماذا التقييمات “المقاومة للذكاء الاصطناعي” غالبًا ما تؤذي الطلاب الخطأ

عندما بدأ الذكاء الاصطناعي التوليدي في كتابة المقالات لطلابنا، استخدم معظمنا نفس الرافعة. لقد قمنا بنقل التقييمات مرة أخرى إلى الغرفة، وأعدنا اختبارات الكتاب المغلق المكتوبة بخط اليد، وأضفنا مواعيد نهائية لجلسة واحدة، وقمنا بتثبيت المراقبة عن بعد مع تتبع العين. أضاف البعض منا عروضًا تقديمية شفهية، لأنه بالتأكيد لا يستطيع الذكاء الاصطناعي تزييفها.

وهنا ما تاي وآخرون. سيقول عن هذه الخطوة. يفترض كل واحد من هذه الاختيارات نوعًا معينًا من الطلاب: عصبيون، يجيدون لغة التدريس، لا يشعرون بالقلق تحت ضغط الوقت، دون مسؤوليات رعاية، يتمتعون بصحة مستقرة، ويتمتعون بمهارات حركية دقيقة قوية. إذا كان طالبك لا يتناسب مع هذا الملف التعريفي، فإن التقييم لا يقيس ما تعتقد أنه هو. إنه يقيس مدى قربهم من هذا التخلف عن السداد.

وقد قال المؤلفون ذلك بوضوح: “الخيارات في تصميم التقييم ليست محايدة أبدًا، حيث أن كل منها قد يعزز أو يقيد الإدماج بشكل مختلف، ويؤثر على أشخاص مختلفين” (ص493).

إن المعلم الذي يتحول إلى اختبار مكتوب بخط اليد محدد بوقت لإبعاد الذكاء الاصطناعي، هو، دون قصد، يخبر الطالب الذي يعاني من حالة ألم مزمن، ومقدمة الرعاية التي يتعين عليها الابتعاد عن جهاز الكمبيوتر المحمول الخاص بها لاصطحاب طفل، والطالب الذي يتجمد في مكانه يوم الاختبار أن هذا ليس مناسبًا لهم حقًا.

من الغش إلى صلاحية التصميم

التحرك الأعمق في تاي وآخرون. هو إعادة الصياغة. ويجادلون بأن هذه مشكلة تتعلق بصلاحية التصميم، وليست مشكلة غش.

السؤال الذي يجب طرحه بسيط. ما الذي يقيسه تقييمك فعليًا؟ إذا كانت نتيجة التعلم هي تحليل مصدر أساسي، فيجب أن يقيس الاختبار تحليل المصدر الأساسي. إذا كان امتحانك الكتابي المغلق والمكتوب بخط اليد ومدته تسعون دقيقة يقيس أيضًا سرعة الكتابة اليدوية وطلاقة اللغة الإنجليزية الأصلية والتذكر تحت الضغط ورباطة الجأش في غرفة هادئة مليئة بالغرباء، فإن الاختبار هو الحكم على الطلاب بناءً على أشياء لم تخطط أبدًا لتدريسها.

الحل، على حد تعبير تاي وآخرين، هو إعادة تصميم الاختبار، وليس الطالب.

تنطبق هذه الحجة على الأعمال الحديثة أيضًا. وقد أوضح داوسون وزملاؤه (2024) أن الصحة، وليس الغش، هي التي يجب أن تقود تصميم التقييم. أظهر نيمينن وإيتون (2024) كيف أن أماكن الإقامة نفسها غالبًا ما يتم تصنيفها على أنها غش، مما يؤدي إلى تفاقم الاستبعاد الذي أنشأه التقييم بالفعل. وسلسلة الأدلة تتقارب على نفس النقطة.

إذًا كيف يمكنك فعلًا القيام بهذا العمل في الفصل الدراسي؟ هذا هو المكان الذي يعيش فيه بقية هذا الدليل.

استراتيجيات عملية يمكنك تجربتها في الفصل الدراسي الخاص بك

هذه ليست تحركات نظرية. إنها أشياء قام بها المعلمون الذين عملت معهم، والتي يدعمها بحث التقييم.

1. قم بمراجعة ما يقيسه تقييمك بالفعل

قبل أن تعيد تصميم أي شيء، قم بسحب تقييم حالي واحد واكتب عمودين. على اليسار، نتائج التعلم التي تقول أنك تقيسها. على اليمين، كل شيء آخر يتطلبه التقييم فعليًا. إذا كانت النتيجة هي “يمكن للطلاب بناء حجة تاريخية من المصادر الأولية”، وكان الاختبار يتطلب منهم القيام بذلك يدويًا، في خمسين دقيقة، بلغتهم الثانية، فقد وجدت للتو ثلاثة أشياء يحكم عليهم الاختبار بصمت عليها. ثلاثة أشياء أخرى لم تقل أبدًا أنك ستعلمها.

2. افتح الوضع

امنح الطلاب طرقًا متعددة لإظهار نفس النتيجة. يمكن للطالب الذي يُظهر أنه قادر على تحليل قصيدة أن يكتب مقالًا قصيرًا، أو يسجل تحليلًا منطوقًا مدته خمس دقائق، أو ينشئ مجموعة شرائح مع التعليق الصوتي. يبقى البناء على حاله. يفتح الوضع. تعالج هذه الخطوة مجموعة واسعة من مشكلات الوصول دون الحاجة إلى تصنيف أي طالب على أنه “بحاجة إلى سكن”.

3. استخدم المهام الحقيقية

تاي وآخرون. أشر إلى التقييم الحقيقي، وهي المهام التي تعكس ما يفعله المحترفون فعليًا، باعتبارها واحدة من التصاميم الأكثر شمولاً. تميل المهام الواقعية إلى السماح بصياغة المصادر ومراجعتها واستشارة المصادر واستخدام الأدوات (بما في ذلك الذكاء الاصطناعي) بالطريقة التي يفعلها البالغون العاملون بالفعل. كما أنها تنتج أعمالًا يصعب على الذكاء الاصطناعي تزييفها بشكل مقنع لأنها تتطلب سياقًا عاشه الطالب فقط.

4. قم بتقييم العملية، وليس المنتج فقط

اطلب من الطلاب إرسال مسودات أو ملاحظات توضيحية أو تفكير قصير حول اختياراتهم أو شرح صوتي بجانب القطعة النهائية. أنت الآن تقوم بتقييم التفكير، وليس فقط القطعة الأثرية. ويعمل هذا ضد اختصارات الذكاء الاصطناعي وضد نوع الامتحانات عالية الضغط المكونة من جلسة واحدة والتي تستبعد الطلاب القلقين أو المصابين بأمراض مزمنة. عصفورين، إعادة تصميم واحد.

5. قم بتمديد النافذة الزمنية

ابتعد عن التقييمات ذات الجلسة الواحدة واليوم الواحد أينما يسمح منهجك الدراسي بذلك. إن أخذها إلى المنزل لمدة أسبوع مع تسجيلات الوصول الهامة يمنح مقدمي الرعاية والطلاب الذين يعانون من ظروف صحية والطلاب الذين يحتاجون إلى تركيز هادئ وغير متسرع فرصة عادلة في العمل. يعد هذا واحدًا من أكثر أدوات التضمين استخدامًا في الغرفة.

6. حاول التقييم من أجل التميز

تاي وآخرون. وصف نهج يسمونه تقييم التميز. ويطلب من الطلاب إظهار ما يجعل تفكيرهم تفكيرهم: اتصال شخصي، ومثال محلي، وزاوية فريدة. هذا هو التصميم النادر المقاوم للذكاء الاصطناعي (يمكن للذكاء الاصطناعي تقليد الأسلوب، لكنه لا يمكنه التحقق من تجربة معينة للطالب) وشامل (كل طالب لديه زاوية مميزة إذا قمت بتوفير مساحة لها).

7. إعادة النظر في التقييم الشفهي

العروض الشفهية العامة مفيدة لبعض الطلاب. فهي تعذيب للآخرين، وخاصة الذين يعانون من القلق، أو اختلافات في النطق، أو اختلافات في التواصل الاجتماعي. إذا كنت تريد تقييمًا شفهيًا، فكر في إجراء محادثات فردية، أو تسجيلات فيديو غير متزامنة، أو حوارات جماعية صغيرة. وستحصل على نفس البنية، مع عقوبة أقل بكثير على الأداء العام.

8. ألق نظرة فاحصة على تكنولوجيا المراقبة

تفترض مراقبة الذكاء الاصطناعي مع تتبع العين ومراقبة ضغطات المفاتيح وتسجيل الشاشة سلوكًا عصبيًا. إنه يخلق ضررًا حقيقيًا للطلاب المصابين بالتوحد، والطلاب الذين يعانون من التشنجات اللاإرادية، والطلاب الذين يعانون من القلق، والطلاب الذين ليست بيئتهم المنزلية عبارة عن مكتب خاص هادئ. قبل تبني أي من هذا، اسأل طائي وآخرين: من يحمي هذا، ومن يستبعد؟

9. فكر بشكل برمجي خلال الدورة التدريبية

هذا هو أسلوب التصميم الثالث لتاي وآخرين، وهو الأسلوب الذي يتجاهله معظم المعلمين. الفكرة بسيطة. لا يلزم اختبار كل نتيجة تعليمية في كل تقييم. إذا كنت تقوم بالتدريس على مدار فصل دراسي أو عام، فيمكنك نشر تقييمك، على سبيل المثال، لمهارات البحث والتحليل النقدي والتواصل الواضح عبر مهام مختلفة في أوقات مختلفة، كل واحدة منها مصممة لما تفعله بشكل أفضل. يحصل الطالب الذي يتجمد في أحد الأوضاع على فرص أخرى لإظهار نفس المهارة في وضع آخر. يعد إعداد هذا أصعب من إعادة التصميم لمرة واحدة، ولكنه يعود عليك بالفائدة في كل مرة كان من الممكن أن يسقط فيها الطالب في اختبار واحد.

10. اجعل البناء مرئيًا للطلاب

أخبر طلابك، بصوت عالٍ، بما يقيسه التقييم وما لا يقيسه. “هذه المهمة هي قياس مدى قدرتك على بناء حجة من الأدلة. وهي لا تقيس مدى السرعة التي يمكنك الكتابة بها، أو مدى الثقة التي يمكنك تقديمها، أو مدى إتقان قواعدك النحوية.” هذه الجملة الواحدة تعمل على التضمين من تلقاء نفسها. فهو يخبر الطلاب بما يجب التركيز عليه، ويقلل من القلق بشأن الأشياء الخاطئة، ويمنحهم أسبابًا للتحدث إذا كان عنوان التقييم يتعارض مع البناء بصمت.

تدقيق بسيط يمكنك إجراؤه هذا الأسبوع

إذا لم تفعل شيئًا آخر بعد قراءة هذا، فجرب شيئًا واحدًا. اختر تقييمًا واحدًا ستقدمه في الشهر التالي. اطبعها. قم بتسليط الضوء بلون واحد على نتائج التعلم التي تريد قياسها بالفعل. قم بتمييز كل شيء آخر يتطلبه الاختبار بصمت بلون آخر. ثم انظر إلى مقدار الصفحة التي تحتوي على لون خاطئ. هذه هي مشكلة صلاحية التصميم لديك، وهي أيضًا نقطة البداية.

نصائح للبدء

1. ابدأ بتقييم واحد. لا تحاول إصلاح كل شيء دفعة واحدة. إعادة تصميم مدروسة واحدة تستحق عشرة تصميمات مستعجلة.

2. خريطة النتائج مقابل المتطلبات. قم بإدراج ما يفترض أن يقيسه التقييم، ثم قم بإدراج كل الأشياء الأخرى التي يتطلبها التقييم بالفعل. الفجوة هي عملك.

3. افتح الوضع حيثما تستطيع. اسمح للطلاب بالاختيار بين الإجابات المكتوبة أو الصوتية أو المرئية عندما تسمح النتيجة بذلك. البناء لا يتغير.

4. البناء قيد التنفيذ. اطلب مسودات أو ملاحظات أو تفكيرًا قصيرًا بجانب المنتج النهائي. عليك تقييم التفكير، وليس فقط الإخراج.

5. قم بتمديد الجدول الزمني. استبدل اختبارات الجلسة الواحدة بالمهام ذات الإطارات وتسجيلات الوصول المهمة. يلاحظ مقدمو الرعاية والطلاب الذين يعانون من ظروف صحية ذلك على الفور.

6. الثبات على الأصالة. استخدم مهام العالم الحقيقي التي تستفيد من السياق الذي عاشه الطالب فقط. يكافح الذكاء الاصطناعي لتزييف ذلك.

7. شارك في بناء نموذج التقييم. شارك ما يهم قبل أن يبدأ الطلاب العمل، ويفضل أن يكون ذلك من خلال مدخلاتهم. الشفافية تقلل من القلق وتحسن الأداء.

8. قم بمراجعة التكنولوجيا الخاصة بك. قبل اعتماد أي أداة للمراقبة أو المراقبة، اسأل من سيضر بها. إذا كانت الإجابة تشمل طلابك الأكثر ضعفًا، فابحث عن طريقة أخرى.

الأفكار النهائية

إن ذعر الذكاء الاصطناعي لن يختفي، والضغط من أجل إغلاق التقييمات حقيقي. لكن الإغلاق نادرًا ما يبقي الذكاء الاصطناعي خارجًا، كما أنه يدفع الطلاب الضعفاء بشكل روتيني بعيدًا عن العمل. إن حجة تاي وآخرين، المكتوبة قبل أي من هذه النتائج، تعطينا سؤالًا أفضل لتنظيم المحادثة حول: ما الذي أقيسه بالفعل، ومن الذي أشمله أو أستبعده في الطريقة التي أقيس بها؟

لا تحتاج إلى نظام جديد مثالي. يجب أن تبدأ بتقييم واحد، وإعادة تصميم واحدة، وخطوة إدراج واحدة في كل مرة. العمل يستحق ذلك لأن الطلاب كذلك.

مراجع

  • داوسون، بي، بيرمان، إم، دولينجر، إم، وبود، د. (2024). الصلاحية أهم من الغش. التقييم والتقييم في التعليم العالي.
  • نيمينين، جيه إتش، وإيتون، SE (2024). هل أماكن الإقامة غش؟ تحليل سياسي نقدي. البحث والتطوير في التعليم العالي.
  • تاي، ج.، عجاوي، ر.، بيرمان، م.، بود، د.، داوسون، ب.، وجور دي سانت جور، ت. (2023). التقييم من أجل الإدماج: إعادة التفكير في الاستراتيجيات المعاصرة في تصميم التقييم البحث والتطوير في التعليم العالي، 42(2)، 483-497. https://doi.org/10.1080/07294360.2022.2057451


اكتشاف المزيد من موقع كوكان - تعليم

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

شاركها.
اترك تعليقاً