: آخر تحديث
"الهندسة الاجتماعية" رعب يلاحق البشرية

لحظة فارقة.. نموذج الذكاء الاصطناعي GPT-4.5 تفوق على البشر

6
6
6

إيلاف من نيويورك: توصلت دراسة جديدة إلى أن نموذج الذكاء الاصطناعي GPT-4.5، الذي طورته OpenAI، لم يكتفِ باجتياز اختبار تورينج فحسب، بل تفوّق أيضًا على البشر في إقناع المشاركين بإنسانيته.

هذا الاكتشاف، الذي نُشر في ورقة بحثية أولية بانتظار مراجعة الأقران، يمثل تحولًا جذريًا في العلاقة بين الإنسان والآلة، ويثير تساؤلات جوهرية حول مستقبل الذكاء الاصطناعي ومكانته في المجتمع.

اختبار تورينج، الذي صممه عالم الحوسبة البريطاني آلان تورينج عام 1949، يُعد معيارًا كلاسيكيًا لقياس مدى "تشابه" الآلة بالإنسان. ويعتمد الاختبار على قدرة الذكاء الاصطناعي في إجراء محادثة مع شخص دون أن يتمكن المتلقي من تحديد ما إذا كان يتحدث مع آلة أم إنسان.

في هذه الدراسة، أجرى باحثون من جامعة كاليفورنيا نسخة محدثة من اختبار تورينج، حيث تفاعل المشاركون مع كلٍّ من إنسان حقيقي ونموذج ذكاء اصطناعي، ثم طُلب منهم تحديد من هو الإنسان.

وعندما مُنح GPT-4.5 شخصية محددة ليتقمصها – مثل "شاب مثقف وواعٍ ثقافيًا" – اعتقد المشاركون أنه إنسان في 73% من الحالات. وهي نتيجة تفوق بكثير النسبة العشوائية المتوقعة التي تبلغ 50%.

لكن اللافت أكثر هو أن أداء النموذج تراجع إلى 36% فقط عندما لم يُمنح أي "شخصية" يتقمصها، ما يبرز أهمية السياق والتمثيل السردي في تقنيات الذكاء الاصطناعي الحديثة. في المقابل، سجل النموذج GPT-4o من OpenAI نسبة 21% فقط، في حين حصل الروبوت ELIZA، الذي يعود إلى ستينيات القرن الماضي، على 23%، وفقا لمجلة " نيوزويك".

وعلق كارستن يونغ، رئيس قسم الاقتصاد الكلي والذكاء الاصطناعي في معهد أبحاث السياسات العامة، على النتائج بقوله: "لقد وصل الذكاء الاصطناعي إلى مستوى لم يعد الناس قادرين فيه على تمييزه عن البشر في المحادثات النصية. بل تُظهر هذه الدراسة أن الآلة قد تبدو أكثر إنسانية من الإنسان نفسه". وذلك لما نقلته صحيفة "البيان".

وأضاف: "لقد تجاوزنا 'الوادي الغريب' الذي كانت فيه الروبوتات تُشبه البشر بشكل غير مريح، ودخلنا مرحلة جديدة تمامًا. الذكاء الاصطناعي بات يُستخدم اليوم في العلاج، والدعم النفسي، وحتى الرفقة، وقد يغير جذريًا طريقة تواصلنا عبر الإنترنت".

وتابع يونغ أن السياسات الحكومية لا تزال متأخرة عن هذا التطور المتسارع، مؤكدًا على الحاجة إلى تحديثات تشريعية وتنظيمية تواكب قدرات الذكاء الاصطناعي الحديثة.

وفي تعليق منفصل، كتب الباحث كاميرون جونز عبر منصة X: "تُظهر هذه النتائج أن أنظمة الذكاء الاصطناعي قد تتمكن من أداء مهام بشرية – مثل تقديم الاستشارات القانونية أو التفاعل الاجتماعي – دون أن يدرك الآخرون أنهم لا يتحدثون مع شخص حقيقي".

وحذر جونز من أن هذا التقدم قد يؤدي إلى تغيّرات جذرية في سوق العمل، وزيادة خطورة هجمات الهندسة الاجتماعية، وحتى اضطرابات اجتماعية واسعة.

ما هو اختبار تورينج؟
اختبار تورينج هو تجربة فكرية اقترحها عالم الرياضيات والحوسبة البريطاني آلان تورينج عام 1950 في ورقته الشهيرة "Computing Machinery and Intelligence".

هدف الاختبار..  معرفة ما إذا كانت الآلة قادرة على إظهار سلوك ذكي لا يمكن تمييزه عن سلوك الإنسان.

كيف يعمل؟.. يتم وضع إنسان (الحكم) في محادثة نصية مع طرفين مخفيين: أحدهما إنسان والآخر آلة (ذكاء اصطناعي).

إذا لم يتمكن (الحكم) من التمييز بدقة بين الآلة والإنسان بناءً على المحادثة، فإن الآلة تُعتبر "ذكية" حسب معايير الاختبار.

ما الجديد في اختبار GPT-4.5؟ .. في الدراسة الحديثة، طُبِّقت نسخة معدّلة من اختبار تورينج التقليدي، أكثر واقعية ودقة، وجاءت بتغييرات أساسية:

1. مشاركة نماذج متعددة:

تمت مقارنة GPT-4.5 بنماذج مختلفة:

GPT-4o (أحدث إصدار مفتوح من OpenAI)

LLaMA 3.1–405B (من Meta)

ELIZA (أول روبوت محادثة من الستينيات)

2. إضافة "شخصية" للنموذج:

عندما أُعطي GPT-4.5 شخصية مثل "شاب مثقف وواعٍ ثقافيًا"، زادت قدرته على الإقناع بدرجة كبيرة.

النتيجة: تم التعرف عليه بالخطأ كإنسان في 73% من الحالات.

3. وضع بدون شخصية:

عند إزالة الشخصية والتفاعل بشكل عام، تراجعت النتيجة إلى 36% فقط.

4. معيار المقارنة:

المعدل المتوقع عشوائيًا هو 50%.

أي نتيجة أعلى من 50% تعني أن الذكاء الاصطناعي أقنع البشر بإنسانيته أكثر من البشر أنفسهم.

لماذا يعتبر ذلك إنجازًا؟
تاريخيًا: لم يكن أي نموذج سابق يتجاوز البشر في هذا الاختبار.

نفسيًا واجتماعيًا: أصبح الناس يرون الذكاء الاصطناعي أكثر "إنسانية" من الإنسان، عند تقديمه بالشكل المناسب.

تقنيًا: يُظهر أهمية تصميم السياق والشخصيات في أداء الذكاء الاصطناعي.

أمنيًا: قد يؤدي إلى استخدام الذكاء الاصطناعي في الهندسة الاجتماعية أو التلاعب النفسي.


عدد التعليقات 0
جميع التعليقات المنشورة تعبر عن رأي كتّابها ولا تعبر بالضرورة عن رأي إيلاف
لم يتم العثور على نتائج


شروط النشر: عدم الإساءة للكاتب أو للأشخاص أو للمقدسات أو مهاجمة الأديان أو الذات الالهية. والابتعاد عن التحريض الطائفي والعنصري والشتائم.

في اقتصاد