موقع اوراق:كيف يمكن تمييز النصوص المكتوبة بواسطة تطبيقات الذكاء الصناعي؟

أصبح البشر، في الآونة الأخيرة، يستخدمون تطبيقات الذكاء الصناعي في كتابة أكواد الكمبيوتر وتلخيص المقالات والكتب بل وتقديم المشورة، وصار البعض يستخدمونها في توليد نصوص مكتوبة من العدم، مع إضافة بعض الكلمات أو اللمسات اللغوية لإضفاء صبغة شخصية على النص المكتوب.

ليس من المستغرب أن تمثل هذه الظاهرة الجديدة إشكالية للمدرسين والمشرفين الذين يتم تكليفهم بتقييم القدرات الكتابية لطلابهم، كما أنها تثير قلق بعض الأشخاص الذين يطلبون المشورة فيما يتعلق بمشكلاتهم النفسية والاجتماعية على بعض المنتديات المتخصصة، أو يسعون للحصول على رأي فني بخصوص منتج أو سلعة ما قبل الإقدام على الشراء.

يقول الباحث روجر كرويتس، أخصائي علم النفس بجامعة ممفيس الأمريكية، إنه خلال السنوات القليلة الماضية، عكف الباحثون والمتخصصون على محاولة استكشاف مدى إمكانية تمييز النص الذي يكتبه البشر عن النص المصنوع بواسطة تطبيقات الذكاء الصناعي على اختلاف أنواعها، وأشار في مقال نشره الموقع الإلكتروني The Conversation المتخصص في المقالات البحثية إلى أن العديد من الدراسات التي أجريت مؤخرا سلطت الضوء على صعوبة التعرف على النصوص المكتوبة بواسطة برامج الذكاء الصناعي. وقد أكدت دراسة أجريت في العام 2021 على الانترنت، أن المشاركين لم يستطيعوا التمييز بين قصص ومقالات صحافية ووصفات لمأكولات معينة كتبها بشر أو صاغتها تطبيقات الذكاء الصناعي.

أشار كرويتس إلى أن خبراء اللغة لم يحققوا أداء أفضل في التعرف على النصوص المصنوعة بواسطة الذكاء الصناعي. وخلال دراسة أخرى أجريت عام 2023، لم يستطع مجلس تحريري يضم كبار الصحافيين المتخصصين في علوم اللغويات تحديد مسودات المقالات التي وضعها كتاب بشر وتمييزها عن المسودات التي صاغها تطبيق “تشات جي.بي.تي”، وتوصلت دراسة ثانية أجريت في العام 2024 أن المصححين بإحدى الجامعات البريطانية لم يستطيعوا اكتشاف 94% من الإجابات التي أعدها تطبيق “تشات جي.بي.تي”.

يرى كرويتس أن استخدام بعض المفردات غير المعتادة أو النادرة في النص قد تكون مؤشرا لتحديد هوية الكاتب ومعرفة ما إذا كان من البشر أو من تطبيقات الذكاء الصناعي. وقد رصد المتخصصون بالفعل زيادة ملحوظة في استخدام بعض الألفاظ غير الشائعة في الأوراق البحثية خلال السنوات القليلة الماضية مثل delves وتعني “يتعمق” وكلمة crucial وتعني “مهم”، ومن المعتقد أن استخدام مثل هذه المفردات هو مؤشر على أن تلك النصوص هي من صياغة بعض تطبيقات الذكاء الصناعي، وهو ما يظهر أن بعض الباحثين اعتادوا مؤخرا على كتابة أو تحرير أجزاء من أوراقهم البحثية بواسطة مثل هذه التطبيقات.

أعرب المشاركون في استطلاع لتحديد أهم السمات التي تميز النصوص المكتوبة بواسطة تطبيقات الذكاء الصناعي عن اعتقادهم أن الإفراط في استخدام بعض علامات الترقيم مثل الشرطة السفلية، التي توضع للفصل بين عبارات أو أفكار معينة أثناء الكتابة قد يكون من المؤشرات الدالة على النصوص المصنوعة بواسطة التطبيقات الإلكترونية. ويرى الباحثون أن السبب وراء هذا الاعتقاد أن استخدام مثل هذه النوعية من علامات الترقيم لا يتم إلا بواسطة الكتاب المتمرسين، وبمعنى آخر، ربما يسود اعتقاد أن النص المكتوب بشكل “جيد جدا” هو على الأرجح من تأليف أحد تطبيقات الذكاء الصناعي.

يقول كرويتس إنه من الممكن محاولة التمييز بين النصوص المكتوبة بواسطة البشر أو التطبيقات الإلكترونية من خلال ما يعرف باسم علم “القياس الأسلوبي” Stylometry الذي يعتمد على تطبيق أساليب إحصائية ولغوية حاسوبية لتحليل النص المكتوب. وفي هذا السياق، ابتكر الباحث الأسترالي جون بوروز المتخصص في علم “الأسلوبية الحاسوبية” تطبيقا حوسبيا يعرف باسم Burrows Detla. ويعتمد هذا الطبيق على قياس مدى تكرار الألفاظ الشائعة والمفردات نادرة الاستخدام في نص معين، كوسيلة لتحديد هوية الكاتب. ولكن من أوجه قصور هذه التقنية أنها تحتاج إلى نصوص طويلة نسبيا حتى تؤتي ثمارها، لاسيما بعد أن أثبتت دراسة أجريت عام 2016 ضرورة ألا يقل حجم النص محل الاختبار عن ألف كلمة على الأقل حتى يتسنى تحديد هوية المؤلف.

استخدمت بعض الدراسات الحديثة ما يعرف باسم نماذج BERT اللغوية وهي اختصار لمصطلح Bidirectional Encoder Representations from Transformers أي “تمثيلات التشفير ثنائية الاتجاه من المحولات” وهي نموذج لغوي يساعد في تحسين فهم الحاسبات للغة البشرية عن طريق تحليل العلاقة بين المفردات داخل النص اللغوي من أكثر من اتجاه. ويرى كرويتس أن هذه التقنية يمكنها تمييز النصوص المكتوبة بواسطة تطبيقات الذكاء الصناعي بنسب تتراوح ما بين 80% إلى 98%، وإن كانت غير متاحة للمستخدم العادي غير المتخصص.

في محاولة لحل هذه المعضلة، وجه كرويتس الاستفسار نفسه إلى تطبيق “تشات جي.بي.تي” وسأله كيف يمكن التعرف إلى النص المكتوب بواسطة تطبيقات الذكاء الصناعي، فأجاب التطبيق نفسه أن هذ الأمر قد يكون صعبا ولكنه حدد بعض السمات اللغوية التي قد تساعد في اكتشاف مثل هذه النصوص. وذكر تشات جي.بي.تي أن النصوص المكتوبة بواسطة تطبيقات الذكاء الصناعي تتضمن ما يعرف باسم عبارات “التحوط” التي تعبر عدم اليقين مثل “في كثير من الأحيان” أو “بشكل عام”، وتتسم هذه النصوص أيضا بسمة “التكرارية”، والاعتماد على أسلوب القوائم أو النقاط، وكذلك استخدام “الأساليب الحيادة المنمقة” مع استخدام بعض الصفات مثل “بشكل ملموس” أو “بشكل ملحوظ”، وقد تتضمن بعض المصطلحات الأكاديمية على غرار “تداعيات” و”تعقيدات” وغيرها.

في نهاية المطاف، أكد التطبيق أنه رغم شيوع هذه السمات في النصوص المكتوبة بواسطة الذكاء الصناعي بشكل عام، فإنها لا تتيح إمكانية تحديد النصوص المصنوعة آليا بشكل قاطع.