Φοιτητές chatbot ξεγέλεσαν τους εξεταστές σε πανεπιστημιακές εξετάσεις
Share
Μια ακόμη απόδειξη της αλματώδους εξέλιξης της τεχνητής νοημοσύνης
Ένα βρετανικό πανεπιστήμιο έστρεψε το μικροσκόπιο στον εαυτό του, πραγματοποιώντας ένα τεστ Turing σε πραγματικές συνθήκες.
Το τεστ είχε επινοήσει o Άλαν Τούρινγκ το 1950. O κορυφαίος μαθηματικός και επιστήμονας υπολογιστών πρότεινε το ακόλουθο κριτήριο για το επίπεδο της τεχνητής νοημοσύνης: εάν μια μηχανή καταφέρει να ξεγελάσει τους ανθρώπους και να τους κάνει να πιστέψουν πως είναι άνθρωπος, τότε πρέπει να είναι τουλάχιστον εξίσου έξυπνη με έναν άνθρωπο. Ο Τούρινγκ μάλιστα είχε προβλέψει πως μέχρι το 2000 θα είχε αναπτυχθεί τεχνητή νοημοσύνη που θα μπορούσε να ξεγελάσει το 30% των ερωτώντων, έπειτα από πέντε λεπτά συζήτησης.
Σε μια νέα μελέτη από το Πανεπιστήμιο του Reading, που δημοσιεύτηκε στην επιθεώρηση «PLOS One» παρουσιάζεται το πείραμα.
Δημιουργήθηκαν 33 ψεύτικα προφίλ φοιτητών από την ομάδα τεχνολογίας του πανεπιστημίου. Οι «φοιτητές» ολοκλήρωναν όλοι πτυχία Bachelor of Science στην ψυχολογία, σε διαφορετικά έτη σπουδών. Οι ερευνητές βοήθησαν τους… fake φοιτητές να ολοκληρώσουν μια σειρά από διαδικτυακές εργασίες και εξετάσεις, χρησιμοποιώντας μη επεξεργασμένες απαντήσεις που γράφτηκαν από το chatbot τεχνητής νοημοσύνης GPT-4 της OpenAI.
Σε αυτή που θεωρείται η μεγαλύτερη μελέτη του είδους της, οι ερευνητές διαπίστωσαν ότι το 94% των υποβολών τους για τεχνητή νοημοσύνη γλίστρησαν από τους εξεταστές απαρατήρητα. Επιπλέον οι φοιτητές τεχνητής νοημοσύνης τα πήγαν καλύτερα από τους συνομηλίκους τους. Οι βαθμοί τους ήταν κατά μέσο όρο περίπου μισό όριο βαθμού υψηλότεροι από τους πραγματικούς μαθητές, με 83,4% πιθανότητες να ξεπεράσουν μια τυχαία επιλογή πραγματικών υποβολών μαθητών.
H αφύπνιση και η αξιολόγηση
Ο καθηγητής Πίτερ Σκάρφε, ένας από τους συγγραφείς της μελέτης, είπε ότι τα ευρήματά τους θα πρέπει να είναι ένα «κάλεσμα αφύπνισης» για τους εκπαιδευτικούς, με μια πρόσφατη έρευνα της UNESCO να διαπιστώνει ότι λιγότερο από το 10% των σχολείων παγκοσμίως είχαν πολιτικές ή οδηγίες για τη χρήση της γενετικής νοημοσύνης που πρωταγωνιστεί τα τελευταία χρόνια στη βιομηχανία της τεχνολογίας και του τομέα της τεχνητής νοημοσύνης αφήνοντας σε δεύτερο επίπεδο τον κλάδο ΑΙ της μηχανικής μάθησης που πρωταγωνιστούσε πριν την εμφάνιση του ChatGPT και των ανταγωνιστικών σε αυτό προγραμμάτων που κάνουν καθημερινά την εμφάνιση τους.
«Πολλά ιδρύματα έχουν απομακρυνθεί από τις παραδοσιακές εξετάσεις για να κάνουν την αξιολόγηση πιο περιεκτική. Η έρευνά μας δείχνει ότι είναι διεθνούς σημασίας να κατανοήσουμε πώς η τεχνητή νοημοσύνη θα επηρεάσει την ακεραιότητα των εκπαιδευτικών αξιολογήσεων. Δεν θα επιστρέψουμε απαραιτήτως πλήρως στις χειρόγραφες εξετάσεις, αλλά ο παγκόσμιος εκπαιδευτικός τομέας θα πρέπει να εξελιχθεί απέναντι στην τεχνητή νοημοσύνη» λέει ο Σκάρφε.