Το μοντέλο τεχνητής νοημοσύνης εκπαιδεύτηκε σε σκηνές από δημοφιλείς τηλεοπτικές σειρές, όπως Τα Φιλαράκια και το The Big Bang Theory.
Ο Όσκαρ Ουάιλντ είχε πει ότι «ο σαρκασμός είναι η κατώτερη μορφή του πνεύματος, αλλά η ανώτατη μορφή της νοημοσύνης». Αν και αποτελεί βασικό χαρακτηριστικό της ανθρώπινης έκφρασης και επικοινωνίας, ο σαρκασμός δεν είναι πάντα εύκολο να εντοπιστεί στη συνομιλία, πόσο μάλλον από έναν υπολογιστή που έχει σχεδιαστεί για να «σκέφτεται» ορθολογιστικά.
Τώρα, ερευνητές στην Ολλανδία ανέπτυξαν ένα μοντέλο τεχνητής νοημοσύνης που μπορεί να καταλάβει τον σαρκασμό με μεγάλη ακρίβεια, στο πλαίσιο μελέτης που εστιάζει στην αλληλεπίδραση ανθρώπου-υπολογιστή. Η ομάδα από το εργαστήριο τεχνολογίας ομιλίας στο Πανεπιστήμιο του Groningen ανέπτυξε έναν «πολυτροπικό αλγόριθμο» τον οποίο εκπαίδευσε σε σκηνές από δημοφιλείς τηλεοπτικές σειρές, όπως Τα Φιλαράκια και το The Big Bang Theory.
«Αλλά πρέπει να μιλάμε στις συσκευές μας με πολύ κυριολεκτικό τρόπο, σαν να μιλάμε σε ένα ρομπότ, γιατί αυτό κάνουμε. Δεν χρειάζεται όμως να είναι έτσι τα πράγματα» πρόσθεσε.
Η ομάδα χρησιμοποίησε μια βάση δεδομένων που ονομάζεται Multimodal Sarcasm Detection Dataset (MUStARD), την οποία ερευνητές από τις ΗΠΑ και τη Σιγκαπούρη είχαν δημιουργήσει στο πλαίσιο παρόμοιας μελέτης. Οι προηγούμενοι αλγόριθμοι ανίχνευσης σαρκασμού βασίζονταν σε ένα μόνο σημείο δεδομένων, συνήθως την ανάλυση κειμένου. Οι ερευνητές της νέας μελέτης χρησιμοποίησαν δύο συμπληρωματικές μεθόδους: την ανάλυση συναισθήματος στον προφορικό λόγο και την αναγνώριση συναισθημάτων σε ηχητικά αποσπάσματα από τις εν λόγω τηλεοπτικές σειρές.
Αφού το εκπαίδευσαν στα σχετικά δεδομένα, το μοντέλο τεχνητής νοημοσύνης μπόρεσε να ανιχνεύσει τον σαρκασμό σχεδόν στο 75% των περιπτώσεων. Η μετέπειτα εργασία στο εργαστήριο με χρήση συνθετικών δεδομένων βελτίωσε ακόμη περισσότερο αυτό το επίπεδο ακρίβειας.
Η ομάδα σκοπεύει να βελτιώσει περαιτέρω το μοντέλο της συμπεριλαμβάνοντας διάφορες εκφράσεις και χειρονομίες, καθώς ο σαρκασμός μπορεί να διαφέρει ανάλογα με την κουλτούρα και το πλαίσιο.
«Επιπλέον, θα θέλαμε να συμπεριλάβουμε περισσότερες γλώσσες και να υιοθετήσουμε την ανάπτυξη τεχνικών αναγνώρισης σαρκασμού», δήλωσαν.
Οι ερευνητές πιστεύουν ότι αυτή η πολυτροπική προσέγγιση θα έχει ευρείες εφαρμογές σε διάφορους τομείς.
Η μελέτη παρουσιάστηκε σε εκδήλωση της Ακουστικής Εταιρείας της Αμερικής και της Καναδικής Ακουστικής Ένωσης στην Οττάβα του Καναδά.