Πάνω από 250.000 δημοσιεύσεις για τον καρκίνο φέρουν ίχνη «paper mills», σύμφωνα με νέο εργαλείο μηχανικής μάθησης.
Ένα πρωτοποριακό εργαλείο Τεχνητής Νοημοσύνης έρχεται να ταράξει τα νερά της παγκόσμιας επιστημονικής κοινότητας, αποκαλύπτοντας την έκταση ενός φαινομένου που υπονομεύει την αξιοπιστία της έρευνας. Με τη βοήθεια μηχανικής μάθησης, ερευνητές εντόπισαν εκατοντάδες χιλιάδες επιστημονικές δημοσιεύσεις για τον καρκίνο που ενδέχεται να έχουν παραχθεί από τα λεγόμενα «paper mills», εταιρείες που δημιουργούν κατά παραγγελία ψεύτικες ή χαμηλής ποιότητας μελέτες. Τα ευρήματα, που δημοσιεύθηκαν στο έγκριτο περιοδικό The BMJ, αναδεικνύουν μια ανησυχητική αύξηση των ύποπτων δημοσιεύσεων τις τελευταίες δύο δεκαετίες και θέτουν κρίσιμα ερωτήματα για τους μηχανισμούς ελέγχου, την επιστημονική ακεραιότητα και τον ρόλο της Τεχνητής Νοημοσύνης ως εργαλείου προστασίας της γνώσης.
Το εργαλείο αναπτύχθηκε από τον καθηγητή Άντριαν Μπαρνέτ του Πανεπιστημίου Τεχνολογίας του Κουίνσλαντ, από τη Σχολή Δημόσιας Υγείας και Κοινωνικής Εργασίας, και το Αυστραλιανό Κέντρο Καινοτομίας Υπηρεσιών Υγείας, σε συνεργασία με διεθνή ομάδα ερευνητών.
Η ερευνητική ομάδα εκπαίδευσε ένα γλωσσικό μοντέλο που ονομάζεται BERT, ώστε να αναγνωρίζει τα λεπτά «κειμενικά αποτυπώματα» που εμφανίζονται επανειλημμένα σε δημοσιεύσεις που προέρχονται από paper mills. Όταν δοκιμάστηκε σε επαληθευμένα παραδείγματα, το μοντέλο αναγνώρισε σωστά ύποπτες εργασίες στο 91% των περιπτώσεων.
Στη μελέτη, αναλύθηκαν 2,6 εκατομμύρια επιστημονικές εργασίες για τον καρκίνο της περιόδου 1999-2024. Εντοπίστηκαν περισσότερες από 250.000 εργασίες με μοτίβα συγγραφής παρόμοια με άρθρα που ήδη έχουν ανακληθεί λόγω υποψιών κατασκευασμένων δεδομένων.
Επίσης, διαπιστώθηκε ότι οι ύποπτες δημοσιεύσεις έχουν αυξηθεί ραγδαία τις τελευταίες δύο δεκαετίες, από περίπου 1% στις αρχές της δεκαετίας του 2000 σε πάνω από 16% το 2022. Το ζήτημα επηρεάζει χιλιάδες επιστημονικά περιοδικά μεγάλων εκδοτικών οίκων, συμπεριλαμβανομένων τίτλων υψηλού κύρους.
Το πρόβλημα είναι εντονότερο σε τομείς όπως η μοριακή βιολογία του καρκίνου και η εργαστηριακή έρευνα σε πρώιμο στάδιο. Ορισμένοι τύποι καρκίνου, όπως του στομάχου, του ήπατος, των οστών και των πνευμόνων, εμφανίζουν ιδιαίτερα υψηλά ποσοστά ύποπτων μελετών.
Ήδη, όπως σημειώνεται, τρία επιστημονικά περιοδικά δοκιμάζουν πιλοτικά το εργαλείο στο πλαίσιο του συντακτικού ελέγχου τους, ώστε να εντοπίζονται πιθανώς κατασκευασμένα άρθρα πριν σταλούν για αξιολόγηση από ομότιμους κριτές.
Η ερευνητική ομάδα σκοπεύει να επεκτείνει τη χρήση του εργαλείου και σε άλλους επιστημονικούς κλάδους και να βελτιώσει το μοντέλο, καθώς θα γίνονται διαθέσιμα περισσότερα επιβεβαιωμένα περιστατικά δραστηριότητας paper mills. Τέλος, διευκρινίζει ότι τα ευρήματα δεν αποτελούν οριστική απόδειξη απάτης και θα πρέπει να ελέγχονται από ειδικούς επιστήμονες.
