Τον Μάιο του 2025, τριάντα από τους πιο διακεκριμένους μαθηματικούς παγκοσμίως συγκεντρώθηκαν μυστικά στο Πανεπιστήμιο του Μπέρκλεϊ στην Καλιφόρνια, με σκοπό να δοκιμάσουν την ικανότητα μιας νέας Τεχνητής Νοημοσύνης (ΤΝ) στην επίλυση σύνθετων μαθηματικών προβλημάτων.
Το chatbot, βασισμένο στο προηγμένο γλωσσικό μοντέλο o4-mini, κλήθηκε να αντιμετωπίσει προκλήσεις που επινόησαν οι ίδιοι οι μαθηματικοί — πρωτότυπα προβλήματα υψηλής δυσκολίας που δεν είχαν δημοσιευτεί ποτέ.
Τι είναι το o4-mini και πώς λειτουργεί;
Το o4-mini αποτελεί ένα νέο είδος Μεγάλου Γλωσσικού Μοντέλου (Large Language Model, LLM), σχεδιασμένο ειδικά για να εκτελεί πολύπλοκες λογικές και μαθηματικές διεργασίες. Παρόμοιο με το μοντέλο Gemini 2.5 Flash της Google, το o4-mini χρησιμοποιεί εξελιγμένες μεθόδους εκπαίδευσης που βασίζονται σε ειδικά μαθηματικά δεδομένα και ενισχύονται από ανθρώπινη εποπτεία. Αυτό το καθιστά πιο αποτελεσματικό και γρήγορο σε σύγκριση με παλαιότερα μοντέλα που εκπαιδεύονταν απλά στην πρόβλεψη της επόμενης λέξης σε μια πρόταση.
Η πρόκληση της Epoch AI και η FrontierMath έρευνα
Η OpenAI ανέθεσε στην ανεξάρτητη Epoch AI τη δοκιμασία του o4-mini με 300 πρωτότυπα μαθηματικά προβλήματα, εκ των οποίων οι λύσεις δεν υπήρχαν δημοσιευμένες. Η συντριπτική πλειοψηφία των παραδοσιακών LLM απέτυχε να δώσει σωστές απαντήσεις, επιτυγχάνοντας λιγότερο από 2% επιτυχία. Αντίθετα, το o4-mini κατάφερε να λύσει περίπου το 20% των προβλημάτων μέχρι τον Απρίλιο του 2025.
Για να αυξηθεί η δυσκολία, προστέθηκε ένα τέταρτο επίπεδο προβλημάτων, το οποίο θα δυσκόλευε ακόμα και έμπειρους ακαδημαϊκούς μαθηματικούς. Οι μαθηματικοί που δημιούργησαν αυτά τα προβλήματα συμφώνησαν σε αυστηρά μέτρα εμπιστευτικότητας, χρησιμοποιώντας αποκλειστικά την εφαρμογή Signal για επικοινωνία, ώστε να αποφευχθεί η ακούσια εκπαίδευση της ΤΝ μέσω των μηνυμάτων.
Η συνάντηση του Μαΐου 2025 και τα αποτελέσματα
Στις 17 και 18 Μαΐου 2025, οι 30 μαθηματικοί χωρίστηκαν σε ομάδες των έξι και συναγωνίστηκαν για να επινοήσουν προβλήματα που θα δυσκόλευαν την ΤΝ. Παρότι τελικά βρήκαν 10 ερωτήσεις που το o4-mini δεν κατάφερε να λύσει, εντυπωσιάστηκαν από την πρόοδο της Τεχνητής Νοημοσύνης, η οποία εκτελούσε σε λίγα λεπτά υπολογισμούς που θα απαιτούσαν εβδομάδες ή μήνες από έναν επαγγελματία.
Αυτό δείχνει πως η ΤΝ έχει πλέον όχι μόνο την ικανότητα επίλυσης αλλά και αυτοπεποίθηση στην παρουσίαση των αποτελεσμάτων της.
Τι σημαίνει αυτό για το μέλλον των μαθηματικών;
Η ραγδαία βελτίωση των ικανοτήτων των μοντέλων Τεχνητής Νοημοσύνης φέρνει στο προσκήνιο πολλά ερωτήματα. Μπορεί η ΤΝ να αναλάβει σημαντικό ρόλο στην επίλυση πολύπλοκων μαθηματικών προβλημάτων, επιταχύνοντας την έρευνα και ανοίγοντας νέους ορίζοντες στην επιστήμη; Και ταυτόχρονα, πώς θα διαμορφωθεί ο ρόλος του ανθρώπινου παράγοντα μέσα σε αυτό το νέο περιβάλλον συνεργασίας με τις μηχανές;
Η απάντηση ίσως κρύβεται στη συνδυαστική δύναμη της ανθρώπινης δημιουργικότητας και της μηχανικής ταχύτητας και ακρίβειας. Η επόμενη δεκαετία αναμένεται συναρπαστική για τα μαθηματικά, όπου η Τεχνητή Νοημοσύνη δεν θα είναι απλά εργαλείο, αλλά ενεργός συνομιλητής και συνεργάτης.
Πηγές
-
At Secret Math Meeting, Researchers Struggle to Outsmart AI – Scientific American
-
Mathematicians interact with AI, July 2025 – Peter Woit Blog, Columbia University
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου