Επιστήμη

Έρχεται η τεχνητή νοημοσύνη ιεραρχικού συλλογισμού που ξεπερνάει σε επιδόσεις τα μεγάλα γλωσσικά μοντέλα

pressroom

pressroom28 Αυγούστου, 20250 σχόλια

Επιστήμονες στη Σιγκαπούρη ανέπτυξαν ένα νέο σύστημα τεχνητής νοημοσύνης που «σκέφτεται» διαφορετικά από τα περισσότερα μεγάλα γλωσσικά μοντέλα (LLMs) όπως το ChatGPT επιτυγχάνοντας πολύ καλύτερες επιδόσεις σε απαιτητικά τεστ.

Το νέο σύστημα ονομάζεται ιεραρχικό μοντέλο συλλογιστικής (Hierarchical Reasoning Model – HRM) και εμπνέεται από τον τρόπο που ο ανθρώπινος εγκέφαλος επεξεργάζεται πληροφορίες σε διαφορετικές χρονικές κλίμακες. Το HRM διαθέτει 27 εκατομμύρια παραμέτρους και εκπαιδεύτηκε σε χίλια δείγματα σε αντίθεση με τα σημερινά LLMs που διαθέτουν δισεκατομμύρια ή τρισεκατομμύρια παραμέτρους και εκπαιδεύονται σε επίσης τεράστιο αριθμό δειγμάτων.

Σύμφωνα με την εταιρεία Sapient το HRM πέτυχε εντυπωσιακά αποτελέσματα στο τεστ ARC-AGI, το οποίο θεωρείται από τα πιο δύσκολα για την αξιολόγηση συστημάτων τεχνητής γενικής νοημοσύνης. Συγκεκριμένα, κατέγραψε 40,3% επιτυχία στο ARC-AGI-1, ξεπερνώντας μοντέλα όπως το Claude 3.7 (21,2%) της εταιρείας Antrhopic, το Deepseek R1 (15,8%) της Deepseek και το o3-mini-high της OpenAI (34,5%). Στο δυσκολότερο ARC-AGI-2 πέτυχε 5%, παραμένοντας και πάλι μπροστά από τους ανταγωνιστές.

Σε αντίθεση με τα LLMs που βασίζονται στο chain-of-thought reasoning (αλυσίδα σκέψης), το HRM χρησιμοποιεί μια μέθοδο που μιμείται τον ανθρώπινο εγκέφαλο: ένα αργό, αφηρημένο επίπεδο σχεδιασμού και ένα γρήγορο, λεπτομερές επίπεδο υπολογισμού. Χρησιμοποιεί επίσης την τεχνική iterative refinement (επανειλημμένης βελτίωσης σε ελεύθερη μετάφραση) αποφασίζοντας σε κάθε «έκρηξη σκέψης» αν θα συνεχίσει ή θα δώσει τελική απάντηση.

Το μοντέλο έδειξε σχεδόν τέλεια αποτελέσματα σε πολύπλοκους γρίφους όπως το Sudoku και σε εύρεση βέλτιστων διαδρομών σε λαβύρινθους καθήκοντα στα οποία τα συμβατικά LLMs αποτυγχάνουν.

Naftemporiki.gr

Πηγή: www.naftemporiki.gr