algorithmos-tis-google-katanoei-ti-glossa-561418183

Αλγόριθμος της Google κατανοεί τη γλώσσα

Εναν νέο εγκέφαλο για τη μηχανή αναζήτησής της αναπτύσσει με ταχείς ρυθμούς η Google. Ο αλγόριθμος MUM είναι, όπως τόνισε στη διαδικτυακή σχετική ενημερωτική συνάντηση ο Πάντου Ναγιάκ, αντιπρόεδρος του Google Search, «ένα ορόσημο στην προσπάθειά μας να κατανοήσουμε τη γλώσσα. Η καλή κατανόηση της γλώσσας είναι θεμελιώδης, ώστε να καταλαβαίνουμε τα ερωτήματα που τίθενται από τους χρήστες». 

Η τεχνολογία MUM φιλοδοξεί να λύσει ένα πρόβλημα που αντιμετωπίζουν δισεκατομμύρια χρήστες ανά τον πλανήτη στην προσπάθειά τους να πραγματοποιήσουν μια επιτυχημένη αναζήτηση: συχνά χρειάζεται να θέσουν πολλαπλά διαδοχικά ερωτήματα, ώστε να λάβουν την απάντηση που χρειάζεται. Η εμπειρία έχει δείξει, σύμφωνα με τα δεδομένα που διαθέτει ο τεχνολογικός κολοσσός του διαδικτύου, ότι κατά μέσο όρο οι άνθρωποι μπορεί να κάνουν έως και οκτώ αναζητήσεις για να λάβουν απάντηση σε ένα περίπλοκο ζήτημα. 

Χαρακτηριστικό παράδειγμα που χρησιμοποιείται στην παρουσίαση της νέας τεχνολογίας είναι ένας χρήστης που, αφότου σκαρφάλωσε σε μια οροσειρά, λίγους μήνες μετά επιθυμεί να επισκεφθεί μια άλλη και αναζητεί οδηγίες για το τι πρέπει να κάνει διαφορετικά, ανάλογα με τις καιρικές και μορφολογικές συνθήκες, το υψόμετρο, τα ιδιαίτερα χαρακτηριστικά της οροσειράς, τα μονοπάτια κ.λπ. Αν μπορούσε να απευθυνθεί σε έναν ειδικό, αυτός θα του έδινε συγκεκριμένες οδηγίες για κάθε ένα από τα ερωτήματά του, ακόμη και για κάποια που δεν θα είχε σκεφτεί. Το MUM –Multitask Unified Model– φιλοδοξεί να γίνει αυτός ο ειδικός – και όχι μόνο για τον ορειβάτη του παραδείγματος, αλλά για όλους τους χρήστες και τις περίπλοκες καταστάσεις με τις οποίες έρχονται καθημερινά αντιμέτωποι.

Το MUM εκπαιδεύεται ταυτόχρονα σε 75 διαφορετικές γλώσσες, χρησιμοποιώντας δεδομένα από το web corpus, το σώμα των πληροφοριών του Διαδικτύου. «Παρόλα αυτά», διευκρίνισε ο κ. Ναγιάκ, «εκπαιδεύεται με δεδομένα υψηλής ποιότητας και όχι το σύνολο του web corpus, ταυτόχρονα σε κείμενα και σε εικόνες». Ενα ξεχωριστό χαρακτηριστικό του είναι πως εκτός του ότι κατανοεί, μπορεί και να παράξει γλώσσα, δηλαδή να κατανοήσει περίπλοκα ερωτήματα με πολλές παραμέτρους και να παράξει αντίστοιχα πολύπλοκες απαντήσεις ή πληροφορίες, βασισμένο στη βαθιά κατανόηση του κόσμου που έχει κατακτήσει μέσω της εκπαίδευσής του. Μπορεί ταυτόχρονα να μεταφέρει γνώση από γλώσσα σε γλώσσα, δηλαδή να αναζητήσει και να διαθέσει στον χρήστη πληροφορίες και δεδομένα από άλλες γλώσσες, στις οποίες ο ίδιος δεν θα είχε πρόσβαση – για παράδειγμα, πληροφορίες που είναι διαθέσιμες μόνο στα αραβικά, γλώσσα την οποία δεν μιλάει ο χρήστης. 

Μεσοπρόθεσμα το MUM θα μπορεί να λειτουργήσει αποτελεσματικά αξιοποιώντας δεδομένα κειμένου και φωτογραφιών –όπως ο ορειβάτης του παραδείγματός μας θα μπορούσε να ανεβάσει μια φωτογραφία από τις μπότες του, ρωτώντας αν είναι κατάλληλες για την ανάβαση της οροσειράς– και μακροπρόθεσμα θα εκπαιδευτεί σε δεδομένα ήχου και εικόνας. Ακριβείς εκτιμήσεις για το πότε θα γίνει πλήρως διαθέσιμο δεν είναι ακόμη εφικτό να υπάρξουν, διευκρίνισε ο κ. Ναγιάκ.

800 ονομασίες

Τους τελευταίους μήνες δόθηκαν στο MUM δεδομένα αναφορικά με όλους τους διαφορετικούς τρόπους που οι άνθρωποι ανά τον πλανήτη αναζητούσαν πληροφορίες για τον κορωνοϊό, χρησιμοποιώντας διαφορετικές ονομασίες. Το ίδιο συνέβη και σε ό,τι αφορά τα εμβόλια: καταγράφηκε ότι είχαν περισσότερες από 800 ονομασίες. Διαπιστώθηκε ότι το MUM είχε τη δυνατότητα να αναγνωρίζει σε δευτερόλεπτα όλες αυτές τις ονομασίες και να παρέχει αξιόπιστες πληροφορίες σχετικά με τα εμβόλια. 

Η τεχνολογία της μηχανικής μάθησης είναι θεμελιώδης στην εξέλιξη του MUM, η χρήση της, ωστόσο, γίνεται στη βάση μελετών που διαθέτει η Google σχετικά με το πώς αυτή μπορεί να γίνει με τρόπους που μειώνουν το αποτύπωμα άνθρακα. 

Πηγή άρθρου: www.kathimerini.gr