H φυσική γλώσσα, προφορική ή γραπτή, αποτελεί ιστορικά μία περιοχή ενδιαφέροντος όσον αφορά την εφαρμογή ηλεκτρονικών μεθόδων επεξεργασίας και εξαγωγής συμπερασμάτων. Ο όρος στα Αγγλικά ονομάζεται Natural Language Processing και ανήκει στον κλάδο της Τεχνητής Νοημοσύνης και Μηχανικής Μάθησης. Στο άρθρο αυτό θα περιοριστούμε στην επεξεργασία γραπτού ανοιχτού ελεύθερου κειμένου. Ο προφορικός λόγος είναι ένα άλλο θέμα που μπορούμε να το δούμε σε άλλη ευκαιρία.
Ας φανταστεί κανείς την ανάγκη να διαβαστεί μία έκθεση οικονομικών αποτελεσμάτων μιάς εταιρίας, ή να διαβαστεί μία εταιρική παρουσίαση ή άλλη έκθεση και να «καταλάβει» ο αναγνώστης τις επιδόσεις της εταιρίας, ποια είναι τα κρίσιμα σημεία της έκθεσης και τι περιληπτικά συμπεράσματα μπορούν να βγούν από την ανάγνωση αυτή. Ας φανταστεί επίσης κανείς τον χώρο των χρηματο-οικονομικών υπηρεσιών. Τρείς φορές τον χρόνο δημοσιεύονται εκθέσεις απολογισμού και στο τέλος δημοσιεύεται μία ετήσια έκθεση από κάθε εισηγμένη στα χρηματιστήρια εταιρία ή και από μεγάλες μη εισηγμένες επιχειρήσεις και οργανισμούς.
Ελάτε στην θέση των Αναλυτών του Χρηματιστηρίου ή των επενδυτικών σχημάτων που έχουν να «διαβάσουν» κάθε τρίμηνο χιλιάδες σελίδες και να «καταλάβουν» τι γίνεται σε αυτές τις εταιρίες. Ταυτόχρονα να εκδώσουν περιληπτικές εκθέσεις με τα συμπεράσματά τους, στα ισχυρά και ασθενή σημεία που εντοπίζουν και στις τάσεις των οικονομικών εξελίξεων που καταγράφουν.
Σήμερα έξυπνες εφαρμογές είναι σε θέση να εξάγουν με μεγάλη ακρίβεια πληροφορία από κείμενα, ακόμα και αν αυτά είναι σε ελεύθερη μορφή.
Αυτή η δουλειά μέχρι σήμερα γινόταν με το μάτι, το μυαλό και γενικώς ήταν μια χειροκίνητη διαδικασία. Σήμερα φαίνεται ότι έχουμε την δυνατότητα να αλλάξει ριζικά ο τρόπος που καταναλώνουμε πληροφορία. Μπορούμε να αναπτύξουμε έξυπνες εφαρμογές που είναι σε θέση να εξάγουν την πληροφορία από τέτοια κείμενα, ακόμα και αν αυτά είναι σε ελεύθερη μορφή, με μεγάλη ακρίβεια.
Ας πάρουμε το παράδειγμα της ανάγνωσης για εντοπισμό θετικών, αρνητικών και ουδέτερων σημείων σε μία έκθεση. Το πρώτο πράγμα που χρειαζόμαστε είναι ένα «λεξικό». Το λεξικό αυτό έχει ήδη τύχει επεξεργασίας από τα εργαλεία που είναι στην διάθεση των αναλυτών, συνήθως σε εφαρμογές cloud, όπως π.χ. το Azure. Το λεξικό έχει ήδη «μαρκάρει» τις απαραίτητες έννοιες ώστε «διαβάζοντας» την εξεταζόμενη έκθεση να εντοπίσει και να απομονώσει «τι τρέχει» μέσα στο κείμενο. Ή ακόμη να συγκρίνει το «παρόν» κείμενο με προηγούμενες περιόδους ή με άλλες παρόμοιες εκθέσεις παρόμοιων επιχειρήσεων. Έτσι παράγει μία ή δύο σελίδες report – από τις 200 ή 1000 που διάβασε – σε περίληψη και με τρόπο που μπορεί ένας άνθρωπος – αναλυτής να κατανοήσει. Έχει κάνει την βαριά δουλειά και έχει σώσει το 99% της προσπάθειας και του χρόνου που θα έκανε ένας άνθρωπος, με το μάτι και το μυαλό του. Επίσης μπορεί να έκανε ελεγκτική δουλειά για να εντοπίσει ανακολουθίες, λάθη ή ασυμφωνίες εντός της ίδια της έκθεσης από κεφάλαιο σε κεφάλαιο ή ακόμη από παράγραφο σε παράγραφο.
Ας πάρουμε ένα άλλο παράδειγμα: Γράφουμε ένα πιθανό κίνδυνο σαν στοιχείο εισόδου στο εργαλείο επεξεργασίας φυσικής γλώσσας, και ζητάμε από τον υπολογιστή να μας εντοπίσει ελεγκτικές διαδικασίες που θα αντιμετώπιζαν ή θα μετρίαζαν τον κίνδυνο αυτό. Δηλαδή: «Computer, πες μου (σε παρακαλώ) τι πρέπει να κάνω για να αντιμετωπίσω το ενδεχόμενο να χάσω αποθέματα από την αποθήκη λόγω απαξίωσης;» Ο υπολογιστής θα τρέξει σε ειδικές περιοχές ελεγκτικών τεχνικών και θα βρει τις πλέον κατάλληλες για την αντιμετώπιση του κινδύνου αυτού.
Τα εργαλεία NLP δεν είναι απλά search engines. Κάνουν πλήρη εννοιολογική εξέταση πάνω στο σύνολο των εννοιών και των λέξεων που περιέχονται σε ένα «ερώτημα» και στις πιθανές «απαντήσεις».
Προσοχή: δεν μιλάμε εδώ για διερεύνηση με λέξεις – κλειδιά (search engine) αλλά για πλήρη εννοιολογική εξέταση πάνω στο σύνολο των εννοιών και των λέξεων που περιέχονται στο «ερώτημα» και στις πιθανές «απαντήσεις». Τα εργαλεία NLP δεν είναι απλά search engines. Διαβάζουν μεγαλύτερες ομάδες λέξεων, όχι τακτοποιημένων σε πεδία και σορταρισμένων (π.χ. όχι αλφαβητικά αλλά χύμα) και προσπαθούν να «καταλάβουν» τι λέει το ζητούμενο και να συγκεντρώσουν επεξεργασμένες απαντήσεις προς τον άνθρωπο. Αυτή είναι η μεγαλύτερη διαφορά του Natural Language Processing από το παραδοσιακό Data Processing.
Και ένα τρίτο παράδειγμα, με την ερώτηση: «computer, πες μου (σε παρακαλώ - και πάλι αν και δεν είναι απαραίτητο να παρακαλεί κανείς τον υπολογιστή!), τι είδους σχόλια λαμβάνω για τις υπηρεσίες μου στα Social Media, και ποιες αδυναμίες μου εντοπίζουν οι πελάτες μου που γράφουν σε αυτά;». Και αυτή είναι μία εφαρμογή επεξεργασίας φυσικής γλώσσας, η οποία εκδίδει εντοπισμένες παρατηρήσεις μετά από επεξεργασία με μεθόδους Μηχανικής Μάθησης.
Πρόσφατα παρουσιάσθηκε στην αγορά και το περίφημο ChatGPT το οποίο έχει κάνει μεγάλη εντύπωση για την ικανότητά του να «γράφει» ολόκληρες μονογραφίες, υποκινούμενο από μία γενική ερώτηση του ενδιαφερομένου, ο οποίος συνήθως είναι ένας καθημερινός απλός χρήστης εργαλείων πληροφορικής. Οι παραπάνω εφαρμογές που αναφέρθηκαν σαν παραδείγματα μπορούν να λειτουργήσουν με παλαιότερες εκδόσεις εργαλείων NLP. H χρήση του ChatGPT εξετάζεται ακόμη ώς προς το ΠΩΣ μπορεί να βελτιώσει την μηχανική μάθηση, στην επεξεργασία και κατανόηση κειμένου και φυσικής γλώσσας.
Εμείς στην Ε-ΟΝ, έχουμε ήδη εφαρμογές όπως τις παραπάνω τις οποίες τρέχουμε για λογαριασμό των πελατών μας με εξαιρετικά αποτελέσματα. Οι εργασίες μας αποσκοπούν στο να σώσουν το 90% του χρόνου ενός ανθρώπου στην εξέταση κειμένων «εδώ και εκεί» ως επίσης και στην παραγωγή συνοπτικών εκθέσεων από χιλιάδες δεδομένα με την μορφή κειμένου. Έχουμε στην διάθεσή μας λεξικά Κινδύνων, αλγόριθμους συναισθήματος, και άλλα εργαλεία κατανόησης κειμένου. Είμαστε ήδη στην αγορά των λύσεων NLP με πρακτικές προτάσεις που αποσκοπούν στην βελτίωση της εξυπηρέτησης Πελατείας, στην αντιμετώπιση ζητημάτων κλιματικής αλλαγής, στην αξιολόγηση κινδύνων, στην αξιολόγηση οικονομικής απόδοσης και άλλες περιοχές ενδιαφέροντος. Οι εφαρμογές NLP φαίνεται ότι τώρα βγαίνουν στο ευρύ κοινό, είναι προσιτές σε τιμές και αναμένεται να κυριαρχήσουν στην μελέτη και κατανόηση των επιχειρηματικών και κοινωνικών ζητημάτων.
Comments