Ας αρχίσουμε με το συμπέρασμα το οποίο είναι πως παρά την ήδη υπαρκτή και ευρεία εμπειρία σε εφαρμογές τεχνητής νοημοσύνης και μηχανικής μάθησης, έχουμε ακόμη δρόμο μπροστά μας. Έχουμε να μάθουμε να χρησιμοποιούμε τις σχετικές τεχνολογίες και να αποδεχθούμε την «ανασφάλεια» των προτάσεων των υπολογιστών προς τον άνθρωπο. Δείτε τις παρακάτω τρείς προτάσεις που έχουν προκύψει από επεξεργασία Big Data:
Σε παγκόσμια βάση, 4,3% των παιδιών πεθαίνουν πριν φτάσουν την ηλικία των 15 ετών. Είναι 5,9 εκατομμύρια παιδιά που πεθαίνουν κάθε χρόνο. Άρα ο Κόσμος είναι «χάλια»
Στο παρελθόν, περίπου το 50% των παιδιών πέθαναν. Σήμερα το ποσοστό έχει πέσει στο 4,3% των παιδιών που θα πεθάνουν. Άρα ο Κόσμος είναι σήμερα «καλύτερος» από πριν.
Στην Ευρωπαϊκή Ένωση το 0,45% όλων των παιδιών θα πεθάνει. Άρα ο Κόσμος μπορεί να γίνει ακόμη «πολύ καλύτερος».
(πηγή Ourworldindata).
Και οι τρείς παραπάνω προτάσεις – πορίσματα των Big Data έχουν διατυπωθεί ορθά. Εξαρτάται από εμάς ποια χρήση θέλουμε να κάνουμε. Προτείνουμε εμείς να επιλέξουμε και τις τρείς, αν θα έπρεπε να κάνουμε κάποια δράση. Εσείς ποια θα επιλέγατε;
Η Τεχνητή Νοημοσύνη δεν είναι καινούργια υπόθεση. Τουλάχιστον δύο δεκαετίες τώρα, έχουμε εφαρμογές όπου οι Υπολογιστές παίζουν ρόλους Ανθρώπων. Είτε αποφασίζοντας για ενέργειες (βλέπε Χρηματιστηριακές συναλλαγές) είτε βοηθώντας την λήψη αποφάσεων (βλέπε IBM Watson στην θεραπεία του καρκίνου), είτε τέλος αποκαλύπτοντας κρυμμένες τάσεις και φαινόμενα (βλέπε συμπεριφορές καταναλωτών ή πολιτών).
Δύο ζητήματα αξίζει να τονισθούν: πρώτον ότι εμείς ενίοτε βλέπουμε τα αποτελέσματα των αναλύσεων Big data με μισό μάτι και δεύτερον ότι η διαχείριση των υποδομών τεχνητής νοημοσύνης είναι ακριβή υπόθεση.
Τα "data" μιλάνε και δίνουν χρήσιμα αποτελεσματα. Πρέπει όμως να μάθουμε να χρησιμοποιούμε τις σχετικές τεχνολογίες, να υιοθετήσουμε μεθόδους διαχείρισης των false αποτελεσμάτων και να αποδεχθούμε την ανάγκη της συνεχούς επένδυσης στην Μηχανική Μάθηση και στην Τεχνητή Νοημοσύνη.
Πρώτον λοιπόν, έχουμε καχυποψία και δισταγμούς στην αποδοχή των πορισμάτων των αναλύσεων Big data. Αυτό οφείλεται στο γεγονός ότι η των προβλέψεων δεν είναι σίγουρη, δεν είναι 100% ή τουλάχιστον 95%. Στην στατιστική επιστήμη έχουμε διδαχθεί να δημιουργούμε και να αξιοποιούμε μοντέλα των οποίων η ακρίβεια τείνει στο 95%, έχουμε δηλαδή στατιστικό λάθος 5% ή λίγο μεγαλύτερο. Στην τεχνητή νοημοσύνη, η ακρίβεια πέφτει στο 80% ή ακόμη λιγότερο. Με άλλα λόγια, καλούμαστε να πάρουμε αποφάσεις, βασιζόμενοι πάνω σε μοντέλα τα οποία έχουν σχετικά μεγάλη πιθανότητα να κάνουν λάθος. Βέβαια δεχόμαστε ότι οι αλγόριθμοι πρέπει να επικαιροποιούνται συνέχεια ώστε να βελτιώνεται το ποσοστό ακρίβειας, ωστόσο η ύπαρξη από false positives και false negatives παραμένει πάντα μια πραγματικότητα. Στον επιχειρησιακό χώρο, 20% πιθανότητα λάθους σε μία απόφαση είναι μεγάλη. Για τούτο τα στελέχη πολλές φορές διστάζουν να την αποδεχθούν και ανατρέπουν με απογοήτευση τις προτάσεις των υπολογιστικών μοντέλων. Η λύση όμως δεν είναι η απογοήτευση και η αποφυγή αλλά η υιοθέτηση μεθόδων διαχείρισης των false αποτελεσμάτων.
Ας πάρουμε το παράδειγμα της διερεύνησης Συναισθήματος Πελατών, με την χρήση Επεξεργασίας Φυσικής Γλώσσας, μέσα από τα σχόλια που στέλνουν στα κοινωνικά δίκτυα. Μετά από επεξεργασία Big Data Analytics, η Πιθανότητα false μπορεί να φτάσει ακόμη και το 25%. Δηλαδή να θεωρούμε θετικό ένα συναίσθημα, ενώ στην πραγματικότητα να είναι αρνητικό, και το αντίθετο. Με 25% πιθανότητα να κάνουμε λάθος, είναι πολύ δύσκολο να τύχει αποδοχής ένα πλάνο ενεργειών βελτίωσης της ποιότητας υπηρεσίας προς τους Πελάτες. Παρά ταύτα γεννάται το «ωμό» ερώτημα: είναι προτιμότερο να μην κάνουμε «τίποτα», ή να κάνουμε «κάτι» με τα στοιχεία του 75% ακρίβειας δεδομένων; Στο ερώτημα αυτό το Management συνήθως απαντά ανάλογα με το ταπεραμέντο του να παίρνει ρίσκο και να βλέπει οραματικά τα νέα εργαλεία.
Το δεύτερο ζήτημα είναι το ύψος των επενδύσεων στα Big Data και την Τεχνητή Νοημοσύνη. Συχνά οι Διοικήσεις θεωρούν ότι με λίγα ευρώ ή δολάρια, μπορούν να έχουν εφαρμογές τεχνητής νοημοσύνης. Ταυτόχρονα οι προσδοκίες τους εκτινάσσονται στα ουράνια, περιμένοντας θαύματα από τις εφαρμογές Τεχνητής Νοημοσύνης. Αυτό είναι σε γενικές γραμμές μία μεγάλη πλάνη. Όσο πιο μεγάλη είναι μία προσδοκία και ένα όραμα, τόσο πιο πολλά είναι τα κεφάλαια που (θα) απαιτεί. Επίσης, η Τεχνητή νοημοσύνη απαιτεί συνεχή επένδυση. Η περίπτωση «μια-και-έξω» δαπάνης και μετά το σύστημα να τρέχει μόνο του, απλά δεν υπάρχει.
Ένα παράδειγμα – μεγάλης κλίμακας ομολογουμένως – το οποίο αξίζει να αναφέρουμε στην κατεύθυνση αυτή, είναι το σύστημα IBM Watson[1], το οποίο χρησιμοποιείται εδώ και πολλά χρόνια για την θεραπεία διάφορων μορφών καρκίνου. Το σύστημα αυτό, διαβάζει εκατομμύρια δεδομένα από χιλιάδες βάσεις, ιατρικών ερευνών, εγκυκλοπαιδειών, άρθρων, γραπτών ιατρικών εκθέσεων, κλπ. Έχει κοστίσει πολλά δισεκατομμύρια δολάρια και έχει περάσει από «σαράντα κύματα» μέχρι να φτάσει την μορφή που έχει σήμερα. Παρά την αναμφισβήτητη συμβολή στην αντικαρκινική προσπάθεια, η ΙΒΜ αναγκάσθηκε πριν λίγα χρόνια να περιορίσει το budget διότι είχε φτάσει σε ύψη δυσθεώρητα ώστε ούτε η ίδια να μην μπορεί να αντέξει. Η δε ποιότητα των αποφάσεων και προτάσεων του συστήματος, είχε αρχίσει να μειώνεται, κυρίως διότι οι γιατροί και οι ερευνητές, ως τροφοδότες δεδομένων προς το σύστημα, είχαν αρχίσει να βαρυγκωμούν για το βάρος και το κόστος συντήρησης του συστήματος. Με λίγα λόγια, έλειπαν κεφάλαια, τόσο στους κατόχους των αλγορίθμων όσο και στους χρήστες αυτών. Το ίδιο περίπου συμβαίνει, ίσως σε μικρότερη κλίμακα σε χιλιάδες άλλες εφαρμογές, εμπορικές κυρίως, οι οποίες αντιμετωπίζονται με πνεύμα περιορισμού κεφαλαίων.
Έχουμε δρόμο λοιπόν ακόμη και σε καμία περίπτωση δεν διαφαίνεται η κυριαρχία των υπολογιστών και των πορισμάτων τους. Η ποιότητα των αποτελεσμάτων είναι συνάρτηση ασφαλώς των επενδύσεων, αλλά και της κρίσης που εξασκείται στην διαδικασία και την επεξεργασία των παρεχόμενων από τα μοντέλα στοιχείων.
[1] https://www.nytimes.com/2021/07/16/technology/what-happened-ibm-watson.html
コメント