Υπολογιστική Μηχανή Αναζήτησης Wolfram|Alpha

Η Wolfram|Alpha είναι μια καινούργια μηχανή αναζήτησης πολύ διαφορετική από τη δημοφιλή GOOGLE, η οποία δεν αναζητεί πληροφορίες σε ιστοσελίδες σύμφωνα με λέξεις κλειδιά, αλλά ουσιαστικά επιχειρεί να δώσει απαντήσεις από μια δική της βάση δεδομένων.

Η μηχανή, πολύ διαφορετικά από τις υπάρχουσες μηχανές αναζήτησης, αξιοποιεί μαθηματικούς αλγορίθμους, καθώς έχει ως υπόβαθρο το λογισμικό Mathematica και μια σειρά δεδομένων. Με αυτά μπορεί να εξάγει απαντήσεις σε ερωτήματα που θέτουν οι χρήστες.

Στόχος της Wolfram | Alpha «είναι η συλλογή και η επεξεργασία όλων των αντικειμενικών δεδομένων, η εφαρμογή κάθε γνωστού μοντέλου, μεθόδου ή αλγορίθμου και δυνατότητα να υπολογιστεί κάθε τι που υπολογίζεται». Επιπλέον, επιδιώκει να οικοδομήσει πάνω στα επιτεύγματα της επιστήμης και σε άλλη συστηματοποιημένη γνώση, ώστε να αποτελέσει μια πηγή στην οποία μπορεί κανείς να βασιστεί, για να εξασφαλίσει οριστικές απαντήσεις σε πραγματικά ερωτήματα.

Αν κανείς τοποθετήσει στο ερώτημα (query) στη Wolfram | Alpha, για παράδειγμα, τις λέξεις κλειδιά Greece Germany, το αποτέλεσμα δεν είναι ένας κατάλογος ιστοσελίδων με τις λέξεις αυτές, αλλά μια συγκριτική προβολή στοιχείων για τις δύο χώρες, όπως στοιχεία που αφορούν στις διεθνείς ονομασίες των χωρών, χάρτες, αποστάσεις, διάφορα στατιστικά για τον πληθυσμό, το προσδόκιμο ζωής κτλ., καθώς και άλλες πληροφορίες οικονομικής φύσεως όπως το ακαθάριστο εθνικό εισόδημα.

Η σπουδαιότητα αυτής της μηχανής για την Γλωσσολογία και ειδικότερα για την Υπολογιστική Γλωσσολογία είναι μεγάλη. Η υπολογιστική μηχανή αναζήτησης περιλαμβάνει στοιχεία που δείχνουν ότι μπορεί να επεξεργάζεται και να τεχνολογεί γλωσσικά δεδομένα και από αυτά να δίνει απαντήσεις.

Δίνεται επιπλέον η δυνατότητα για αναζήτηση πληροφορίας με ερωτήματα τα οποία περιλαμβάνουν στοιχεία φυσικής γλώσσας. Στην ουσία ο χρήστης μπορεί να δώσει το ερώτημα σε φυσική γλώσσας, η μηχανή αναζήτησης ωστόσο δεν «καταλαβαίνει» φυσική γλώσσα αλλά εντοπίζει τις λέξεις κλειδιά του ερωτήματος:

 

Ενδεικτικά στην ερώτηση «What is your name?» η μηχανή απαντά «My name is Wolfram | Alpha», ενώ στην ερώτηση «How are you?», απάντησε «I am doing well, thank you» και στο χαιρετισμό «Hello» ανταποκρίνεται με το ωραίο «Hello, human», ενώ στην ερώτηση δε “Who wrote the Iliad?”, δίνει ως απάντηση Homer.

Βέβαια, αυτά μπορεί να μην εντυπωσιάζουν ένα γλωσσολόγο που γνωρίζει ότι και χωρίς πραγματική γλωσσική επεξεργασία ένας αλγόριθμος μπορεί να μιμηθεί ανθρώπινες απαντήσεις, όπως έκανε ήδη από τα μέσα του 1960 το πρόγραμμα ELIZA και άλλα μεταγενέστερα.

Ωστόσο, υπάρχουν ορισμένες δυνατότητες που όντως είναι σημαντικές, σχετικές με τη λεξικογραφία και τη στατιστική γραμματική ανάλυση. Για παράδειγμα σε μια αναζήτηση της λέξης subject «υποκείμενο», η υπολογιστική μηχανή δίνει μια πληθώρα απαντήσεων όπως:

(α) Δεκαπέντε ξεχωριστές σημασίες: οκτώ για το ουσιαστικό subject, τρεις για το ρήμα και τέσσερις για το επίθετο.

(β) Στοιχεία για την ετυμολογία της λέξης.

(γ) Στοιχεία για τη συχνότητα της λέξεις σε προφορικά και γραπτά σώματα κειμένων, βασισμένο στο Βρετανικό Εθνικό Σώμα (British National Corpus, BNC).

(δ) Την προφορά σε Διεθνές Φωνητικό Αλφάβητο.

(ε) Τα συνώνυμα για το ουσιαστικό, ρήμα και επίθετο.

(στ) Δίνει υπερώνυμα ή ευρύτερους όρους και υπώνυμα στενότερους όρους,

(ζ) Ένα δίκτυο συνωνύμων σε γράφημα και

(η) Το συλλαβισμό της λέξης.

Ο χρήστης μπορεί να ζητήσεις και ειδικότερες απαντήσεις για παράδειγμα αν τροφοδοτήσει τη μηχανή με το ερώτημα «synonyms of answer» θα πάρει ως απάντηση τα συνώνυμα του ρήματος και του ουσιαστικού answer.

Σε επίπεδο γραμματικής ανάλυσης, η υπολογιστική μηχανή Wolfram | Alpha έχει τη δυνατότητα στατιστικής τεχνολόγησης (parsing) προτάσεων και της ανάλυσής τους σε ομάδες σύμφωνα με δεδομένες γραμματικές (n-grams). Τροφοδοτήσαμε για παράδειγμα την υπολογιστική μηχανή με την τυχαία πρόταση «I have a cat, my cat is black» και το αποτέλεσμα ήταν μια σειρά από ν-γραμματικές (n-grams) σε επίπεδο φωνητικό και σε επίπεδο λεξικό.

Τα πιο κάτω δενδροδιαγράμματα είναι το αποτέλεσμα της λεξικής κατανομής που προέκυψε από την ανάλυση της πρότασης (σημειώνεται ότι η επιλογή της χρήσης γραμματικής ανάλυσης με έλεγχο περιβάλλοντος τριών λέξεων (tri-gram) ήταν αυτόματη, αν και η μηχανή δίνει τη δυνατότητα και άλλης ανάλυσης).

Οι δυνατότητες αυτής της μηχανής δεν περιορίζονται εδώ. Σύμφωνα με τους δημιουργούς της βρίσκεται ακόμη σε πρώιμη μορφή και χρειάζεται περισσότερη επέκταση, ωστόσο οι προοπτικές της και οι ευρύτερη σύλληψή της δείχνουν μια μηχανή που εστιάζει όχι τόσο πλέον στην εύρεση ήδη υπάρχουσας στατικής γνώσης αλλά στην ανάλυση και στην επεξεργασία στατικών δεδομένων για την απάντηση πραγματικών ερωτημάτων.

Ήδη η υπολογιστική μηχανή αναζήτησης Wolfram | Alpha, η ανάπτυξη αλγορίθμων εξόρυξης δεδομένων (data mining), του σημασιολογικού δικτύου κ.ά. τομέων της τεχνητής νοημοσύνης, καθιστούν επίκαιρο το πρόβλημα της κατανόησης και ανάλυσης της φυσικής γλώσσας.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s