Περί Λόγου

May 21, 2009

Υπολογιστική Μηχανή Αναζήτησης Wolfram|Alpha

Filed under: Uncategorized — . @ 1:12 pm

Η Wolfram|Alpha είναι μια καινούργια μηχανή αναζήτησης πολύ διαφορετική από τη δημοφιλή GOOGLE, η οποία δεν αναζητεί πληροφορίες σε ιστοσελίδες σύμφωνα με λέξεις κλειδιά, αλλά ουσιαστικά επιχειρεί να δώσει απαντήσεις από μια δική της βάση δεδομένων.

Η μηχανή, πολύ διαφορετικά από τις υπάρχουσες μηχανές αναζήτησης, αξιοποιεί μαθηματικούς αλγορίθμους, καθώς έχει ως υπόβαθρο το λογισμικό Mathematica και μια σειρά δεδομένων. Με αυτά μπορεί να εξάγει απαντήσεις σε ερωτήματα που θέτουν οι χρήστες.

Στόχος της Wolfram | Alpha «είναι η συλλογή και η επεξεργασία όλων των αντικειμενικών δεδομένων, η εφαρμογή κάθε γνωστού μοντέλου, μεθόδου ή αλγορίθμου και δυνατότητα να υπολογιστεί κάθε τι που υπολογίζεται». Επιπλέον, επιδιώκει να οικοδομήσει πάνω στα επιτεύγματα της επιστήμης και σε άλλη συστηματοποιημένη γνώση, ώστε να αποτελέσει μια πηγή στην οποία μπορεί κανείς να βασιστεί, για να εξασφαλίσει οριστικές απαντήσεις σε πραγματικά ερωτήματα.

Αν κανείς τοποθετήσει στο ερώτημα (query) στη Wolfram | Alpha, για παράδειγμα, τις λέξεις κλειδιά Greece Germany, το αποτέλεσμα δεν είναι ένας κατάλογος ιστοσελίδων με τις λέξεις αυτές, αλλά μια συγκριτική προβολή στοιχείων για τις δύο χώρες, όπως στοιχεία που αφορούν στις διεθνείς ονομασίες των χωρών, χάρτες, αποστάσεις, διάφορα στατιστικά για τον πληθυσμό, το προσδόκιμο ζωής κτλ., καθώς και άλλες πληροφορίες οικονομικής φύσεως όπως το ακαθάριστο εθνικό εισόδημα.

Η σπουδαιότητα αυτής της μηχανής για την Γλωσσολογία και ειδικότερα για την Υπολογιστική Γλωσσολογία είναι μεγάλη. Η υπολογιστική μηχανή αναζήτησης περιλαμβάνει στοιχεία που δείχνουν ότι μπορεί να επεξεργάζεται και να τεχνολογεί γλωσσικά δεδομένα και από αυτά να δίνει απαντήσεις.

Δίνεται επιπλέον η δυνατότητα για αναζήτηση πληροφορίας με ερωτήματα τα οποία περιλαμβάνουν στοιχεία φυσικής γλώσσας. Στην ουσία ο χρήστης μπορεί να δώσει το ερώτημα σε φυσική γλώσσας, η μηχανή αναζήτησης ωστόσο δεν «καταλαβαίνει» φυσική γλώσσα αλλά εντοπίζει τις λέξεις κλειδιά του ερωτήματος:

 

Ενδεικτικά στην ερώτηση «What is your name?» η μηχανή απαντά «My name is Wolfram | Alpha», ενώ στην ερώτηση «How are you?», απάντησε «I am doing well, thank you» και στο χαιρετισμό «Hello» ανταποκρίνεται με το ωραίο «Hello, human», ενώ στην ερώτηση δε “Who wrote the Iliad?”, δίνει ως απάντηση Homer.

Βέβαια, αυτά μπορεί να μην εντυπωσιάζουν ένα γλωσσολόγο που γνωρίζει ότι και χωρίς πραγματική γλωσσική επεξεργασία ένας αλγόριθμος μπορεί να μιμηθεί ανθρώπινες απαντήσεις, όπως έκανε ήδη από τα μέσα του 1960 το πρόγραμμα ELIZA και άλλα μεταγενέστερα.

Ωστόσο, υπάρχουν ορισμένες δυνατότητες που όντως είναι σημαντικές, σχετικές με τη λεξικογραφία και τη στατιστική γραμματική ανάλυση. Για παράδειγμα σε μια αναζήτηση της λέξης subject «υποκείμενο», η υπολογιστική μηχανή δίνει μια πληθώρα απαντήσεων όπως:

(α) Δεκαπέντε ξεχωριστές σημασίες: οκτώ για το ουσιαστικό subject, τρεις για το ρήμα και τέσσερις για το επίθετο.

(β) Στοιχεία για την ετυμολογία της λέξης.

(γ) Στοιχεία για τη συχνότητα της λέξεις σε προφορικά και γραπτά σώματα κειμένων, βασισμένο στο Βρετανικό Εθνικό Σώμα (British National Corpus, BNC).

(δ) Την προφορά σε Διεθνές Φωνητικό Αλφάβητο.

(ε) Τα συνώνυμα για το ουσιαστικό, ρήμα και επίθετο.

(στ) Δίνει υπερώνυμα ή ευρύτερους όρους και υπώνυμα στενότερους όρους,

(ζ) Ένα δίκτυο συνωνύμων σε γράφημα και

(η) Το συλλαβισμό της λέξης.

Ο χρήστης μπορεί να ζητήσεις και ειδικότερες απαντήσεις για παράδειγμα αν τροφοδοτήσει τη μηχανή με το ερώτημα «synonyms of answer» θα πάρει ως απάντηση τα συνώνυμα του ρήματος και του ουσιαστικού answer.

Σε επίπεδο γραμματικής ανάλυσης, η υπολογιστική μηχανή Wolfram | Alpha έχει τη δυνατότητα στατιστικής τεχνολόγησης (parsing) προτάσεων και της ανάλυσής τους σε ομάδες σύμφωνα με δεδομένες γραμματικές (n-grams). Τροφοδοτήσαμε για παράδειγμα την υπολογιστική μηχανή με την τυχαία πρόταση «I have a cat, my cat is black» και το αποτέλεσμα ήταν μια σειρά από ν-γραμματικές (n-grams) σε επίπεδο φωνητικό και σε επίπεδο λεξικό.

Τα πιο κάτω δενδροδιαγράμματα είναι το αποτέλεσμα της λεξικής κατανομής που προέκυψε από την ανάλυση της πρότασης (σημειώνεται ότι η επιλογή της χρήσης γραμματικής ανάλυσης με έλεγχο περιβάλλοντος τριών λέξεων (tri-gram) ήταν αυτόματη, αν και η μηχανή δίνει τη δυνατότητα και άλλης ανάλυσης).

Οι δυνατότητες αυτής της μηχανής δεν περιορίζονται εδώ. Σύμφωνα με τους δημιουργούς της βρίσκεται ακόμη σε πρώιμη μορφή και χρειάζεται περισσότερη επέκταση, ωστόσο οι προοπτικές της και οι ευρύτερη σύλληψή της δείχνουν μια μηχανή που εστιάζει όχι τόσο πλέον στην εύρεση ήδη υπάρχουσας στατικής γνώσης αλλά στην ανάλυση και στην επεξεργασία στατικών δεδομένων για την απάντηση πραγματικών ερωτημάτων.

Ήδη η υπολογιστική μηχανή αναζήτησης Wolfram | Alpha, η ανάπτυξη αλγορίθμων εξόρυξης δεδομένων (data mining), του σημασιολογικού δικτύου κ.ά. τομέων της τεχνητής νοημοσύνης, καθιστούν επίκαιρο το πρόβλημα της κατανόησης και ανάλυσης της φυσικής γλώσσας.

April 21, 2009

Ideology True Value and Erroneous Usage

Filed under: Uncategorized — . @ 11:04 am

Sometimes is considered as synonymous to dogma, or to a set of narrow-minded ideas embraced by fanatics who differentiate themselves from the rest members of a group, ideology and its function in modern societies is the topic of the discussion in this article. According to the mainstream dictionary definitions ideology is a meaningful social system of beliefs where every action derives. Accordingly ideology is closely interrelated to the goals set by interactional units of society, such as persons, minority groups or even the large majority. However ideology is not a system that stands outside society but derives from society. In many ways ideology resembles a discourse or text which has many different readings and creates different perceptions depending on the people and their background.

This interrelation of ideology with society poses the problem of the roots of such a system of ideas. In fact this problem cannot be solved just by naming an array of groups of people, furthermore, nothing can define a set o people, but a name, which people assing to a group in order to distinguish it from another group, identifying in this way a difference in group dynamics and in the way groups approach social, moral or other issues. However we will persist on this in order to give some examples of well accepted social entities that produce ideology.

First of all the community as a whole is carrier of the so called oral tradition i.e. a set of beliefs, stories and philosophies that go from generation to generation. Oral tradition carries the standards that pass through stories and other means to the younger generations. The development of writing surely confined oral tradition and turned oral societies to literate ones, without, however success in diminishing peoples’ oral memory.

Plato in his book “Res Puclica” speaks about the foundational myth, a story that members of a nation or state adopt in order to discriminate themselves as a group from other states and nations. Plato considers foundational myth as very important for the success of the state. Examples of foundational myths can be found in modern nations as well defining in this way their origins. Accordingly Plato admits that ideology whether it has real bases or not it is crucial for the development of a country.

Liberalism, communism etc. constitute different administrative systems in different countries bearing different kinds of ideologies. It is not unusual at all for people to immediately associate an administrative system with an ideology. Even political parties’ stand is usually related to ideology. For example the major opposition party (Πασόκ) in Greece after an election defeat in 2007 fell in a political crisis which was attributed to an assumed blurred ideology. However it is often difficult to discriminate the different perceptions or the different readings that political parties do to certain situations if we exclude some exceptional occurrences such as the communist party in Greece that holds a clear-cut policy for most of the cases.

The same is true for many other factors considered as ideology producers. To enumerate some: first the church as a vehicle of religious beliefs, produces certain ideological frames; second the approved by the state-country educational philosophy that transfers to student the majority class’s ideology; third economical factors and social position related to these factors were considered by Marx as crucial to the production of the so called class ideology but this is not always the case since people of the same financial standards and social positions may have different ideologies and thus different political views. Just to make an account of all the factors is quite complicated task.

July 8, 2008

Γλώσσα χωρίς λέξεις που εκφράζουν αριθμούς;

Filed under: Uncategorized — . @ 3:34 pm

Ο καθηγητής της γνωσιακής επιστήμης στο ΜΙΤ Edward Gibson υποστηρίζει σε άρθρο του στο περιοδικό Cognition ότι μέλη της φυλής Piraha του Αμαζονίου (βορειοδυτική Βραζιλία) δεν έχουν την έννοια του ‘ενός’ ή οποιουδήποτε άλλου αριθμού στη γλώσσα τους, αλλά χρησιμοποιούν λέξεις που σημαίνουν ‘ορισμένος’, ‘περισσότερος’ για να εκφράσουν την ποσότητα.

Εικόνα 1 Άνδρας από τη φυλή Piraha που συμμετείχε στα πειράματα με βάση τα οποία οι καθηγητές του ΜΙΤ υποστηρίζουν ότι η γλώσσα τους δεν περιέχει αριθμούς (Φωτογραφία Edward Gibson)

Είχε θεωρηθεί ότι η καταμέτρηση είναι κληρονομικό χαρακτηριστικό των ανθρώπων, ωστόσο υπάρχει σύμφωνα με τον Gibson η φυλή αυτή που αποδεικνύει το αντίθετο. Αυτό δεν σημαίνει φυσικά ότι δεν μπορούν να μάθουν να μετρούν.

Είχε βρεθεί σε μελέτη του 2004 ότι η Piraha χρησιμοποιούν το ένα, το δύο και το περισσότερο για καταμέτρηση. Αυτή όμως η διαπίστωση καταρρίπτεται από την νεότερη έρευνα του Gibson όπου φάνηκε ότι στην πραγματικότητα δεν εκφράζονται αριθμοί αλλά σχετικές ποσότητες.

Από http://web.mit.edu/newsoffice/2008/language-0624.html

Blog at WordPress.com.