Exporting Endnote Bibliography to JabRef

It doesn’t seem to exist a ready-made solution for exporting Endnote Bibliography to JabRef, and since many are wondering how to transfer their bibliography, this blog article provides a solution.

First, go to http://www.zotero.org/ and download Zotero standalone or Zotero plugin for Firefox.

To export your Endnote bibliography in RIS format: In the menu Edit > Output Styles > Open Style Manager… select export to RefMan (RIS) Export (the Bibtex Export does not seem to work fine in my system but you can give it a try just save the file as Bibtex <library.bib> and try to open it from JabRef). The export this from the File > Export Menu (make the appropriate selections in the dialog).

Then go to Zotero and import this file by clicking the icon  found on Zotero’s menu bar:

You may also follow the instructions found here, to import a bibliography into Zotero from Endnote.

Then Export this to Refer/Bibix and store it to your bibliographies folder and open this by using JabRef and save your bibliography from JabRef.

Advertisements

the big vowel bang

Sometimes a conversation about (Greek) vowels can be artistically inspiring!

Here is the R code for that:

# using matplot.

par(bg=’black’, col.axis=’white’, col.main=’white’)

matplot(x, outer(x, 1:5, function(x, k) sin(k*pi * x^2)),

pch = c(“α”,”ε”,”η”,”ι”, “ο”), type = c(“b”,”p”,”o”), main=”the big vowel bang”, bg=’red’)

grid()

Manipulating Files in R: Renaming

R is not just for statistics, it provides many other functions that can make life much easier. In this post I provide a solution for renaming different files.

Problem

I wanted to remove the substrings ‘TextGrid’ and ‘Sound’ from a list of Praat generated filesnames. The filenames had the following form:

TextGrid_Soundname.TextGrid
Sound_Soundname.wav

Solution

#Using R to Replace FileNames

path_origin <- “C:\\Sounds\\”

files <- list.files(path_origin) # Get a list of files in R.

xfiles <- paste(path_origin, files, sep = “”) # add the full path, (I removed the space inserted between two concatenated strings by using sep=””)

sapply(path_origin, function(path_origin) # sapply(list, function, …, simplify)

{

file.rename(xfiles, sub(“Sound “, “”, xfiles)) # renaming the files by using the sub() function, the first argument xfiles is the list of files, the second is the new name for each file. It simply removes “Sound “.

}

)

You may use this solution to change part of the filename or the file extension by choosing the appropriate sub() parameters.

! Be careful with the choice of the path and the sub() parameters; if you choose the wrong parameters then you may get unexpected results.

More Information

http://stat.ethz.ch/R-manual/R-patched/library/base/html/files.html

R Library: Advanced functions

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License.

Playing with words (just for fun)!

This slideshow requires JavaScript.

The wordcloud or tag cloud is a visual representation for text data; the frequent words are bigger and the infrequent ones smaller.  This post’s graph is made on R (by using the wordcloud package). An article from the New York Times, is the input for the graph but you may use your own corpus. An annotated code follows, to understand its logic,

Code:
require(wordcloud)
#using the wordcloud package

require(tm)

data(crude) #crude is a corpus with 20 text documents

crude <- tm_map(crude, removePunctuation) #normalization

crude <- tm_map(crude, function(x)removeWords(x,stopwords()))

tdm <- TermDocumentMatrix(crude) # Creating a term-document matrix (924 terms and 20 documents)

m <- as.matrix(tdm) #Converting tdm to a matrix

v <- sort(rowSums(m),decreasing=TRUE)

d <- data.frame(word = names(v),freq=v) #creating a dataframe

wordcloud(d$word,d$freq) # it gets the column ‘word’ along with the column frequency from the dataframe and creates the wordcloud.
Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License.

Using Praat on Ubuntu 11.10

There is an issue that prevents Praat from running on Ubuntu 11.10, this can be solved if one runs Praat while suspending PulseAudio. This is done from the Terminal (use sudo in case that the following does not work).

pasuspenderpraat

This should run Praat without problems (at 44.1 kHz, or at any sample rate from version 5.3.04 on).

(see also the discussion in Praat Users Group).

Εισαγωγή χαρακτήρων Διεθνούς Φωνητικού Αλφαβήτου

Αν επιθυμεί κανείς να εισαγάγει χαρακτήρες του ΔΦΑ στα κείμενά του εύκολα και γρήγορα από το πληκτρολόγιο μπορεί να κατεβάσει το πρόγραμμα από εδώ και να το εγκαταστήσει στον υπολογιστή του (χρειάζεται να γίνει πρώτα unzip). Μετά όταν περάσετε στα Αγγλικά θα δείτε δίπλα από τη γραμμή της γλώσσας κάτω δεξιά στην μπάρα εργασιών να εμφανίζεται ένα μικρό πληκτρολόγιο. Κάντε κλικ σε αυτό και επιλέξτε United States – Custom.

Η εισαγωγή ενός συμβόλου γίνεται με τη χρήση του <AltGr> (δεξί Alt) βλ. Εικόνα 2 ή με το <Ctrl> για επιπλέον σύμβολα βλ. Εικόνα 3.

AltGr + <Symbol>

Ctrl + <Symbol>

Στη σχετική ιστοσελίδα μπορείτε να βρείτε περισσότερες πληροφορίες.

Υπολογιστική Μηχανή Αναζήτησης Wolfram|Alpha

Η Wolfram|Alpha είναι μια καινούργια μηχανή αναζήτησης πολύ διαφορετική από τη δημοφιλή GOOGLE, η οποία δεν αναζητεί πληροφορίες σε ιστοσελίδες σύμφωνα με λέξεις κλειδιά, αλλά ουσιαστικά επιχειρεί να δώσει απαντήσεις από μια δική της βάση δεδομένων.

Η μηχανή, πολύ διαφορετικά από τις υπάρχουσες μηχανές αναζήτησης, αξιοποιεί μαθηματικούς αλγορίθμους, καθώς έχει ως υπόβαθρο το λογισμικό Mathematica και μια σειρά δεδομένων. Με αυτά μπορεί να εξάγει απαντήσεις σε ερωτήματα που θέτουν οι χρήστες.

Στόχος της Wolfram | Alpha «είναι η συλλογή και η επεξεργασία όλων των αντικειμενικών δεδομένων, η εφαρμογή κάθε γνωστού μοντέλου, μεθόδου ή αλγορίθμου και δυνατότητα να υπολογιστεί κάθε τι που υπολογίζεται». Επιπλέον, επιδιώκει να οικοδομήσει πάνω στα επιτεύγματα της επιστήμης και σε άλλη συστηματοποιημένη γνώση, ώστε να αποτελέσει μια πηγή στην οποία μπορεί κανείς να βασιστεί, για να εξασφαλίσει οριστικές απαντήσεις σε πραγματικά ερωτήματα.

Αν κανείς τοποθετήσει στο ερώτημα (query) στη Wolfram | Alpha, για παράδειγμα, τις λέξεις κλειδιά Greece Germany, το αποτέλεσμα δεν είναι ένας κατάλογος ιστοσελίδων με τις λέξεις αυτές, αλλά μια συγκριτική προβολή στοιχείων για τις δύο χώρες, όπως στοιχεία που αφορούν στις διεθνείς ονομασίες των χωρών, χάρτες, αποστάσεις, διάφορα στατιστικά για τον πληθυσμό, το προσδόκιμο ζωής κτλ., καθώς και άλλες πληροφορίες οικονομικής φύσεως όπως το ακαθάριστο εθνικό εισόδημα.

Η σπουδαιότητα αυτής της μηχανής για την Γλωσσολογία και ειδικότερα για την Υπολογιστική Γλωσσολογία είναι μεγάλη. Η υπολογιστική μηχανή αναζήτησης περιλαμβάνει στοιχεία που δείχνουν ότι μπορεί να επεξεργάζεται και να τεχνολογεί γλωσσικά δεδομένα και από αυτά να δίνει απαντήσεις.

Δίνεται επιπλέον η δυνατότητα για αναζήτηση πληροφορίας με ερωτήματα τα οποία περιλαμβάνουν στοιχεία φυσικής γλώσσας. Στην ουσία ο χρήστης μπορεί να δώσει το ερώτημα σε φυσική γλώσσας, η μηχανή αναζήτησης ωστόσο δεν «καταλαβαίνει» φυσική γλώσσα αλλά εντοπίζει τις λέξεις κλειδιά του ερωτήματος:

 

Ενδεικτικά στην ερώτηση «What is your name?» η μηχανή απαντά «My name is Wolfram | Alpha», ενώ στην ερώτηση «How are you?», απάντησε «I am doing well, thank you» και στο χαιρετισμό «Hello» ανταποκρίνεται με το ωραίο «Hello, human», ενώ στην ερώτηση δε “Who wrote the Iliad?”, δίνει ως απάντηση Homer.

Βέβαια, αυτά μπορεί να μην εντυπωσιάζουν ένα γλωσσολόγο που γνωρίζει ότι και χωρίς πραγματική γλωσσική επεξεργασία ένας αλγόριθμος μπορεί να μιμηθεί ανθρώπινες απαντήσεις, όπως έκανε ήδη από τα μέσα του 1960 το πρόγραμμα ELIZA και άλλα μεταγενέστερα.

Ωστόσο, υπάρχουν ορισμένες δυνατότητες που όντως είναι σημαντικές, σχετικές με τη λεξικογραφία και τη στατιστική γραμματική ανάλυση. Για παράδειγμα σε μια αναζήτηση της λέξης subject «υποκείμενο», η υπολογιστική μηχανή δίνει μια πληθώρα απαντήσεων όπως:

(α) Δεκαπέντε ξεχωριστές σημασίες: οκτώ για το ουσιαστικό subject, τρεις για το ρήμα και τέσσερις για το επίθετο.

(β) Στοιχεία για την ετυμολογία της λέξης.

(γ) Στοιχεία για τη συχνότητα της λέξεις σε προφορικά και γραπτά σώματα κειμένων, βασισμένο στο Βρετανικό Εθνικό Σώμα (British National Corpus, BNC).

(δ) Την προφορά σε Διεθνές Φωνητικό Αλφάβητο.

(ε) Τα συνώνυμα για το ουσιαστικό, ρήμα και επίθετο.

(στ) Δίνει υπερώνυμα ή ευρύτερους όρους και υπώνυμα στενότερους όρους,

(ζ) Ένα δίκτυο συνωνύμων σε γράφημα και

(η) Το συλλαβισμό της λέξης.

Ο χρήστης μπορεί να ζητήσεις και ειδικότερες απαντήσεις για παράδειγμα αν τροφοδοτήσει τη μηχανή με το ερώτημα «synonyms of answer» θα πάρει ως απάντηση τα συνώνυμα του ρήματος και του ουσιαστικού answer.

Σε επίπεδο γραμματικής ανάλυσης, η υπολογιστική μηχανή Wolfram | Alpha έχει τη δυνατότητα στατιστικής τεχνολόγησης (parsing) προτάσεων και της ανάλυσής τους σε ομάδες σύμφωνα με δεδομένες γραμματικές (n-grams). Τροφοδοτήσαμε για παράδειγμα την υπολογιστική μηχανή με την τυχαία πρόταση «I have a cat, my cat is black» και το αποτέλεσμα ήταν μια σειρά από ν-γραμματικές (n-grams) σε επίπεδο φωνητικό και σε επίπεδο λεξικό.

Τα πιο κάτω δενδροδιαγράμματα είναι το αποτέλεσμα της λεξικής κατανομής που προέκυψε από την ανάλυση της πρότασης (σημειώνεται ότι η επιλογή της χρήσης γραμματικής ανάλυσης με έλεγχο περιβάλλοντος τριών λέξεων (tri-gram) ήταν αυτόματη, αν και η μηχανή δίνει τη δυνατότητα και άλλης ανάλυσης).

Οι δυνατότητες αυτής της μηχανής δεν περιορίζονται εδώ. Σύμφωνα με τους δημιουργούς της βρίσκεται ακόμη σε πρώιμη μορφή και χρειάζεται περισσότερη επέκταση, ωστόσο οι προοπτικές της και οι ευρύτερη σύλληψή της δείχνουν μια μηχανή που εστιάζει όχι τόσο πλέον στην εύρεση ήδη υπάρχουσας στατικής γνώσης αλλά στην ανάλυση και στην επεξεργασία στατικών δεδομένων για την απάντηση πραγματικών ερωτημάτων.

Ήδη η υπολογιστική μηχανή αναζήτησης Wolfram | Alpha, η ανάπτυξη αλγορίθμων εξόρυξης δεδομένων (data mining), του σημασιολογικού δικτύου κ.ά. τομέων της τεχνητής νοημοσύνης, καθιστούν επίκαιρο το πρόβλημα της κατανόησης και ανάλυσης της φυσικής γλώσσας.