13 Ιανουαρίου 2011

Οι λέξεις και το Google

O Chris Harrison σύλλεξε 100GB δεδομένων από ιστορικά αναζητήσεων του Google και συγκεκριμένα αναζητήσεις για ζευγάρια λέξεων (όπως π.χ. ζεστό-κρύο) και παρουσίασε τα αποτελέσματα σε πολύ όμορφα διαγράμματα που ονομάζονται bigrams.

Ένα bigram μοιάζει με αυτό στην παρακάτω εικόνα

Σε αυτό, στο κάτω μέρος φαίνεται το ζευγάρι των λέξεων και από επάνω τους φαίνονται διάφορες άλλες λέξεις που υπήρχαν μαζί με τις δύο κύριες στην αναζήτηση. Οι λέξεις αυτές βρίσκονται σε 25 ακτίνες, με την ακτίνα που βρίσκεται πιο κοντά στην κύρια λέξη να περιέχει πιο συχνά χρησιμοποιούμενες λέξεις. Επίσης όσο πιο κοντά στο κέντρο είναι η λέξη τόσο πιο συχνά χρησιμοποιείται.

Με τον παραπάνω τρόπο δημιουργείται αυτό το ενδιαφέρον γράφημα.
Δείτε επίσης το διάγραμμα για τις αναζητήσεις με το ζευγάρι λέξεων pc-mac αλλά και women-men:


Μπορείτε να δείτε και να κατεβάσετε όλα τα διαγράμματα που έφτιαξε ο Chris Harrison από την ιστοσελίδα του.

πηγή: gizmodo.com

Δεν υπάρχουν σχόλια:
Γράψτε σχόλια