Μεταπτυχιακές Διατριβές GRI-2011-6209

Τίτλος:Σημασιολογικός προσδιορισμός απόψεων και υποκειμενική ταξινόμηση μηνυμάτων κοινωνικών δικτύων - Μελέτη περίπτωσης Twitter
Semantic opinion orientation and subjectivity classification of short messages – Case study Twitter
Συγγραφείς:Τσαγκαλίδου Αικατερίνη Λάζαρου
Σχολή/Τμήμα: Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Θετικών Επιστημών, Τμήμα Πληροφορικής
Γλώσσα:Ελληνικά
Ημ/νία έκδοσης:2011
Περίληψη:Στην παρούσα διπλωματική εργασία, σχεδιάσθηκε και υλοποιήθηκε μια μέθοδος για τον σημασιολογικό προσδιορισμό των απόψεων και την υποκειμενική ταξινόμηση μηνυμάτων του κοινωνικού δικτύου Twitter. Τα μηνύματα αξιολογούνται ως θετικά και αρνητικά σε σχέση με ένα ερώτημα. Η υλοποίηση έγινε με τη γλώσσα προγραμματισμού Python και τα δεδομένα προήλθαν από το api της υπηρεσίας. Αρχικώς οριοθετείται το ερευνητικό πεδίο και καταγράφονται συνοπτικά οι θεωρητικές έννοιες και οι επικρατέστερες μέθοδοι σημασιολογικής ανάλυσης. Παρουσιάζονται οι βασικές τεχνικές δημιουργίας λεξικών απόψεων και επισημαίνονται τα πλεονεκτήματα και τα μειονεκτήματα της συγκεκριμένης τεχνικής. Αναφέρονται συνοπτικά στατιστικά στοιχεία της micro-blogging υπηρεσίας Twitter και επισημαίνονται οι δυσκολίες ανάλυσης των σύντομων μηνυμάτων. Στη συνέχεια παρουσιάζεται η μέθοδος που προτείνεται η οποία χωρίζεται σε τρεις επιμέρους φάσεις. Η πρώτη, αφορά στη συλλογή των δεδομένων και στην προετοιμασία τους, η δεύτερη είναι σχετική με τη δημιουργία ενός εμπλουτισμένου λεξικού απόψεων που περιέχει λέξεις και φράσεις τις αγγλικής γλώσσας σημασιολογικά βαθμολογημένες, ενώ στη τρίτη φάση υλοποιούνται lexicon-based τεχνικές για την υποκειμενική ταξινόμηση των μηνυμάτων και τον σημασιολογικό προσδιορισμό των απόψεων των χρηστών. Τέλος παρουσιάζονται τα αποτελέσματα της πειραματικής διαδικασίας, καταγράφονται τα συμπεράσματα και προτείνονται τεχνικές για την περαιτέρω βελτίωση της μεθόδου.

This thesis describes the implementation of a method for the semantic opinion orientation and subjectivity classification of short messages coming from the micro-blogging service Twitter. Tweet messages are assessed as positive and negative with respect to a query. The implementation was done with the object-oriented high level computer language Python and our datasets were taken via the Application Programming Interface – API of Twitter. Primarily we have study the research domain of Opinion Mining and Sentiment Analysis and highlight the unsolved problems that researchers facing now days. We record the theoretical concepts of the field and highlight the usefulness of lexicon-based techniques. The semantic analysis of our method relies on an opinion lexicon which furthermore enriched with synonymous words from WordNet (synsets). Our lexicon contains words and small phrases which are scored with an arithmetic value that indicate the semantic orientation of them and is independent from text. Finally we evaluate the results of our experiment processes and propose furthermore improvements for our method.
Επιβλέπων:Βακάλη, Αθηνά αναπληρώτρια καθηγήτρια
Λέξεις Κλειδιά:Σημασιολογικός προσδιορισμός Υποκειμενική ταξινόμηση, Semantic opinion orientation, Subjectivity classification, Social networks, Κοινωνικά δίκτυα
Σχετικά αρχεία:Πλήρες κείμενο: PDF Αρχείο με άδεια χρήσης Δείτε την σχετική άδεια κάνοντας κλικ εδώ!


 Δημιουργία εγγραφής 2011-03-04, τελευταία τροποποίηση 2015-04-30


Πλήρες κείμενο:
Κατέβασμα πλήρους κειμένου
PDF Αρχείο
με άδεια:Δείτε την σχετική άδεια κάνοντας κλικ εδώ!