Μεταπτυχιακές Διατριβές GRI-2015-14211

Τίτλος:Multilevel Cascaded Analysis for Sentiment Extraction from Movie Reviews
Πολυεπίπεδη Διαδοχική Ανάλυση για την Εξαγωγή Συναισθήματος από Κριτικές Ταινιών
Συγγραφείς:Πασσαλής Νικόλαος Χαραλάμπους
Σχολή/Τμήμα: Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Θετικών Επιστημών, Τμήμα Πληροφορικής
Γλώσσα:Ελληνικά
Ημ/νία έκδοσης:2015
Περίληψη:A great amount of research is devoted to identifying and extracting the sentiment from texts. However, the classification accuracy remains quite low in comparison to other applications of natural language processing, such as topic extraction. We believe that a method capable of extracting and combining information from different text-levels, such as words and sentences, would be able to capture the sentiment of documents more accurately than existing techniques. In this thesis we propose three improved methods for cascaded sentiment analysis (semantic center, codebook and mixed-error autoencoders). Also, we introduce a new feature extraction approach for sentiment analysis, the multilevel cascaded sentiment analysis. We experimentally evaluate the proposed methods using two movie reviews datasets. Multilevel cascaded sentiment analysis was able to exceed the state-of-the art accuracy in one dataset by 1.1% and achieve the second best result in the other. We also provide statistically significant evidence that our method can lead to accuracy gains when combined with other document-level classifiers.

Ένα σημαντικό κομμάτι της έρευνα στον τομέα της μηχανικής μάθησης αφορά στην εξαγωγή του συναισθήματος από κείμενα. Παρόλα αυτά, η ακρίβεια της κατηγοριοποίησης των κειμένων με βάση το συναίσθημα που εκφράζουν παραμένει ιδιαίτερα χαμηλή, σε σχέση με άλλες εφαρμογές, όπως η εξαγωγή του θέματος ενός κειμένου. Πιστεύουμε ότι μία μέθοδος ικανή να εξάγει και να συνδυάσει πληροφορίες από διαφορετικά επίπεδα ενός κειμένου, όπως οι λέξεις και οι προτάσεις, θα ήταν σε θέση να βελτιώσει την ακρίβεια αναγνώρισης του συναισθήματος. Στην παρούσα μελέτη προτείνουμε τρείς μεθόδους για την εξαγωγή του συναισθήματος ενός κειμένου βασιζόμενοι στις επισημάνσεις των προτάσεών του (cascaded sentiment analysis). Επίσης, προτείνουμε τη χρήση μίας νέας προσέγγισης, της multilevel cascaded sentiment analysis, ικανής να συνδυάσει πληροφορία από διαφορετικά επίπεδα ενός κειμένου. Αξιολογούμε τις προτεινόμενες μεθόδους χρησιμοποιώντας δύο σύνολα δεδομένων από ταινίες. Η τεχνική multilevel cascaded sentiment analysis ξεπέρασε την καλύτερη μέθοδο που είχε προταθεί στη βιβλιογραφία κατά 1.1% στο ένα dataset και πέτυχε το δεύτερο καλύτερο αποτέλεσμα στο άλλο σύνολο δεδομένων. Επίσης, παρέχουμε στατιστικά σημαντικές ενδείξεις για το ότι η μέθοδος μας μπορεί να οδηγήσει σε βελτίωση της ακρίβειας οποιουδήποτε άλλου κατηγοριοποιητή επιπέδου εγγράφου.
Επιβλέπων:Βακάλη, Αθηνά καθηγήτρια
Λέξεις Κλειδιά:Κατηγοριοποίηση Κειμένων, Μηχανική Μάθηση, Machine Learning, Εξαγωγή Συναισθήματος, Sentiment Extraction, Text Classification
Σχετικά αρχεία:Πλήρες κείμενο: PDF Αρχείο με άδεια χρήσης Δείτε την σχετική άδεια κάνοντας κλικ εδώ!


 Δημιουργία εγγραφής 2015-03-12, τελευταία τροποποίηση 2015-04-30


Πλήρες κείμενο:
Κατέβασμα πλήρους κειμένου
PDF Αρχείο
με άδεια:Δείτε την σχετική άδεια κάνοντας κλικ εδώ!