Πτυχιακές Εργασίες GRI-2013-11111

Τίτλος:Συνδυαστική Χρήση Μετρικών Ανάκτησης Πληροφορίας στην Εύρεση Δημοφιλών Τάσεων στο Περιβάλλον του Twitter.
Συγγραφείς:Μοτεσνίτσαλης Ευάγγελος.
Σχολή/Τμήμα: Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Θετικών Επιστημών, Τμήμα Πληροφορικής
Γλώσσα:Ελληνικά
Φυσική Περιγραφή:90 σελ.
Ημ/νία έκδοσης:2013
Περίληψη:Στην διπλωματική αυτή εργασία ασχολούμαστε με τις Δημοφιλείς Τάσεις, γνωστές και ως Trending Topics στο περιβάλλον του Twitter. Στόχος μας είναι η βελτιστοποίηση των Trending Topics σε επίπεδο ποσότητας, ποιότητας και ταχύτητας εύρεσης. Για το λόγο αυτό παρουσιάζουμε τον αλγόριθμο «IRMonTrends» επιχειρώντας μια σχετικά καινοτόμα προσέγγιση που συνδυάζει τη χρήση μετρικών συχνότητας, κανονικοποιημένης συχνότητας, εντροπίας και TF-IDF από διαφορετικές ερευνητικές προσεγγίσεις. Στα πλαίσια της εργασίας, υλοποιούμε επίσης μια εκτενή ανάλυση της υπάρχουσας βιβλιογραφίας, εστιάζοντας σε μεθοδολογίες που βασίζονται στη Θεωρία Γράφων, στην Θεωρία Αυτομάτων, στις Τεχνικές της Συσταδοποίησης και της Ανάλυσης Συσχετιζόμενων Τάσεων, σε Μη Παραμετρικές Τεχνικές που βασίζονται σε Συνελίξεις Σημάτων και Εξελισσόμενους Γράφους και σε διάφορες άλλες μεθοδολογίες εύρεσης Δημοφιλών Τάσεων που χρησιμοποιούνται σήμερα από ερευνητές. Η ανάλυση και ο σχολιασμός των αποτελεσμάτων αυτής της έρευνας γίνεται στο τελευταίο κεφάλαιο της εργασίας. Η υλοποίηση της τεχνικής πραγματοποιήθηκε σε γλώσσα Java και με την χρήση της βιβλιοθήκης Stanford NLP, ενώ για την ανάλυση της απόδοσης της σχεδιάζεται να χρησιμοποιηθεί στο μέλλον ένα μεγάλο σετ δεδομένων μεγέθους 45 GB με εκ των προτέρων γνωστά Trending Topics και με δεδομένα από το περιβάλλον του Twitter μεταξύ του Ιανουαρίου 2009 και του Φεβρουαρίου 2009.
Επιβλέπων:Βακάλη, Αθηνά.
Λέξεις Κλειδιά:Information Retrieval Metrics, Trending Topics, Twitter, Τουΐτερ, Μετρικές Ανάκτησης Πληροφορίας, Δημοφιλείς Τάσεις


 Δημιουργία εγγραφής 2013-07-19, τελευταία τροποποίηση 2015-04-30