Μεταπτυχιακές Διατριβές GRI-2012-9817

Τίτλος:Wavelet Based User Profile and Rating Representation to Address the Plasticity versus Stability Dilemma
Αναπαράσταση Προφίλ Χρήστη και Βαθμολογιών με Χρήση Κυματιδίων για την Αντιμετώπιση του Διλλήματος Ανάμεσα στην Προσαρμοστικότητα και την Σταθερότητα
Συγγραφείς:Καραγιαννίδης Σάββας Δημητρίου
Σχολή/Τμήμα: Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Θετικών Επιστημών, Τμήμα Πληροφορικής
Γλώσσα:Ελληνικά
Ημ/νία έκδοσης:2012
Περίληψη:Στην συγκεκριμένη διπλωματική θέτονται τα θεμέλια ενός νέου τρόπου αναπαράστασης των βαθμολογιών, προς αντικατάσταση της συμβατικής πλειάδας που χρησιμοποιείται μέχρι και σήμερα σε όλους τους προτασιακούς αλγορίθμους. Ο νέος τρόπος αναπαράστασης βασίζεται στην λογική δημιουργίας μη περιοδικών, θετικών κυματομορφών σταθερής ενέργειας αλλά μεταβλητού μήκους κύματος, πλάτους και ζωής για την αναπαράσταση της επιρροής προηγούμενων και νέων βαθμολογιών του χρήστη. Το συνημιτονοειδές κύμα επιλέχτηκε και προσαρμόστηκε για αυτόν τον σκοπό, με την επιλογή όμως μόνο του ¼ της φάσης που έχει, ώστε να κρατηθούν τα παραπάνω κριτήρια. Μέσω πειραμάτων που διεξήχθησαν σε υποσύνολο των δεδομένων που παρείχε η yahoo και συγκεκριμένα το R2 σύνολο δεδομένων της μουσικής εφαρμογής που υποστηρίζουν, αποδείξαμε ότι ο νέος τρόπος αναπαράστασης με τις μορφές που θέσαμε ότι μπορεί να χρησιμοποιηθεί, βελτιώνει τα αποτελέσματα του Naïve Bayes προτασιακού φίλτρου όσο αναφορά την ικανότητα προσαρμογής, την σταθερότητα αλλά και την κλιμάκωση σε ποσοστά 46.6%, 15.1% και 32.5% κατά μέσο όρο, αντίστοιχα, στην χειρότερη περίπτωση για τις προσαρμοσμένες στα νέα δεδομένα εκδόσεις του Naïve Bayes. Τα τρία αυτά κριτήρια χρησιμοποιήθηκαν διότι αποτελούν 3 από τα σημαντικότερα προβλήματα των σύγχρονων προτασιακών συστημάτων, προβλήματα που απασχολούν την ερευνητική κοινότητα αλλά των οποίων οι λύσεις επικεντρώνονται στους αλγορίθμους καθαυτούς και όχι στα δεδομένα. Οι τρείς μέθοδοι είναι χρήση μόνο των ενεργών βαθμολογιών, δηλαδή των βαθμολογιών των οποίων η κυματική αναπαράσταση δεν έχει φθείρει στο 0, χρήση του πλάτους των κυματομορφών των κατηγοριών, το άθροισμα των κυμάτων-βαθμολογιών που αντιστοιχούν στην κατηγορία στην οποία αντιστοιχεί και το νέο αντικείμενο προς πρόταση, και χρήση του πλάτους του εκάστοτε κύματος των βαθμολογιών αντικαθιστώντας συγκεκριμένο όρο της συνάρτησης βαθμολογίας του Naïve Bayes κατηγοριοποιειτή. Με άλλα λόγια, αποδεικνύεται στην δουλειά της διπλωματικής ότι χωρίς να γίνει αλλαγή του αλγορίθμου, αλλά μόνο με αλλαγή του τρόπου αναπαράστασης των βαθμολογιών της εφαρμογής και με σύγκριση και χρήση ενός αλγορίθμου που έχει αποδειχθεί ότι στα 2 από τα 3 προβλήματα επιτυγχάνει πολύ καλά αποτελέσματα (προσαρμογή και σταθερότητα) συγκριτικά με άλλους αλγορίθμους, επιτυγχάνουμε πολύ βελτιωμένα αποτελέσματα. Η διπλωματική χωρίζεται συνολικά σε 6 μέρη. Στο πρώτο μέρος γίνεται μία σύντομη εισαγωγή στον τομέα των προτασιακών συστημάτων, τους σκοπούς και τις ανάγκες της σύγχρονης κοινωνίας που εξυπηρετεί. Στο δεύτερο μέρος, ο τομέας των φίλτρων και των συστημάτων εξετάζονται πιο αναλυτικά καθώς και οι παραδοσιακές μετρικές που χρησιμοποιούνται για την μέτρηση των επιδόσεων και την σύγκρισή τους. Τα θετικά και τα αρνητικά τους επίσης αναφέρονται. Στο τρίτο μέρος, 3 από τα σημαντικότερα προβλήματα του τομέα παρουσιάζονται, η προσαρμοστικότητα, η σταθερότητα και η κλιμάκωση. Αυτά τα 3 είναι και τα προβλήματα στα οποία ελέγχεται ο νέος τρόπος αναπαράστασης. Στο τέταρτο μέρος, ο νέος τρόπος αναπαράστασης παρουσιάζεται και επεξηγείται λεπτομερώς. Στο πέμπτο κεφάλαιο, παρουσιάζονται τα πειραματικά αποτελέσματα από το σύνολο των πειραμάτων που διεξήχθησαν στα δεδομένα της yahoo, μαζί με τις υποθέσεις των πειραμάτων. Στο έκτο και τελευταίο μέρος, παρουσιάζονται τα συμπεράσματα της έρευνας και των αποτελεσμάτων της, καθώς και ένα σύνολο μελλοντικών δουλειών που βασίζονται στην μέθοδο αναπαράστασης που παρουσιάζεται σε αυτήν την διπλωματική.

In this dissertation the application of signal analysis wavelets, waveforms and theorems are used to compose and analyze a user’s profile for use with content based filtering techniques. This methodology is used in an effort to reduce storage and memory requirements of conventional user profiling techniques, as well as, eliminate problems of overfitting models, local minima of user preference models and user model saturation. The aim is to improve the adapting capabilities of well-known and frequently deployed content based recommendation filters, without reducing their stability, as well as, improving the recommendations quality and variability. This dissertation is divided into 5 parts. The first part will be a short introduction on the birth and purpose of the field of Recommendation Systems. The second part of the work includes in depth information on the field, presenting the available types of algorithms in use, metrics with which their performance is evaluated, popular applications that make use of them etc. The third part will present some well known and open issues encountered in the field of recommendation systems and which the work improves upon. There will also be a discussion on their repercussions as well as the effects of alleviating those issues in the effectiveness and performance of the system. A detailed presentation of the proposed technique will follow on the fourth part. There, the mathematical equations and rational followed to produce results will be shown. Finally, the link between the new user profiles and the conventional content-based filters will be clarified. In the fifth and final part of the dissertation, the yahoo R2 dataset that was used will be presented and the experimentation process with its results will be shown. Additionally, an in depth discussion and analysis will follow on the results of the experiments and the experience gained by carrying them out in this work. Finally, in this chapter, future work making use of the new representation and conclusions of this dissertation will be presented, followed by a discussion on how a synergy with signal analysis and data mining subfields could help advance research on the field of Recommenders. This dissertation also includes an annex where signal analysis theorems and equations are presented to better understand the field and how it is used in this work.
Επιβλέπων:Βακάλη, Αθηνά
Λέξεις Κλειδιά:Προτασιακά Συστήματα, Recommendation Systems, Wavelets, Προσαρμοστικότητα, Κυματίδια, Adaptability
Σχετικά αρχεία:Πλήρες κείμενο: PDF Αρχείο με άδεια χρήσης Δείτε την σχετική άδεια κάνοντας κλικ εδώ!


 Δημιουργία εγγραφής 2012-12-28, τελευταία τροποποίηση 2015-04-30


Πλήρες κείμενο:
Κατέβασμα πλήρους κειμένου
PDF Αρχείο
με άδεια:Δείτε την σχετική άδεια κάνοντας κλικ εδώ!