Διδακτορικές Διατριβές GRI-2016-16186

Τίτλος:Knowledge discovery from evolving social media data
Εξόρυξη γνώσης από εξελισσόμενα δεδομένα κοινωνικών δικτύων
Συγγραφείς:Γιάτσογλου Μαρια Κ.
Σχολή/Τμήμα: Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Θετικών Επιστημών, Τμήμα Πληροφορικής
Γλώσσα:Αγγλικά
Ημ/νία έκδοσης:2015
Περίληψη:Οι χρήστες του κοινωνικού ιστού ενεργούν ως καταναλωτές και παραγωγοί περιεχοµένου ταυτόχρονα, ενώ συµµετέχουν σε διάφορες δραστηριότητες, όπως είναι: η λήψη πληροφοριών για ϑέµατα σχετικά µε τα ενδιαφέροντά τους ή τα γεγονότα που λαµϐάνουν χώρα σε όλο τον κόσµο, η συµµετοχή σε διάφορες κοινωνικές οµάδες διαφορετικού προσανατολισµού, και η διµερής, πολυµερής ή µαζική επικοινωνία µε άλλους χρήστες. Εντός αυτής της διασυνδεδεµένης πραγµατικότητας αναδύονται νέες κοινωνικές δοµές και δυναµικές οι οποίες αντικατοπτρίζονται σε ϕαινόµενα όπως είναι, για παράδειγµα: η αποτελεσµατική, µαζική, οργάνωση µεγάλου πλήθους ανθρώπων στα πλαίσια ενός κοινού σκοπού (το είδος του οποίου µπορεί να ποικίλει από µια τοπική εκδήλωση µέχρι την ανατροπή ενός καθεστώτος), η ενηµέρωση / καταγραφή σηµαντικών γεγονότων σε πραγµατικό χρόνο, οι προσπάθειες για την αύξηση της παγκόσµιας ευαισθητοποίησης σχετικά µε κρίσιµα προβλήµατα, και η άσκηση κοινωνικής πίεσης. Η παρούσα διατριβή αντιμετωπίζει το πρόβλημα της διαχείρισης και της εξόρυξης γνώσης από δεδομένα του παγκόσμιου ιστού, με έμφαση σε χρονικά επισημειωμένα δεδομένα που παράγονται σε κοινωνικά δίκτυα. Τα κοινωνικά μέσα αντιμετωπίζονται ως πηγές δεδομένων σχετικά με τις διαφορετικού τύπου ενέργειες οι οποίες πραγματοποιούνται από ένα σύνολο χρηστών σε συγκεκριμένες χρονικές στιγμές. Οι ενέργειες αυτές ποικίλλουν ανάλογα με το εκάστοτε κοινωνικό δίκτυο, περιλαμβάνοντας ενδεικτικά: τη δημοσίευση περιεχομένου (κειμένου / φωτογραφιών / βίντεο), το σχολιασμό δημοσιεύσεων τρίτων, την ανταλλαγή μηνυμάτων μεταξύ χρηστών, την ανάθεση μετα-δεδομένων σε περιεχόμενο (π.χ. επισημειώσεις, όπως ετικέτες -tags-), ενώ συχνά συνοδεύονται και από τη δήλωση της γεωγραφικής θέσης του χρήστη ή του περιεχομένου. Συνεπώς, η δραστηριότητα των χρηστών στα κοινωνικά δίκτυα συχνά εμπεριέχει ποικίλες αλληλεπιδράσεις με άλλους χρήστες ή / και συσχετίσεις μεταξύ διαφορετικού τύπου οντότητων (π.χ. δημοσιεύσεις περιεχομένου). Το γενικότερο πρόβλημα που μελετήθηκε στη διατριβή έγκειται στην ανακάλυψη αποτελεσματικών μεθόδων για την αξιοποίηση των δεδομένων που παράγονται μέσω των κοινωνικών δικτύων (αλληλεπιδράσεις, περιεχόμενο), δίνοντας έμφαση στη χρονική και στη γεωγραφική επισημείωση τους, για την ανακάλυψη μη προφανών προτύπων συμπεριφοράς, καθώς και κοινοτήτων (ομάδων) χρηστών ή άλλων οντοτήτων. Για το σκοπό αυτό προτάθηκαν μεθοδολογίες για τη μοντελοποίηση αλληλεπιδράσεων και ενεργειών χρηστών κοινωνικών δικτύων και την εξόρυξη γνώσης από γράφους, την ανάλυση κειμένου, καθώς και την αναγνώριση μη τυπικών συμπεριφορών. Το παραπάνω γενικό πρόβλημα μελετήθηκε σε τρεις βασικούς άξονες: (α) την ανάλυση εξελισσόμενων γράφων από δεδομένα κοινωνικών δικτύων για την ανακάλυψη κοινοτήτων, (β) την ανακάλυψη μη τυπικών συμπεριφορών αλληλεπίδρασης, και (γ) την ανάλυση διαμοιρασμένου περιεχομένου για την παροχή υπηρεσιών (με έμφαση σε υπηρεσίες στα πλαίσια έξυπνων πόλεων). Η εξόρυξη γνώσης από εξελισσόμενα δεδομένα μεγάλης κλίμακας είναι το κοινό στοιχείο των παραπάνω επιμέρους προβλημάτων, καθώς και η αξιοποίηση της δυναμικής αυτών των δεδομένων για την ανακάλυψη όψεων της σημερινής κοινωνίας, όπως αυτή αντικατοπτρίζεται μέσα από τις δραστηριότητες και τις απόψεις των χρηστών στα κοινωνικά δίκτυα.

Modern societies have been characterized as information societies, due to the unprecedented growth of information that has been witnessed during the last years, and its gradual exploitation for simplifying and improving everyday activities. The mass creation of information has been enabled primarily by the Web, and especially through the most recent rise of the social web. The latter encompasses the set of interactive web applications (i.e. social media) that have been developed based on recent web technology innovations, drastically simplifying content creation for Web users, as well as the social network of users themselves. Social media data refer to information that can be sourced from social media applications, which can be related to: content (generated by users), activities (actions performed by users) and structure (associations between entities such as users). Given the heterogeneity, complexity, massive sizes and fast generation rates of such data, identifying effective processes and methodologies for discovering and leveraging knowledge is challenging. Social data mining addresses this challenge through the proposal of methods for harvesting knowledge based on content, activities, and / or structure. Challenges in social data mining impose the need for scalable, online methodologies that can process structure, content and activities in a time-aware approach. Such methodologies should additionally address the pervasive problem of fraud in social media, and also focus on deriving results that are useful for today’s societies, by enabling the interpretation of social data mining results in the context of real-world phenomena. Based on these remarks, three crucial problems have been addressed in this thesis, namely: a. detection of communities (broadly considered as closely-knit groups of entities) in user and information networks; b. discovery of fraudulent behavior in social media; c. composite analysis of social media data for providing location-based services. This thesis contributes to addressing those problems through the development of effective methods and efficient frameworks for the discovery of knowledge based on social data mining. With respect to problem ‘a’, the thesis advances approaches for the analysis and management of evolving user / information graphs (social structure mining). Methodologies for the discovery and tracking of communities in social media are proposed, as well as for their interpretation in relation to unfolding real-world events. Problem ‘b’ is addressed through the proposal of methods for the discovery of fraudulent behavior in terms of the propagation of social media content, i.e. the specific case of the Rebroadcast fraud problem (social activity mining). Several distinctive patterns of fraudulent activity are identified and presented, along with a proposed methodology for the automatic detection of Rebroadcast fraud. Finally, in relation to problem ‘c’, the thesis proposes and presents in detail frameworks for the analysis of shared content and activities in social media to derive location-based insights and leverage them for service provision (social activity and content mining).
Επιβλέπων:Βακάλη, Αθηνά, καθ.
Θέματα:Data mining, Social networks, Data processing, Εξόρυξη δεδομένων, Κοινωνικά δίκτυα, Επεξεργασία δεδομένων
Λέξεις Κλειδιά:content analysis, Ανάλυση εξελισσόμενων γράφων, Ανάλυση περιεχομένου, Anomaly detection, Ανίχνευση κοινοτήτων, Evolving graph mining, Social data mining, Knowledge discovery, Εξόρυξη γνώσης, Ανακάλυψη μη τυπικής συμπεριφοράς, Κοινωνικά δίκτυα, Community detection
Περιορισμοί Πρόσβασης:Ισχύουν περιορισμοί στην πρόσβαση στο πλήρες κείμενο.
Σύμφωνα με έγγραφο αίτημα του συγγραφέα, το πλήρες κείμενο της Διατριβής θα είναι διαθέσιμο στο κοινό σε ηλεκτρονική μορφή μετά από την 01/04/2019. Σε κάθε περίπτωση, ένα φυσικό αντίτυπο της Διατριβής βρίσκεται στον χώρο της Κεντρικής Βιβλιοθήκης (και ενδεχομένως και στην βιβλιοθήκη του οικείου τμήματος που εξέδωσε τον τίτλο) και είναι διαθέσιμο για ανάγνωση.
Σχετικά αρχεία:
(ΠΕΡΙΟΡΙΣΜΕΝΟ) Πλήρες κείμενο: PDF Αρχείο με άδεια χρήσης Δείτε την σχετική άδεια κάνοντας κλικ εδώ!


 Δημιουργία εγγραφής 2016-03-29, τελευταία τροποποίηση 2016-04-04


(ΠΕΡΙΟΡΙΣΜΕΝΟ) Πλήρες κείμενο:
Κατέβασμα πλήρους κειμένου
PDF Αρχείο
με άδεια:Δείτε την σχετική άδεια κάνοντας κλικ εδώ!