Διδακτορικές Διατριβές GRI-2012-8271

Τίτλος:Μέθοδοι εξόρυξης γνώσης σε συλλογές περιεχομένου μεγάλης κλίμακας από κοινωνικά δίκτυα
Knowledge extraction in large-scale content collections from social networks
Συγγραφείς:Παπαδόπουλος Συμεών Χ.
Σχολή/Τμήμα: Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Σχολή Θετικών Επιστημών, Τμήμα Πληροφορικής
Γλώσσα:Ελληνικά
Ημ/νία έκδοσης:2012
Περίληψη:Οι πρόσφατες τεχνολογικές εξελίξεις έχουν οδηγήσει σε εκρηκτική αύξηση της διάθεσης διαδικτυακού περιεχομένου μέσα από κοινωνικά δίκτυα. Η μαζική συμμετοχή απλών ανθρώπων στη δημιουργία περιεχομένου έχει ως αποτέλεσμα την αποτύπωση στον Παγκόσμιο Ιστό μεγάλου μέρους του πραγματικού κόσμου και των γεγονότων που εκτυλίσσονται σε αυτόν. Κατά συνέπεια, η ανάλυση περιεχομένου που προέρχεται από κοινωνικά δίκτυα συνιστά σημαντική ευκαιρία για την εξαγωγή γνώσης για φαινόμενα και γεγονότα του πραγματικού κόσμου. Όμως, το εγχείρημα αυτό συναντά μια σειρά από προκλήσεις που οφείλονται στα χαρακτηριστικά του κοινωνικού περιεχομένου, όπως είναι η ετερογένειά του, η έλλειψη συστηματικής δομής και συμβάσεων, η πολύ μεγάλη κλίμακά του, ο θόρυβος και η δυναμική φύση του. H παρούσα διατριβή αποσκοπεί να συμβάλει ερευνητικά στην αντιμετώπιση των παραπάνω προκλήσεων, μέσα από τη μοντελοποίηση και μελέτη του Παγκόσμιου Ιστού ως πολύπλοκο σύστημα, και τη χρήση μεθόδων από τη στατιστική και τη θεωρία γράφων με σκοπό την εξαγωγή πληροφορίας και γνώσης από μεγάλες ποσότητες δεδομένων και περιεχομένου που δημιουργείται και διατίθεται από χρήστες των κοινωνικών δικτύων. Συγκεκριμένα, η διατριβή μελετά τα ακόλουθα: (α) στατιστικές ιδιότητες της δημοτικότητας του κοινωνικού περιεχομένου, (β) επισκόπηση και συγκριτική ανάλυση των δυνατοτήτων κλιμάκωσης δημοφιλών μεθόδων ανίχνευσης κοινοτήτων, (γ) ομαδοποίηση πολυμεσικού κοινωνικού περιεχομένου με χρήση ανίχνευσης κοινοτήτων σε γράφους συνεμφάνισης και ομοιότητας, (δ) αυτόματη ανίχνευση και διαδικτυακή παρουσίαση σημείων ενδιαφέροντος και δραστηριοτήτων σε μεγάλο όγκο κοινωνικού περιεχομένου, (ε) κατανόηση περιεχομένου εικόνας με ενσωμάτωση της δομής γράφων ομοιότητας σε τεχνικές ημι-επιβλεπόμενης μάθησης.

The recent technological developments have led to an explosive growth in the availability of online content through social networks. The massive participation of people in the content creation process has transformed the Web into a reflection of real-world entities and events. Consequently, social content analysis offers an unprecedented opportunity for knowledge extraction with respect to real-world phenomena and events. However, such an endeavor is hampered by severe challenges stemming from the attributes of social content, e.g. its variance, the lack of systematic structure and conventions, its massive scale, the prevalence of noise, and its dynamic nature. To this end, this dissertation aims at contributing to the research addressing the aforementioned challenges through modeling and studying the Web as a complex system and employing statistical and graph-based methods for achieving large-scale knowledge extraction from massive amounts of online content shared through social networks. More concretely, the dissertation investigates the following: (a) statistical properties of social content popularity, (b) survey and comparative analysis of scalability attributes of community detection methods, (c) multimedia content clustering by means of community detection on cooccurrence and similarity graphs, (d) detection and online presentation of landmarks and events in massive amounts of online social content, (e) image content understanding by integrating the structure of similarity graphs in a semi-supervised learning framework.
Επιβλέπων:Βακάλη, Αθηνά, αν. καθ.
Θέματα:Εξόρυξη δεδομένων, Μηχανική μάθηση, Συστήματα αποθήκευσης και ανάκτησης πληροφοριών, Κοινωνικά δίκτυα, Data mining, Machine learning, Information storage and retrieval systems, Social networks
Λέξεις Κλειδιά:Ομαδοποίηση περιεχομένου, Εξόρυξη γνώσης, Content clustering, Community detection, Ανίχνευση κοινοτήτων, Knowledge extraction, Social networks, Κοινωνικά δίκτυα
Σχετικά αρχεία:Πλήρες κείμενο: PDF Αρχείο με άδεια χρήσης Δείτε την σχετική άδεια κάνοντας κλικ εδώ!


 Δημιουργία εγγραφής 2012-03-02, τελευταία τροποποίηση 2015-05-05


Πλήρες κείμενο:
Κατέβασμα πλήρους κειμένου
PDF Αρχείο
με άδεια:Δείτε την σχετική άδεια κάνοντας κλικ εδώ!