Συστήματα Διαχείρισης Μεγάλων Δεδομένων
Η χρησιμοποίηση δεδομένων στη λήψη σωστών, έγκυρων και έγκαιρων αποφάσεων έχει αναχθεί σε «εκ των ουκ άνευ» παράγοντα επιτυχίας για τις περισσότερες σύγχρονες επιχειρήσεις και οργανισμούς. Ταυτόχρονα, τα τελευταία χρόνια, με την ανάπτυξη νέων τεχνολογιών και εφαρμογών – όπως η εξάπλωση των κοινωνικών δικτύων, η εκτεταμένη χρήση smart phones, η εγκατάσταση αισθητήρων κ.α. – ο όγκος και η μορφή των δεδομένων έχει αλλάξει δραματικά: πλέον έχουμε όγκους δεδομένων μεγεθών petabytes και exabytes και σε μορφές text, audio, video, images. H ανάγκη διαχείρισης και εκμετάλευσης αυτών των δεδομένων οδήγησε στην ανάπτυξη μίας νέας γενιάς συστημάτων, μοντέλων και προγραμματιστικών εργαλείων – που ακόμα βρίσκται σε εμβρυακό στάδιο - όπως: Map Reduce, Hadoop και οικοσύστημα αυτού, NoSQL, κ.α., τεχνολογίες που επιτρέπουν την παράλληλη επεξεργασία δεδομένων σε μεγάλη κλίμακα και με fault-tolerant τρόπο. Σκοπός αυτού του μαθήματος είναι η παρουσίαση των βασικών αρχών αυτών των συστημάτων και του τρόπου λειτουργίας τους.
Τα περιεχόμενα του μαθήματος περιλαμβάνουν:
- Βασικές Γνώσεις: επεξεργασία ερωτημάτων, κατανεμημένη και παράλληλη επεξεργασία ερωτημάτων, κατανεμημένα συστήματα
- Γλώσσα προγραμματισμού: Python
- MapReduce, Hadoop και οικοσύστημα
- NoSQL, Συστήματα Key-Value, εκμάθηση Redis
- NoSQL, Συστήματα Document-Store, εκμάθηση MongoDB
- Διαχείριση Ροών Δεδομένων και Εφαρμογές
- Διασυνδεσιμότητα σε Συστήματα Διαχείρισης Μεγάλων Δεδομένων