Περιγραφή

Αντικείμενο του μαθήματος

Σκοποί του μαθήματος είναι (α) η μελέτη τεχνικών εξόρυξης γνώσης από δεδομένα και (β) η παρουσίαση εφαρμογών και σεναρίων χρήσης αποτελεσμάτων εξόρυξης γνώσης, με έμφαση σε εξόρυξη από μεγάλες βάσεις δεδομένων.

Τρόπος διεξαγωγής του μαθήματος

Το μάθημα αποτελείται από διαλέξεις1 σε θέματα όπως (ενδεικτικά):

  • Αποθήκες δεδομένων (κύβοι, πολυδιάστατο μοντέλο) και λειτουργίες OLAP,

  • Βασικές τεχνικές data mining (κατηγοριοποίηση, συσταδοποίηση, εξόρυξη κανόνων συσχέτισης),

  • Προηγμένες τεχνικές data mining (εξόρυξη χρονικής / χρονικής γνώσης, κλπ.)

Παράλληλα, θα υπάρχουν εργαστηριακές ώρες2 για βασική εκμάθηση των δυνατοτήτων σε BusinessIntelligence (OLAP / datawarehousing / datamining) των εμπορικών ΣΔΒΔ SQLServer και Oracle, καθώς και του εργαλείου datamining ανοικτού λογισμικού WEKA.

Τρόπος βαθμολόγησης

Κατά τη διάρκεια του μαθήματος θα δοθούν δύο εργασίες (μία υποχρεωτική και μία προαιρετική) με συμμετοχή 40-60 στον τελικό βαθμό:

  • 1η εργασία (υποχρεωτική – σε ομάδες των 2-3 ατόμων): Επιλογή μιας μεγάλης βάσης δεδομένων, προετοιμασία δεδομένων για OLAP και datamining, επίδειξη αποτελεσμάτων OLAP και datamining, ερμηνεία αποτελεσμάτων, συγγραφή σχετικής αναφοράς.

  • 2η εργασία (προαιρετική - ατομική): Συμμετοχή στην ανάπτυξη ενός DW/DMproject, είτε πρακτικά (προγραμματιστικά) είτε θεωρητικά (π.χ. επισκόπηση σχετικής βιβλιογραφίας ή αποτίμηση ενός αλγορίθμου).

Στο τέλος του εξαμήνου, υπάρχει γραπτή εξέταση (με ανοικτά βιβλία-σημειώσεις) μόνο για όσους δεν επέλεξαν να υλοποιήσουν τη 2η εργασία (δηλαδή, συμμετοχή 60% στον τελικό βαθμό). Η βάση της βαθμολογίας για τη γραπτή εξέταση είναι το 4/10. Το ίδιο σχήμα ισχύει και για την εξεταστική Σεπτεμβρίου.

Προαπαιτούμενες γνώσεις

Το μάθημα προϋποθέτει γνώσεις Βάσεων Δεδομένων (Βάσεις Ι και Βάσεις ΙΙ), Αλγορίθμων και Στατιστικής.

Προτεινόμενη βιβλιογραφία

  • Διδακτικά βιβλία:

    • DunhamM. “DataMining – Εισαγωγικά και Προηγμένα Θέματα Εξόρυξης Γνώσης από Δεδομένα”. Εκδόσεις Νέων Τεχνολογιών, 2004.

    • Μανωλόπουλος Ι., Νανόπουλος Αλ. “Εισαγωγή στην Εξόρυξη Δεδομένων και τις Αποθήκες Δεδομένων”. Εκδόσεις Νέων Τεχνολογιών, 2009.

    • RoigerR.G., GeatzM.W. “Εξόρυξη Πληροφορίας – Ένας Εισαγωγικός Οδηγός με Παραδείγματα”. Εκδόσεις Κλειδάριθμος, 2008.

  • Διαφάνειες διαλέξεων / εργαστηρίων (διαθέσιμες στην ιστοσελίδα του μαθήματος)

Περισσότερες πληροφορίες

  • Ιστοσελίδα μαθήματος: http://gunet2.cs.unipi.gr/eclass/courses/TMD104/

  • Ιστοσελίδα InfoLab: http://infolab.cs.unipi.gr





Καλό εξάμηνο !

1Οι διαλέξεις θα γίνονται Πέμπτη 3-6μμ στη 002 – έναρξη στις 3.11.2011

2Τα εργαστήρια θα γίνονται Παρασκευή 2-4μμ στην αίθ. 206 – έναρξη στις 11.11.2011

Ταυτότητα Μαθήματος
  • Κωδικός: TMD104
  • Εκπαιδευτές: Γιάννης Θεοδωρίδης
  • Σχολή - Τμήμα: Προπτυχιακό Πληροφορική - 4ο Έτος
  • Τύπος: Προπτυχιακό

Εργαλεία Επικοινωνία με τους εκπαιδευτές   Προσθήκη στους σελιδοδείκτες   Ροή RSS