Data Mining


C.d.L.: Computer Science and Engineering & Digital Transformation Management

Semester: I (October - December)

Teacher:

Prof. Matteo Golfarelli
Room 4140 (Floor 2) - Cesena Campus - Via dell'Università 50, Cesena
Tel: +39 0547 338 862
E-mail: nome.cognome@unibo.it

Teacher:
(Text mining module)

Prof. Gianluca Moro
Dipartimento di Informatica - Scienza e Ingegneria - Via dell'Università, 50 - Cesena
Tel: +39 0547 339208
E-mail: nome.cognome@unibo.it

Con il termine Data Mining si intende un insieme di tecniche e strumenti usati per esplorare grandi database, con lo scopo di individuare/estrarre informazioni/conoscenze significative, in modo da renderle disponibili ai processi decisionali. Questo corso vuole fornire i fondamenti della disciplina, focalizzando lo studio sulle più importanti tecniche di Data Mining attualmente impiegate (estrazione automatica di pattern frequenti, associazioni, sequenze e anomalie, modelli predittivi, ecc.). A partire dall'.A.A. 2013-2014 un modulo del corso sarà completamente dedicato alle tecniche di Text Mining che specializzano le suddette tecniche al dominio dei testi non strutturati. Il settore sta avendo grande sviluppo a causa della crescita del valore strategico dell'informazione, della crescente concorrenza e dell'accumulo di sempre più grandi volumi di dati all'interno di basi di dati strutturate e non strutturate. Il corso sarà composto da lezioni teoriche seguite da esercitazioni in laboratorio dove, utilizzando strumenti ad-hoc, saranno messe in pratica le tecniche studiate nella teoria.

Programma Materiale didattico Modalità d'esame Date e Orari Prove d'esame e Risultati


Finalità del corso

Il corso si propone di fornire conoscenze approfondite sulle tecniche di Data Mining e Text Mining, nonchè sulle modalità di gestione di un progetto in questo settore. Nell'ambito del corso saranno svolte anche esercitazioni sul sistema per il Data Mining Weka al fine di fornire allo studente quelle competenze teorico-pratiche necessarie a operare autonomamente in questo settore.

Top Finalità Materiale didattico Modalità d'esame Date e Orari Prove d'esame e Risultati


Programma del corso

  1. Introduzione al Data Mining
  2. Comprendere e preparare i dati
  3. Le tecniche di data mining
  4. Le tecniche di text mining
  5. Interpretazione e validazione dei risultati
  6. Esercitazioni in laboratorio con il software Weka

Top Finalità Programma Date e Orari Prove d'esame e Risultati


Material

Top Finalità Programma Materiale didattico Date e Orari Prove d'esame e Risultati


Modalità d'esame

L'esame consta di un elaborato individuale e di una prova orale. L'elaborato, da concordare con il docente, potrà appartene a una delle seguenti categorie: Tutte le attività di analisi dovranno essere svolte seguendo la metodologia CRISP-DM. Il lavoro dovrà essere documentato mediante una relazione di almeno 5 pagine che sarà discussa durante l'orale.

Regole per gli esami su prenotazione:
  1. La prova dei due moduli (text mining e data mining) potrà essere svolta in giorni diversi purchè tra le due prove non passino più di 14gg (ricordiamoci che il corso è uno solo e va preparato integralmente)
  2. Lo studente comunica con circa 7-10 giorni di anticipo ai singoli docenti la data a partire dalla quale avrà completato la preparazione. Il docente comunica l'orario e la data, posteriore a quella comunicata, in cui verrà sostenuto l'esame
  3. L'elaborato va stampato e rilegato anche in modo semplice
  4. Il secondo appello deve essere sostenuto almeno 14gg dopo il primo tentativo. Non si può provare l'esame più di due volte nella sessione.

Top Finalità Programma Materiale didattico Modalità d'esame Prove d'esame e Risultati


Date e Orari

Top Finalità Programma Materiale didattico Modalità d'esame Date e Orari