Data Mining


C.d.L.: Ingegneria e Scienze Informatiche

Insegnamento: 6 crediti - Complementare

Semestre: II (Ottobre - Dicembre)

Docente:
(di riferimento)

Prof. Matteo Golfarelli
Studio 4140 (Piano 2) - Ingegneria e Scienze Informatiche - Via dell'UniversitÓ 50, Cesena
Tel: +39 0547 338 862
E-mail: nome.cognome@unibo.it

Docente:
(modulo di text mining)

Prof. Gianluca Moro
Dipartimento di Informatica - Scienza e Ingegneria - Via dell'UniversitÓ, 50 - Cesena
Tel: +39 0547 339208
E-mail: nome.cognome@unibo.it

Con il termine Data Mining si intende un insieme di tecniche e strumenti usati per esplorare grandi database, con lo scopo di individuare/estrarre informazioni/conoscenze significative, in modo da renderle disponibili ai processi decisionali. Questo corso vuole fornire i fondamenti della disciplina, focalizzando lo studio sulle pi¨ importanti tecniche di Data Mining attualmente impiegate (estrazione automatica di pattern frequenti, associazioni, sequenze e anomalie, modelli predittivi, ecc.). A partire dall'.A.A. 2013-2014 un modulo del corso sarÓ completamente dedicato alle tecniche di Text Mining che specializzano le suddette tecniche al dominio dei testi non strutturati. Il settore sta avendo grande sviluppo a causa della crescita del valore strategico dell'informazione, della crescente concorrenza e dell'accumulo di sempre pi¨ grandi volumi di dati all'interno di basi di dati strutturate e non strutturate. Il corso sarÓ composto da lezioni teoriche seguite da esercitazioni in laboratorio dove, utilizzando strumenti ad-hoc, saranno messe in pratica le tecniche studiate nella teoria.

Programma Materiale didattico ModalitÓ d'esame Date e Orari Prove d'esame e Risultati


FinalitÓ del corso

Il corso si propone di fornire conoscenze approfondite sulle tecniche di Data Mining e Text Mining, nonchŔ sulle modalitÓ di gestione di un progetto in questo settore. Nell'ambito del corso saranno svolte anche esercitazioni sul sistema per il Data Mining Weka al fine di fornire allo studente quelle competenze teorico-pratiche necessarie a operare autonomamente in questo settore.

Top FinalitÓ Materiale didattico ModalitÓ d'esame Date e Orari Prove d'esame e Risultati


Programma del corso

  1. Introduzione al Data Mining
  2. Comprendere e preparare i dati
  3. Le tecniche di data mining
  4. Le tecniche di text mining
  5. Interpretazione e validazione dei risultati
  6. Esercitazioni in laboratorio con il software Weka

Top FinalitÓ Programma Date e Orari Prove d'esame e Risultati


Materiale didattico

Top FinalitÓ Programma Materiale didattico Date e Orari Prove d'esame e Risultati


ModalitÓ d'esame

L'esame consta di un elaborato individuale e di una prova orale. L'elaborato, da concordare con il docente, potrÓ appartene a una delle seguenti categorie: Tutte le attivitÓ di analisi dovranno essere svolte seguendo la metodologia CRISP-DM. Il lavoro dovrÓ essere documentato mediante una relazione di almeno 5 pagine che sarÓ discussa durante l'orale.

Top FinalitÓ Programma Materiale didattico ModalitÓ d'esame Prove d'esame e Risultati


Date e Orari A.A.19-20

  • Nella seguente tabella sono elencati le date degli appelli:
    APPELLO I Appello II Appello III Appello IV Appello V Appello VI Appello
    Date 21/01/20 ore 14 Studio 4140 21/02/20 ore 14 Studio 4140 ??/06/20 ore ?? ??/07/20 ore ?? ??/09/20 ore 14 ??/12/19

    Top FinalitÓ Programma Materiale didattico ModalitÓ d'esame Date e Orari