Asignatura optativa, 6 créditos ECTS
Objetivos: Conocer en qué consiste la minería de datos, los diversos tipos de problemas que resuelve y las diferentes técnicas que se utilizan. Saber enfrentarse al análisis de conjuntos de datos masivos con las herramientas adecuadas. Poder evaluar la capacidad predictiva de un modelo de clasificación o saber elegir el modelo más adecuado en función de los objetivos y de las características del problema a resolver. Requisitos: Se recomienda que esta asignatura sea cursada junto con la asignatura Modelización Estadística ya que ambas comparten técnicas y procedimientos que son desarrollados con más profundidad en Modelización Estadístic. Contenidos: - 1. Introducción a la minería de datos.
- 2. Métodos de regresión. Modelos lineales, generalizados y no paramétricos.
- 3. Métodos de clasificación. Clasificación Supervisada lineal, logística y k vecinos proximos.
- 4. Métodos basados en árboles.
- 5. Modelos gráficos probabilísticos: Redes bayesianas.
Metodología:La metodología combina la clase magistral donde se introducen y relacionan las técnicas y los conceptos más importantes, junto con sesiones prácticas en aula informática donde se desarrollan ejemplos de análisis que permiten ilustrar los conceptos y profundizar en el manejo de programas estadísticos adecuados.
Criterios de evaluación: A lo largo del curso se plantearán una serie de actividades breves en torno a los diversos temas desarrollados y fundamentalmente un trabajo de análisis de datos más amplio donde se aplicarán diversas técnicas, comparando los resultados y valorando su utilidad. Dicho trabajo se podrá realizar de forma individual o en grupo.
Bibliografía: - C.M. Bishop, Pattern Recognition and Machine Learning, Springer. (2006)
- E. Castillo, J.M. Gutiérrez, y A.S. Hadi, Sistemas expertos y modelos de redes probabilísticas. http://personales.unican.es/gutierjm/BookCGH.html, (1998) ,
- T. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning. Data mining, Inference and Prediction, Springer. (2001),
- L. Torgo, Data Mining with R: Learning with Case Studies. Chapman and Hall/ CRC, (2011)
- G. Willians, Data Minig with Rattle and R. Springer, (2011)
- I.H. Witten, E. Frank, Data Mining: Practical Machine Learning Tools and Techniques (Second Edition), Morgan Kaufmann. (2005)
Profesores del curso 2020-2021:José Tomás Alcalá Nalvaiz (jtalcal at unizar.es) (Coordinador) |