Ciencia de Datos e Inteligencia de Negocios
Master's Programme. Academic Year 2024/2025.
PREPARACIÓN DE DATOS Y MODELOS PREDICTIVOS - 610505
Curso Académico 2024-25
Datos Generales
- Plan de estudios: 069D - MÁSTER UNIVERSITARIO EN CIENCIA DE DATOS E INTELIGENCIA DE NEGOCIOS (2024-25)
- Carácter: OBLIGATORIA
- ECTS: 6.0
SINOPSIS
COMPETENCIAS
Generales
RA3 - Conocer la base teórica de los modelos lineales de predicción
RA13 Reunir, depurar y transformar los datos que la empresa almacena, en información estructurada y coherente para contrastar hipótesis que traten de responder a preguntas de investigación dentro del ámbito de la Inteligencia de Negocios
RA15 - Dominar herramientas estadísticas básicas y el software estadístico especializado y avanzado para la aplicación de las técnicas de Ciencia de datos
RA16 - Aplicar de forma efectiva en el ámbito de la Inteligencia empresarial, las distintas técnicas de Ciencia de datos necesarias, discriminando entre todas ellas y buscando la solución óptima
RA17 - Modelizar problemas de clasificación y predicción dentro del ámbito de la estrategia empresarial
RA19 - Elaborar un programa básico en lenguaje de programación en un contexto de modelización predictiva
RA20 - Tomar las decisiones apropiadas en la utilización de algoritmos predictivos en un problema real
RA21 - Aplicar diferentes modelos de segmentación, agrupación de observaciones y reducción de variables
RA23 - Desarrollar el espíritu innovador en un ámbito interdisciplinario, fomentando la búsqueda de soluciones creativas a diversos tipos de problemas
RA25 - Investigar en nuevas metodologías y técnicas para la gestión y explotación de grandes bases de datos con las que crear conocimiento que apoye la toma de decisiones en la dirección estratégica y en la inteligencia empresarial
RA26 - Comunicar las conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades
RA27 - Establecer las fases y estructura de una investigación relacionada con la Ciencia de Datos partiendo de un problema concreto
ACTIVIDADES DOCENTES
Clases teóricas
Clases prácticas
Presenciales
No presenciales
Semestre
Breve descriptor:
Esta asignatura se contempla como una introducción al análisis de datos integrado utilizando software estadístico (Miner SAS y R). Se describen técnicas estadísticas habituales con el objetivo de que se conozca el entorno informático.
Se hace especial hincapié en la presentación y resolución de problemas prácticos a los que se les va aplicando diferentes técnicas, entendiéndolas como un procedimiento sistemático de trabajo. El método de trabajo consistirá en utilizar dos grandes bases de datos y trabajar con ellas de forma integrada.
Las técnicas a las que se dará prioridad en esta asignatura son los métodos de exploración y depuración de datos, la creación de modelos predictivos como la regresión lineal, la regresión logística y los árboles de regresión y clasificación.
Objetivos
Obtener las habilidades básicas-medias de lenguajes de programación orientados al manejo y análisis de datos.
Saber cargar, manipular y depurar conjuntos de datos de manera eficiente y óptima.
Comprender, aplicar y desarrollo de modelos predictivos, tales como regresión lineal, regresión logística y árboles.
Contenido
Metodologías de Minería de Datos y Machine Learning.
Técnicas de exploración, visualización y depuración de datos.
Introducción a los modelos predictivos.
Regresión lineal
Regresión logística.
Árboles de clasificación y regresión.
Evaluación
Para aquello alumnos que renuncien a la evaluación continua o que no alcancen los objetivos mínimos se les evaluará a través de un examen que constituirá el 100% de la nota.
Cualquier alumno tendrá derecho a una prueba final pudiendo resultar su calificación la nota final del curso
Bibliografía
- Kuhn, Max y Johnson, Kjell (2016). Applied Predictive Modelling. Springer. - Gareth, James et. al (2015). An introduction to statistical learning : with applications in R. Springer.
Brett Lantz (2019).Machine learning with R
- Swirl stats: aprendizaje básico de R dentro del propio R. Disponible gratuitamente en https://swirlstats.com/ - Wright, C., Ellis, S.E., Hicks, S. C., Peng, R. D. (2021). «Tidyverse skills for data science». Disponible gratuitamente en https: //jhudatascience.org/tidyversecourse/
- Matloff, N (2011). The Art of R Programming. A tour of statistical software design. Disponible como recurso electrónico en la biblioteca de la UCM. - Crawley, M.J. The R book. Disponible como recurso electrónico en la biblioteca de la UCM
- Santin González, Daniel y Pérez, López, César (2007). Minería de datos, técnicas y herramientas. Tomson.
- Cerrito B. Patricia (2006). Introduction to Data Mining Using SAS Enterprise Miner. SAS Institute.
Estructura
Módulos | Materias |
---|---|
No existen datos de módulos o materias para esta asignatura. |
Grupos
Clases teóricas y/o prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo A | 09/09/2024 - 10/01/2025 | VIERNES 18:00 - 19:30 | - | DANIEL MARTIN GARCIA |
Grupo B | 09/09/2024 - 10/01/2025 | MIÉRCOLES 18:00 - 19:30 | - | JUAN ANTONIO GUEVARA GIL |
Actividades Prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo A | 09/09/2024 - 10/01/2025 | VIERNES 19:30 - 21:00 | - | DANIEL MARTIN GARCIA |
Grupo B | 09/09/2024 - 10/01/2025 | MIÉRCOLES 19:30 - 21:00 | - | JUAN ANTONIO GUEVARA GIL |