Tratamiento Estadístico Computacional de la Información (conjunto con UPM)
Master's Programme. Academic Year 2024/2025.
MINERÍA DE DATOS - 607582
Curso Académico 2024-25
Datos Generales
- Plan de estudios: 063U - MÁSTER UNIVERSITARIO EN TRATAMIENTO ESTADÍSTICO COMPUTACIONAL DE LA INFORMA (2013-14)
- Carácter: OBLIGATORIA
- ECTS: 3.0
SINOPSIS
COMPETENCIAS
Generales
CG1 - Aprender a aplicar los conocimientos adquiridos y a explotar su potencial para la resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) en el tratamiento estadístico-computacional de la información.
CG2 - Elaborar adecuadamente y con originalidad argumentos motivados y proyectos de trabajo, redactar planes, así como formular hipótesis y conjeturas razonables en su área de especialización.
CG3 - Integrar los conocimientos adecuados y enfrentarse a la complejidad de emitir juicios en función de criterios, de normas externas o de reflexiones personales justificadas
CG4 - Comunicar y presentar públicamente ideas, procedimientos o informes de investigación, así como asesorar a personas u organizaciones en el tratamiento estadístico-computacional de la información. La presentación de estas ideas debe transmitir de forma clara y precisa las conclusiones de forma que sean entendidas tanto por el especialista como por el profano en temas estadístico-computacionales.
CG7 - Saber abstraer en un modelo matemático las propiedades y características esenciales de un problema real reconociendo su rango de aplicabilidad y limitaciones.
CG2 - Elaborar adecuadamente y con originalidad argumentos motivados y proyectos de trabajo, redactar planes, así como formular hipótesis y conjeturas razonables en su área de especialización.
CG3 - Integrar los conocimientos adecuados y enfrentarse a la complejidad de emitir juicios en función de criterios, de normas externas o de reflexiones personales justificadas
CG4 - Comunicar y presentar públicamente ideas, procedimientos o informes de investigación, así como asesorar a personas u organizaciones en el tratamiento estadístico-computacional de la información. La presentación de estas ideas debe transmitir de forma clara y precisa las conclusiones de forma que sean entendidas tanto por el especialista como por el profano en temas estadístico-computacionales.
CG7 - Saber abstraer en un modelo matemático las propiedades y características esenciales de un problema real reconociendo su rango de aplicabilidad y limitaciones.
Transversales
CT1 - Saber aplicar sus conocimientos a su trabajo o vocación de una forma profesional y poseer las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y en la resolución de problemas y estudio de casos. Esto implica, más concretamente: Integrar creativamente conocimientos y aplicarlos a la resolución de problemas complejos, perseguir objetivos de calidad en el desarrollo de su actividad profesional, adquirir capacidad para la toma de decisiones y de dirección de recursos humanos, ser capaz de mostrar creatividad, iniciativa y espíritu emprendedor para afrontar los retos de su actividad, valorar la importancia de los métodos estadístico-computacionales en el contexto industrial, económico, administrativo, medio ambiental y social.
CT2 - Tener la capacidad de reunir e interpretar datos relevantes para emitir juicios que incluyan una reflexión sobre temas relevantes de índole científica, tecnológica y empresarial. Demostrar razonamiento crítico y gestionar información científica y técnica de calidad, bibliografía, bases de datos especializadas y recursos accesibles a través de Internet.
CT2 - Tener la capacidad de reunir e interpretar datos relevantes para emitir juicios que incluyan una reflexión sobre temas relevantes de índole científica, tecnológica y empresarial. Demostrar razonamiento crítico y gestionar información científica y técnica de calidad, bibliografía, bases de datos especializadas y recursos accesibles a través de Internet.
Específicas
CE1 - Adquisición de una formación sólida y rigurosa en temas avanzados de Estadística, Matemática computacional, Modelos estocásticos y Metodología de la toma de Decisiones aplicadas al tratamiento de la Información.
CE2 - Capacidad para planificar la resolución de un problema en función de las herramientas de que se disponga y, en su caso, de las restricciones de tiempo y recursos.
CE3 - Capacidad para utilizar aplicaciones informáticas estadísticas, de cálculo numérico y simbólico, visualización gráfica, optimización u otras para resolver problemas con un elevado grado de complejidad.
CE4 - Desarrollar habilidades de aprendizaje en Estadística Computacional y Matemáticas, así como en sus respectivas aplicaciones, que permitan al alumno continuar estudiando y profundizando en la materia de modo autónomo, así como el desarrollo profesional con un alto grado de independencia.
CE5 - Resolver problemas y casos reales planteados en el tratamiento estadístico-computacional de la información generada en los ámbitos de la ciencia, la tecnología y la sociedad mediante habilidades de modelización matemática, estimación y computación.
CE7 - Capacidad de utilización de herramientas de búsqueda de recursos bibliográficos así como manejo, gestión y análisis de grandes bases de datos.
CE2 - Capacidad para planificar la resolución de un problema en función de las herramientas de que se disponga y, en su caso, de las restricciones de tiempo y recursos.
CE3 - Capacidad para utilizar aplicaciones informáticas estadísticas, de cálculo numérico y simbólico, visualización gráfica, optimización u otras para resolver problemas con un elevado grado de complejidad.
CE4 - Desarrollar habilidades de aprendizaje en Estadística Computacional y Matemáticas, así como en sus respectivas aplicaciones, que permitan al alumno continuar estudiando y profundizando en la materia de modo autónomo, así como el desarrollo profesional con un alto grado de independencia.
CE5 - Resolver problemas y casos reales planteados en el tratamiento estadístico-computacional de la información generada en los ámbitos de la ciencia, la tecnología y la sociedad mediante habilidades de modelización matemática, estimación y computación.
CE7 - Capacidad de utilización de herramientas de búsqueda de recursos bibliográficos así como manejo, gestión y análisis de grandes bases de datos.
ACTIVIDADES DOCENTES
Clases teóricas
Método expositivo de los contenidos teóricos
Clases prácticas
Estudio de casos
Laboratorios
Prácticas de ordenador utilizando R y/o python con Jupyter Notebooks.
Elaboración de memorias.
Elaboración de memorias.
Presenciales
1,4
No presenciales
1,6
Semestre
1
Requisitos
Conocimientos de Probabilidad y Estadística.
También es conveniente que haya cursado la asignatura de Análisis Multivariante
También es conveniente que haya cursado la asignatura de Análisis Multivariante
Objetivos
El alumno adquirirá los conocimientos teóricos necesarios para abordar diferentes problemáticas de negocio a través del tratamiento de datos y el ajuste de modelos de carácter supervisado y no supervisado.
Contenido
1. Métricas de validación.
2. Métodos de remuestreo
3. Métodos avanzados en regresión: target encoding, Regularización (métodos lasso y ridge)
4. Árboles de decisión
5. Ensamblaje de modelos: bagging, random forest, boosting...
6. Clustering
Evaluación
Entrega de trabajos (por grupos): 55%
Examen teórico-práctico: 35%
Asistencia y participación activa: 10%
Para aprobar, hay que obtener una nota mínima de 4/10 en el examen teórico-práctico
Examen teórico-práctico: 35%
Asistencia y participación activa: 10%
Para aprobar, hay que obtener una nota mínima de 4/10 en el examen teórico-práctico
Bibliografía
1. Bishop, C.M. (2006), Pattern Recognition and Machine Learning, Springer
2. Hair-Anderson-Tatham-Black (1999), Análisis multivariante, Prentice Hall
3. Hastie, T., Tibshirani, R., Friedman, J. (2001), The Elements of Statistical Learning, Springer
4. James, G., Witten, D., Hastie, T., Tibshirani, R. (2013), An introduction to Statistical Learning, Springer
5. Kevin, P.M. (2013) Machine Learning. A probabilistic Perspective.
2. Hair-Anderson-Tatham-Black (1999), Análisis multivariante, Prentice Hall
3. Hastie, T., Tibshirani, R., Friedman, J. (2001), The Elements of Statistical Learning, Springer
4. James, G., Witten, D., Hastie, T., Tibshirani, R. (2013), An introduction to Statistical Learning, Springer
5. Kevin, P.M. (2013) Machine Learning. A probabilistic Perspective.
Otra información relevante
Profesor:
Nombre: Pablo Olaso Redondo
Facultad de Matemáticas
Despacho: 504
Teléfono: 91 394 4656
Correo electrónico: polaso@ucm.es
Nombre: Pablo Olaso Redondo
Facultad de Matemáticas
Despacho: 504
Teléfono: 91 394 4656
Correo electrónico: polaso@ucm.es
Estructura
Módulos | Materias |
---|---|
No existen datos de módulos o materias para esta asignatura. |
Grupos
Clases teóricas y/o prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo único | 09/12/2024 - 19/02/2025 | LUNES 18:00 - 19:30 | - | PABLO OLASO REDONDO |
MIÉRCOLES 18:00 - 19:30 | - | PABLO OLASO REDONDO |