Estadística Aplicada
Undergraduate Programme. Academic Year 2024/2025.
ESTUDIO Y DEPURACIÓN DE DATOS - 801598
Curso Académico 2024-25
Datos Generales
- Plan de estudios: 0825 - GRADO EN ESTADÍSTICA APLICADA (2009-10)
- Carácter: Obligatoria
- ECTS: 6.0
SINOPSIS
COMPETENCIAS
Generales
CG10 Desarrollar habilidades que favorezcan el trabajo en grupo
Específicas
CE2 Preparar y depurar la información disponible para su posterior tratamiento estadístico
CE4 Identificar y organizar la información relevante de un problema
CE21 Utilizar correctamente software estadístico programable y manejar al menos dos de los más utilizados en el mundo empresarial
CE4 Identificar y organizar la información relevante de un problema
CE21 Utilizar correctamente software estadístico programable y manejar al menos dos de los más utilizados en el mundo empresarial
ACTIVIDADES DOCENTES
Clases teóricas
50%
Clases prácticas
50%
TOTAL
100%
Presenciales
2,4
No presenciales
3,6
Semestre
4
Breve descriptor:
Depuración, codificación, transformaciones y tratamiento previo al análisis estadístico de una base de datos.
Requisitos
Conocimientos básicos de R (se recomienda haber cursado Software II)
Conocimientos básicos de descripción y exploración de datos, azar y probabilidad y estimación I y II.
Conocimientos básicos de descripción y exploración de datos, azar y probabilidad y estimación I y II.
Contenido
TEMA 1. ARCHIVOS DE DATOS: CODIFICACIÓN Y TRANSFORMACIÓN
1.1 Tipos de variables
1.2 Codificación y transformación de datos
1.3 Gráficos y tablas
TEMA 2. CONTROL DE INTEGRIDAD DE LOS DATOS
2.1 Detección y tratamiento de datos atípicos (univariante)
2.2 Detección y tratamiento de datos atípicos (bivariante)
2.3 Detección y tratamiento de datos atípicos (multivariante)
2.4 Revisión de datos duplicados
TEMA 3. VALORES PERDIDOS: DETECCIÓN Y TRATAMIENTO
3.1 Detección de datos perdidos
3.2 Tratamiento de datos perdidos (imputación simple)
3.3 Tratamento de datos perdidos (imputación múltiple)
TEMA 4. EVALUACIÓN DE LAS HIPÓTESIS DE PARTIDA PARA EL ANÁLISIS DE DATOS
4.1 Pruebas de normalidad
4.2 Pruebas de homocedasticidad
Evaluación
Se valorará la nota final a través de los conocimientos adquiridos mediante el desarrollo de ejercicios, trabajos y participación en el aula , que contribuirán con el 40% a la nota final. El
porcentaje restante, el 60%, corresponderá al examen final.
La nota final tendrá en cuenta tanto la evaluación continua como la prueba final y se calculará como el máximo entre:
a) Calificación de la prueba final.
b) La media ponderada de la evaluación continua y la prueba final, siendo el peso de la evaluación continua del 40%.
Cualquier alumno podrá presentarse al examen final, siendo la valoración del mismo el 100% de su nota final.
En todo caso, sí se podrá superar la asignatura mediante el procedimiento de evaluación continua.
porcentaje restante, el 60%, corresponderá al examen final.
La nota final tendrá en cuenta tanto la evaluación continua como la prueba final y se calculará como el máximo entre:
a) Calificación de la prueba final.
b) La media ponderada de la evaluación continua y la prueba final, siendo el peso de la evaluación continua del 40%.
Cualquier alumno podrá presentarse al examen final, siendo la valoración del mismo el 100% de su nota final.
En todo caso, sí se podrá superar la asignatura mediante el procedimiento de evaluación continua.
Bibliografía
Introducción a la ciencia de datos con R: Preparación de los datos y análisis no supervisado. Aida Calviño Martínez, Juana María Alonso Revenga. García Maroto Editores , 2022
Alonso Revenga, Juana M. Depuración de Datos con SPSS y SAS García Maroto Editores, 2019
Boehmke, Bradley. "Data Wrangling with R". Springer. 2016
Cody, Ron. "Cody's Data Cleaning Techniques Using SAS Software". Ed SAS Publishin; 1999
López, Ana M. Análisis previo y exploratorio de datos, [en línea], https://personal.us.es/analopez/aed.pdf
Salvador Figueras, M y Gargallo, P. (2003): "Análisis Exploratorio de Datos", [en línea]
http://www.5campus.com/leccion/aed
R for data science: import, tidy, transform, visualize, and model data. Wickham, H., Grolemund, G. (2017): https://r4ds.hadley.nz/
Data Wrangling with R. Boehmke, Bradley. Springer. 2016
van Buuren, S., & Groothuis-Oudshoorn, K. (2011). mice: Multivariate Imputation by Chained Equations in R. Journal of Statistical Software, 45(3), 167. https://doi.org/10.18637/jss.v045.i03
Alonso Revenga, Juana M. Depuración de Datos con SPSS y SAS García Maroto Editores, 2019
Boehmke, Bradley. "Data Wrangling with R". Springer. 2016
Cody, Ron. "Cody's Data Cleaning Techniques Using SAS Software". Ed SAS Publishin; 1999
López, Ana M. Análisis previo y exploratorio de datos, [en línea], https://personal.us.es/analopez/aed.pdf
Salvador Figueras, M y Gargallo, P. (2003): "Análisis Exploratorio de Datos", [en línea]
http://www.5campus.com/leccion/aed
R for data science: import, tidy, transform, visualize, and model data. Wickham, H., Grolemund, G. (2017): https://r4ds.hadley.nz/
Data Wrangling with R. Boehmke, Bradley. Springer. 2016
van Buuren, S., & Groothuis-Oudshoorn, K. (2011). mice: Multivariate Imputation by Chained Equations in R. Journal of Statistical Software, 45(3), 167. https://doi.org/10.18637/jss.v045.i03
Estructura
Módulos | Materias |
---|---|
ANÁLISIS DE DATOS | PREPARACIÓN Y DEPURACIÓN DE DATOS. HERRAMIENTOS DE APOYO |
Grupos
Actividades prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo mañana A | 22/01/2025 - 13/05/2025 | VIERNES 09:00 - 11:00 | - | SILVIA PINEDA SANJUAN |
Grupo tarde B | 22/01/2025 - 13/05/2025 | VIERNES 16:00 - 18:00 | - | MARIA GAMBOA PEREZ |
Clases teóricas y/o prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo mañana A | 22/01/2025 - 13/05/2025 | MIÉRCOLES 11:00 - 13:00 | - | SILVIA PINEDA SANJUAN |
Grupo tarde B | 22/01/2025 - 13/05/2025 | MARTES 18:00 - 20:00 | - | MARIA GAMBOA PEREZ |