Bioestadística
Master's Programme. Academic Year 2024/2025.
SOFTWARE PARA GESTIÓN DE BASES DE DATOS - 608530
Curso Académico 2024-25
Datos Generales
- Plan de estudios: 064V - MÁSTER UNIVERSITARIO EN BIOESTADÍSTICA (2016-17)
- Carácter: OBLIGATORIA
- ECTS: 6.0
SINOPSIS
COMPETENCIAS
Generales
CG3,CG5
Específicas
CE6, CE7
ACTIVIDADES DOCENTES
Clases teóricas
30%
Clases prácticas
70%
TOTAL
100%
Presenciales
1,8
No presenciales
4,2
Semestre
1
Breve descriptor:
Los estudiantes aprenderán a modelizar, construir y diseñar bases de datos multidimensionales de tal manera que se agilicen sus consultas y puedan ser explotadas posteriormente según el objetivo del estudio. También comprenderán la necesidad de estas técnicas, sus objetivos y sus aplicaciones en función del tipo de información disponible en cada caso.
Requisitos
No hay requisitos previos.
Contenido
- Introducción a R y RStudio. Organización del trabajo. Introducción a R base. Tipos de variables y concatenación (vectores). Operaciones con vectores. Tipos de datos especiales: fechas y cadenas de textos.
- Presentación de resultados: introducción a Quarto y rmarkdown. Elaborar apuntes y diapositivas.
- Primeras estructuras de datos: matrices. Inconvenientes y limitaciones. Primeros datasets: data.frame y tibble.
- Introducción a tidyverse. Tidydata. Pivotar tablas. Importar/exportar datasets.
- Manejo de tidyverse. Operaciones por filas y columnas. Cruce de tablas. Depuración de datos: detección de ausentes y outliers e imputación. Recategorización de variables.
- Estructuras de control, bucles y funciones propias. Variables locales vs globales. Manejo de listas y variables cualitativas. Paquetes purrr y forcats.
- Introducción a módulos de acceso a SQL desde R.
- Introducción a ggplot. Visualización de datos.
- Control de versiones: uso de Github.
- Introducción a Stata
Evaluación
A lo largo del curso se plantearán una serie de entregas individuales aplicando los conocimientos aprendidos a datasets reales. Se realizará también una entrega final grupal en la que tendrán que exponer el análisis realizado con un caso real.
La nota final tendrá en cuenta tanto la evaluación continua como la prueba final, calculando una media ponderada de ambasl, siendo el peso de la evaluación continua de al menos el 20%. Así cualquier alumno/a tendrá derecho a renunciar a la evaluación continua, con una prueba final cuya ponderación será del 80%.
La nota final tendrá en cuenta tanto la evaluación continua como la prueba final, calculando una media ponderada de ambasl, siendo el peso de la evaluación continua de al menos el 20%. Así cualquier alumno/a tendrá derecho a renunciar a la evaluación continua, con una prueba final cuya ponderación será del 80%.
Bibliografía
- Wickham, H., Grolemund, G.. «R for Data Science». Disponible gratuitamente en https://r4ds.had.co.nz/index.html
- Álvarez-Liébana, J. (2023). Curso introductorio de manejo y depuración de datos. «Manejo de datos en R». Disponible gratuitamente en https://javieralvarezliebana.es/curso-R-RTVE/#/title-slide
- Álvarez-Liébana, J. (2022). Curso introductorio a la visualización de datos. «Analizando datos, visualizando información, contando historias». Disponible gratuitamente en https://javieralvarezliebana.es/curso-slides-dataviz-ECI-2022/#1
- Álvarez-Liébana, J. (2021). Manual introductorio a R base. «Aprendiendo R sin morir en el intento». Disponible gratuitamente en https://javieralvarezliebana.es/curso-intro-R/
- Wright, C., Ellis, S.E., Hicks, S. C., Peng, R. D. (2021). «Tidyverse skills for data science». Disponible gratuitamente en https://jhudatascience.org/tidyversecourse/
- Matloff, N (2011). The Art of R Programming. A tour of statistical software design. Disponible como recurso electrónico en la biblioteca de la UCM.
- Crawley, M.J. The R book. Disponible como recurso electrónico en la biblioteca de la UCM
- Álvarez-Liébana, J. (2023). Curso introductorio de manejo y depuración de datos. «Manejo de datos en R». Disponible gratuitamente en https://javieralvarezliebana.es/curso-R-RTVE/#/title-slide
- Álvarez-Liébana, J. (2022). Curso introductorio a la visualización de datos. «Analizando datos, visualizando información, contando historias». Disponible gratuitamente en https://javieralvarezliebana.es/curso-slides-dataviz-ECI-2022/#1
- Álvarez-Liébana, J. (2021). Manual introductorio a R base. «Aprendiendo R sin morir en el intento». Disponible gratuitamente en https://javieralvarezliebana.es/curso-intro-R/
- Wright, C., Ellis, S.E., Hicks, S. C., Peng, R. D. (2021). «Tidyverse skills for data science». Disponible gratuitamente en https://jhudatascience.org/tidyversecourse/
- Matloff, N (2011). The Art of R Programming. A tour of statistical software design. Disponible como recurso electrónico en la biblioteca de la UCM.
- Crawley, M.J. The R book. Disponible como recurso electrónico en la biblioteca de la UCM
Otra información relevante
La presencialidad de las asignaturas de Máster es del 30%, lo que significa que la carga de trabajo de un alumno, para cada asignatura de 6 créditos ECTS, se divide en 45 horas lectivas presenciales y en 105 de trabajo personal adicional.
Estructura
Módulos | Materias |
---|---|
No existen datos de módulos o materias para esta asignatura. |
Grupos
Clases teóricas y/o prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo A | 09/09/2024 - 13/10/2024 | LUNES 16:00 - 18:00 | - | JAVIER ALVAREZ LIEBANA |
MIÉRCOLES 16:00 - 18:00 | - | JAVIER ALVAREZ LIEBANA |
Actividades prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo A | 14/10/2024 - 29/10/2024 | LUNES 16:00 - 18:00 | - | JAVIER ALVAREZ LIEBANA |
MIÉRCOLES 16:00 - 18:00 | - | JAVIER ALVAREZ LIEBANA | ||
30/10/2024 - 20/12/2024 | LUNES 16:00 - 18:00 | - | JAVIER ALVAREZ LIEBANA |