Ciencia de Datos e Inteligencia de Negocios
Master's Programme. Academic Year 2024/2025.
GESTION Y EXPLOTACION DE ALMACENES DE DATOS - 610504
Curso Académico 2024-25
Datos Generales
- Plan de estudios: 069D - MÁSTER UNIVERSITARIO EN CIENCIA DE DATOS E INTELIGENCIA DE NEGOCIOS (2024-25)
- Carácter: OBLIGATORIA
- ECTS: 6.0
SINOPSIS
COMPETENCIAS
Generales
RA9 - Comprender los fundamentos de almacenamiento y tratamiento de grandes bases de datos
RA12 - Seleccionar pertinentemente las fuentes e instrumentos de información disponible, creando una base de datos de estructura ágil y de fácil consulta
RA13 Reunir, depurar y transformar los datos que la empresa almacena, en información estructurada y coherente para contrastar hipótesis que traten de responder a preguntas de investigación dentro del ámbito de la Inteligencia de Negocios
RA14 - Utilizar los distintos modelos de almacenamiento de datos y los sistemas de gestión de las bases de datos y utilizar un lenguaje de programación de definición, consulta y manipulación de los mismos
RA25 - Investigar en nuevas metodologías y técnicas para la gestión y explotación de grandes bases de datos con las que crear
conocimiento que apoye la toma de decisiones en la dirección estratégica y en la inteligencia empresarial
RA26 - Comunicar las conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades
Específicas
Conocer en profundidad los sistemas de gestión de bases de datos relacionales y orientados a documento.
Entender las distintas fuentes de información de una compañía y cómo podemos integrar toda esta en almacenes de datos.
Realizar un análisis de la WEB e integrar dicha información con la generada a través de los sistemas tradicionales para ayudar en la toma de decisiones.
Conocer en profundidad el lenguaje Python como herramienta de trabajo en modelos analíticos y predictivos.
Conceptualizar, diseñar e implementar soluciones que permitan adaptar a casos reales soluciones basadas en el aprendizaje automático.
ACTIVIDADES DOCENTES
Clases teóricas
Clases prácticas
TOTAL
Presenciales
No presenciales
Semestre
Breve descriptor:
Estudio de técnicas para la obtención de información (análisis y minería de datos) a partir de distintas fuentes de datos: bases de datos relacionales, orientadas a documento, páginas web, escucha en redes sociales... y aplicar estas técnicas a diferentes campos científicos y empresariales.
Requisitos
Objetivos
- Conocer los fundamentos del lenguaje SQL.
- Conocer los fundamentos del lenguaje Python.
- Aplicar Python en el conocimiento de los fundamentos y técnicas de Web Scraping.
- Aplicar Python en el conocimiento de los fundamentos y técnicas de escucha en Redes Sociales.
- Conocer los fundamentos de MongoDB como herramienta de gestión de base de datos orientada a documento.
- Conocer los fundamentos del Big Data (Machine & Deep Learning).
- Conocer los fundamentos del procesamiento distribuido.
Contenido
- Repaso de bases de datos, lenguaje SQL.
- Introducción al lenguaje Python.
* Recopilación de datos en la Web (Web Scraping: Selenium, Beautiful Soup).
* Recolección mediante APIs.
- Esquema de programación Map Reduce.
- Introducción a Big Data (Machine Learning & Deep Learning).
- Introducción a los Sistemas Distribuidos.
- Interpretabilidad de algoritmos de caja negra.
Evaluación
convocatoria ordinaria como para la extraordinaria.
Cualquier alumno/a tendrá derecho a una prueba final pudiendo resultar su calificación la nota final del curso.
Bibliografía
* Russell, Matthew A. Mining the social web : [data mining Facebook, Twitter, LinkedIn, Google+, GitHub, and more] / Matthew A. Russell. Sebastopol (California) : O'Really Media, 2013
* Documentación Hadoop: http://hadoop.apache.org/docs/current/
* Documentación MrJob: https://pythonhosted.org/mrjob/
* Karau H., Konwinski A., Wendell P., and Zaharia M. Learning Spark. O'Reilly. 2015
* Documentación Spark: http://spark.apache.org/docs/latest/
* Python paso a paso. Angel Hinojosa Gutierrez
* Interpretabilidad Machine Learning: https://christophm.github.io/interpretable-ml-book/ - Christoph Molnar
Estructura
Módulos | Materias |
---|---|
No existen datos de módulos o materias para esta asignatura. |
Grupos
Clases teóricas y/o prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo A | 20/01/2025 - 16/05/2025 | JUEVES 18:00 - 19:30 | - | GABRIEL MARIN DIAZ |
Grupo B | 20/01/2025 - 16/05/2025 | LUNES 18:00 - 19:30 | - | JOSE JAVIER GALAN HERNANDEZ |
Actividades prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo A | 20/01/2025 - 16/05/2025 | JUEVES 19:30 - 21:00 | - | GABRIEL MARIN DIAZ |
Grupo B | 20/01/2025 - 16/05/2025 | LUNES 19:30 - 21:00 | - | JOSE JAVIER GALAN HERNANDEZ |