Entradas

Mostrando entradas de marzo, 2025

Máster en Ingeniería y ciencia de datos de la UNED - Infraestructuras Computacionales para el Procesamiento de Datos Masivos

  La asignatura. La asignatura de Infraestructuras Computacionales para el Procesamiento de Datos Masivos se imparte en el primer cuatrimestre del máster en Ingeniería y ciencia de datos. Se trata de la asignatura donde se enseña a usar herramientas tales como Hadoop, Spark u otras que forman parte de proveedores comerciales de software (Azure, AWS y GCP). No se trata de una asignatura demasiado compleja, si bien la configuración de las herramientas puede ser bastante problemática de cara a la resolución de las PEC. Por ello, es recomendable el realizar las PEC con tiempo. Hay 3 PEC valiendo cada una un 20 % de la asignatura y un examen que vale un 40 %. La primera práctica consiste en el uso de Hadoop, para lo que son necesarios conocimientos de Python y de SQL. La segunda práctica emplea Spark , para lo que son necesarios conocimientos de Python y de SQL. La tercera práctica consiste en el uso de una herramienta comercial, bien AWS o GCP, para resolución de un caso práctico consi...