TEMARIO
Programación de visualización de datos.
Una de las capacidades clave de esta asignatura es saber implementar interfaces visuales para la exploración o comunicación de datos a escala. Se presentan una variedad de tecnologías destinadas a la producción de visualización de datos. Además de mostrar una amplia gama de herramientas emergentes, trabajaremos con las bibliotecas, frameworks y lenguajes de programación que se han convertido en un estándar para la visualización, como d3.js, Vega, R y Python.
Programación estadística
El curso proporcionará a los estudiantes conocimientos prácticos de análisis de datos y técnicas estadísticas: R y SQL modelos de aprendizaje automático y técnicas de minería de datos (data mining) para la creación de sistemas predictivos, recomendadores y sistemas de clasificación. También se proporcionará una descripción general de probabilidad, variables aleatorias discretas y continuas, distribuciones, correlaciones, regresión y otras técnicas estadísticas.
Cartografía y visualización.
Una cantidad considerable de datos públicos emana de las geografías inherentes al propio territorio administrativo. Este curso presenta los múltiples usos del mapeo para explorar y revelar patrones espaciales. Cubrirá todo, desde el diseño de mapas hasta la gestión y representación de datos, técnicas geoestadísticas y tecnologías web emergentes que han revolucionado los sistemas de información geográfica.
Diseño de visualización de datos y tecnologías creativas.
La visualización de datos es un lenguaje y, como todos los lenguajes, tiene un código preciso, pero también tiene flexibilidad para la creatividad. En esta asignatura estudiaremos cómo convertir variables cuantitativas en atributos visuales, gramática gráfica, composición, estética de la información, diseño de interacción y diseño de información. Es una materia de lápiz y papel que involucra análisis y debate de estudios de casos, diseñada para complementar la programación de visualización de datos.
Ética y cultura democrática
Este curso tiene como objetivo proporcionar un contexto sobre cómo la Inteligencia Artificial y el uso indebido de datos están impactando a la sociedad, incluidos los prejuicios injustos, la vigilancia y la violación de la privacidad. Busca analizar diferentes escenarios identificando riesgos para las personas, así como repensar mejoras para desarrollar posibles soluciones. La atención se centrará siempre en cómo podemos ser más éticos, legales y seguros al trabajar con datos y tecnología.
Ingeniería de datos abiertos y arquitectura de sistemas.
Una de las habilidades necesarias para crear herramientas de exploración de datos escalables es cómo almacenamos y procesamos conjuntos de datos. En esta asignatura abordaremos las bases para construir la arquitectura de sistemas de datos tradicionales y modernos para big data. También se discutirán los conceptos básicos de la computación en la nube, con énfasis en resolver necesidades específicas de análisis de datos y ciencia.
Talleres de trabajo
Cada taller consistirá en la elaboración de un proyecto, realizado con una de las entidades colaboradoras (públicas o privadas) del Máster.
Todos los talleres son independientes, lo que significa que un proyecto no puede iniciarse en el Taller I y continuar en los Talleres II y III. Las habilidades necesarias para desarrollar los proyectos deben ser complementarias. Por tanto, sólo tendrán que cumplir una o dos partes del proceso de visualización.
A partir de una breve introducción y un prototipo, los estudiantes trabajarán online y en grupo. En una sesión intensiva presencial (modalidad hackathon), se presentará y evaluará el resultado final de cada proyecto.
Proyecto final (TFM)
El TFM debe cumplir con todo el proceso de visualización: desde la búsqueda y recogida de datos hasta la gestión de la base de datos, transformación, análisis, evaluación y visualización.
Debido a su mayor duración, la parte presencial constará de dos sesiones intensivas (hackathons) con el fin de presentar y evaluar el trabajo realizado.
Un ejemplo de TFM sería el siguiente: Informe 'Ataques aéreos liderados por Estados Unidos contra el Estado Islámico en Siria e Irak'. El periódico mantuvo actualizada la base de datos durante un año. El software fue escrito para detectar nuevas publicaciones publicadas en el sitio web de operaciones del Departamento de Defensa de los Estados Unidos, extrayendo las ubicaciones y fechas de los bombardeos del texto de estos informes. El software también alertó a un grupo de periodistas, quienes verificaron y aprobaron los datos extraídos. Una vez que se verificó la información, los datos se pasaron automáticamente al conjunto de datos, que actualizó una pantalla interactiva de los datos extraídos.