I. Fundamentos para el trabajo con datos.
Introducción a la Ciencia de Datos en Sociología: Definición, alcance y relevancia de la ciencia de datos en el campo de la sociología. Teoría, medición y dato. Principios básicos de programación y manipulación de datos con R: funciones básicas, creación de variables y exploración de datos.
II. La obtención del dato.
Fuentes de datos y cómo acceder a ellas. Procedimientos para importar datos de formatos comunes, búsqueda y descarga de datos de interés. Técnicas para recoger datos cuantitativos y cualitativos. Cómo recoger datos de Internet: APIs y raspados de web.
III La depuración del dato.
Introducción a la gestión de datos: preprocesamiento y limpieza de datos. Desafíos habituales en el trabajo con datos reales. Identificación de valores atípicos y gestión de datos perdidos. Comprobación de la calidad de los datos. Herramientas de control de versiones: Git y GitHub.
IV. La exploración del dato.
Análisis descriptivo y exploratorio de los datos: Aplicación de técnicas estadísticas para la exploración inicial de los datos, distribuciones, correlaciones y visualizaciones básicas. Fundamentos de la inferencia estadística: pruebas de hipótesis, intervalos de confianza y coeficientes de asociación.
V. La presentación del dato.
Introducción a la visualización de datos. Cómo comunicar los resultados del análisis de datos de manera clara y efectiva. Principios de visualización de datos. Visualización de datos con ggplot2 y realización de proyectos reproducibles con R Markdown.
VI. Técnicas avanzadas de trabajo con datos.
Técnicas avanzadas de análisis de datos: regresión, clasificación, agrupación. Correlación y causalidad. Minería de datos e introducción a la inteligencia artificial y el aprendizaje automático.
VII. Otras herramientas.
Análisis de redes con netCoin. Grafos avanzados: redes dinámicas, mapas, galerías y líneas temporales. Introducción al análisis automatizado de texto. Introducción al uso y funcionamiento de inteligencias artificiales.
A lo largo del curso se harán prácticas obligatorias de trabajo individual.
Es requisito indispensable además presentar un proyecto final de ciencia de datos en equipo.
Este trabajo contendrá el siguiente esquema:
- Introducción
- Objetivos
- Fuentes
- Tratamiento de los datos
- Análisis con los datos
- Cronograma