DATA SCIENCE
Grado en Sociología
Curso 2023/2024
1. Datos de la asignatura
(Fecha última modificación: 02-06-23 8:35)- Código
- 109669
- Plan
- 2020
- ECTS
- 4.00
- Carácter
- OPTATIVA
- Curso
- Optativa 3º y 4º
- Periodicidad
- Segundo Semestre
- Área
- SOCIOLOGÍA
- Departamento
- Sociología y Comunicación
- Plataforma Virtual
Datos del profesorado
- Profesor/Profesora
- Rafael Modesto Escobar Mercado
- Grupo/s
- Único
- Centro
- Fac. Ciencias Sociales
- Departamento
- Sociología y Comunicación
- Área
- Sociología
- Despacho
- 402
- Horario de tutorías
- Miércoles: 8:00-14:00 (Previa solicitud)
- URL Web
- -
- modesto@usal.es
- Teléfono
- 923 294400 Ext. 3529
2. Sentido de la materia en el plan de estudios
3. Recomendaciones previas
4. Objetivo de la asignatura
- Entender los fundamentos metodológicos, estadísticos e informáticos necesarios para trabajar con datos numéricos y textuales.
- Conocer las implicaciones éticas y legales de la recopilación, el uso y la interpretación de datos.
- Comprender principios básicos de programación y manipulación de datos con R.
- Familiarizarse con herramientas y técnica para limpiar, analizar y visualizar datos.
- Introducirse en el mundo de la minería de datos, las redes sociales, el big data y la inteligencia artificial.
- Elaborar proyectos de ciencia de datos en equipo.
5. Contenidos
Teoría.
I. Fundamentos para el trabajo con datos.
Introducción a la Ciencia de Datos en Sociología: Definición, alcance y relevancia de la ciencia de datos en el campo de la sociología. Teoría, medición y dato. Principios básicos de programación y manipulación de datos con R: funciones básicas, creación de variables y exploración de datos.
II. La obtención del dato.
Fuentes de datos y cómo acceder a ellas. Procedimientos para importar datos de formatos comunes, búsqueda y descarga de datos de interés. Técnicas para recoger datos cuantitativos y cualitativos. Cómo recoger datos de Internet: APIs y raspados de web.
III La depuración del dato.
Introducción a la gestión de datos: preprocesamiento y limpieza de datos. Desafíos habituales en el trabajo con datos reales. Identificación de valores atípicos y gestión de datos perdidos. Comprobación de la calidad de los datos. Herramientas de control de versiones: Git y GitHub.
IV. La exploración del dato.
Análisis descriptivo y exploratorio de los datos: Aplicación de técnicas estadísticas para la exploración inicial de los datos, distribuciones, correlaciones y visualizaciones básicas. Fundamentos de la inferencia estadística: pruebas de hipótesis, intervalos de confianza y coeficientes de asociación.
V. La presentación del dato.
Introducción a la visualización de datos. Cómo comunicar los resultados del análisis de datos de manera clara y efectiva. Principios de visualización de datos. Visualización de datos con ggplot2 y realización de proyectos reproducibles con R Markdown.
VI. Técnicas avanzadas de trabajo con datos.
Técnicas avanzadas de análisis de datos: regresión, clasificación, agrupación. Correlación y causalidad. Minería de datos e introducción a la inteligencia artificial y el aprendizaje automático.
VII. Otras herramientas.
Análisis de redes con netCoin. Grafos avanzados: redes dinámicas, mapas, galerías y líneas temporales. Introducción al análisis automatizado de texto. Introducción al uso y funcionamiento de inteligencias artificiales.
Práctica.
A lo largo del curso se harán prácticas obligatorias de trabajo individual.
Es requisito indispensable además presentar un proyecto final de ciencia de datos en equipo.
Este trabajo contendrá el siguiente esquema:
- Introducción
- Objetivos
- Fuentes
- Tratamiento de los datos
- Análisis con los datos
- Cronograma
6. Competencias a adquirir
Básicas / Generales.
- Capacidad de recopilar, almacenar y depurar datos de diversas fuentes.
- Comprensión de las implicaciones éticas de la investigación con datos.
- Habilidad de aplicar técnicas estadísticas para la exploración de datos.
- Habilidad de aplicar técnicas de visualización y comunicación de datos.
- Capacidad de aplicar técnicas más complejas de análisis de datos.
- Capacidad de comunicar resultados y conclusiones procedente de datos.
- Habilidad de trabajo en equipo para la elaboración de proyectos.
7. Metodologías

8. Previsión de Técnicas (Estrategias) Docentes
9. Recursos
Libros de consulta para el alumno.
Andrews, M. Doing Data Science in R. (2021). Thousand Oaks, CA: Sage.
Arcila, C. (2022). Computational Analysis of Communication: A Practical Introduction to the Analysis of Texts, Networks, and Images with Code Examples in Python and R. Wiley.
García, J., Molina, J., Berlanga, A., Patricio, M., Bustamante, A., & Padilla, W. (2018). Ciencia de datos. Técnicas Analíticas y Aprendizaje Estadístico. Bogotá, Colombia. Publicaciones Altaria, SL.
Irizarry, Rafael A. Introducción a la ciencia de datos. En http://rafalab.dfci.harvard.edu/dslibro/
Robles, J. M. et al. (2020). Big data para científicos sociales. Madrid: CIS.
Salganik, Mathew (2018). Bit by bit in the Digital Age. New Jersey: Princeton University Press.
Timbers, Tiffany, Trevor Campbell y Melissa Lee (2022). Data Science: A First Introduction. En https://datasciencebook.ca/
Nelson, P. C. J. (2020). Introducción a la ciencia de datos en R: Un enfoque práctico. Editorial Universidad Distrital Francisco José de Caldas.
Wickham, H., & Grolemund, G. (2016). R for data science: import, tidy, transform, visualize, and model data. O'Reilly Media, Inc. En: https://r4ds.had.co.nz/
Otras referencias bibliográficas, electrónicas o cualquier otro tipo de recurso.
Página web de la asignatura: https://sociocav.usal.es/me/dataScience24/
Otras páginas: https://www.cienciadedatos.net/ https://www.dssgfellowship.org/ https://www.kdnuggets.com/ https://thesocietypages.org/
10. Evaluación
Consideraciones generales.
En cada tema se hará un ejercicio puntuable. Todas estas evaluaciones prácticas han de tener una calificación mínima de 4 y equivaldrán al 60% de la calificación final, mientras que el peso del proyecto en equipo será del 40%.
Criterios de evaluación.
-Comprensión adecuada de los conceptos
-Correcta interpretación de los datos
-Relación de la teoría y el conocimiento sociológico con la interpretación de los datos.
Instrumentos de evaluación.
Prácticas semanales.
Elaboración de un proyecto en equipo.
Recomendaciones para la evaluación.
- Que se asista a clase
- Que se siga la asignatura a lo largo del curso
- Que se hagan los ejercicios
- Que se consulten dudas en tutorías
- Que se estudie la materia
Recomendaciones para la recuperación.
- Que se consulten en tutorías los errores cometidos en pruebas y ejercicios
- Que se estudie y se mejoren las prácticas, en su caso.