DATA SCIENCE
Grado en Sociología
Curso 2023/2024
1. Datos de la asignatura
(Fecha última modificación: 02-06-23 8:35)- Código
- 109669
- Plan
- 2020
- ECTS
- 4.00
- Carácter
- OPTATIVA
- Curso
- Optativa 3º y 4º
- Periodicidad
- Segundo Semestre
- Idioma
- ESPAÑOL
- Área
- SOCIOLOGÍA
- Departamento
- Sociología y Comunicación
- Plataforma Virtual
Datos del profesorado
- Profesor/Profesora
- Rafael Modesto Escobar Mercado
- Grupo/s
- Único
- Centro
- Fac. Ciencias Sociales
- Departamento
- Sociología y Comunicación
- Área
- Sociología
- Despacho
- 402
- Horario de tutorías
- Miércoles: 8:00-14:00 (Previa solicitud)
- URL Web
- -
- modesto@usal.es
- Teléfono
- 923 294400 Ext. 3529
2. Recomendaciones previas
3. Objetivos
- Entender los fundamentos metodológicos, estadísticos e informáticos necesarios para trabajar con datos numéricos y textuales.
- Conocer las implicaciones éticas y legales de la recopilación, el uso y la interpretación de datos.
- Comprender principios básicos de programación y manipulación de datos con R.
- Familiarizarse con herramientas y técnica para limpiar, analizar y visualizar datos.
- Introducirse en el mundo de la minería de datos, las redes sociales, el big data y la inteligencia artificial.
- Elaborar proyectos de ciencia de datos en equipo.
4. Competencias a adquirir | Resultados de Aprendizaje
Básicas / Generales.
- Capacidad de recopilar, almacenar y depurar datos de diversas fuentes.
- Comprensión de las implicaciones éticas de la investigación con datos.
- Habilidad de aplicar técnicas estadísticas para la exploración de datos.
- Habilidad de aplicar técnicas de visualización y comunicación de datos.
- Capacidad de aplicar técnicas más complejas de análisis de datos.
- Capacidad de comunicar resultados y conclusiones procedente de datos.
- Habilidad de trabajo en equipo para la elaboración de proyectos.
5. Contenidos
Teoría.
I. Fundamentos para el trabajo con datos.
Introducción a la Ciencia de Datos en Sociología: Definición, alcance y relevancia de la ciencia de datos en el campo de la sociología. Teoría, medición y dato. Principios básicos de programación y manipulación de datos con R: funciones básicas, creación de variables y exploración de datos.
II. La obtención del dato.
Fuentes de datos y cómo acceder a ellas. Procedimientos para importar datos de formatos comunes, búsqueda y descarga de datos de interés. Técnicas para recoger datos cuantitativos y cualitativos. Cómo recoger datos de Internet: APIs y raspados de web.
III La depuración del dato.
Introducción a la gestión de datos: preprocesamiento y limpieza de datos. Desafíos habituales en el trabajo con datos reales. Identificación de valores atípicos y gestión de datos perdidos. Comprobación de la calidad de los datos. Herramientas de control de versiones: Git y GitHub.
IV. La exploración del dato.
Análisis descriptivo y exploratorio de los datos: Aplicación de técnicas estadísticas para la exploración inicial de los datos, distribuciones, correlaciones y visualizaciones básicas. Fundamentos de la inferencia estadística: pruebas de hipótesis, intervalos de confianza y coeficientes de asociación.
V. La presentación del dato.
Introducción a la visualización de datos. Cómo comunicar los resultados del análisis de datos de manera clara y efectiva. Principios de visualización de datos. Visualización de datos con ggplot2 y realización de proyectos reproducibles con R Markdown.
VI. Técnicas avanzadas de trabajo con datos.
Técnicas avanzadas de análisis de datos: regresión, clasificación, agrupación. Correlación y causalidad. Minería de datos e introducción a la inteligencia artificial y el aprendizaje automático.
VII. Otras herramientas.
Análisis de redes con netCoin. Grafos avanzados: redes dinámicas, mapas, galerías y líneas temporales. Introducción al análisis automatizado de texto. Introducción al uso y funcionamiento de inteligencias artificiales.
Práctica.
A lo largo del curso se harán prácticas obligatorias de trabajo individual.
Es requisito indispensable además presentar un proyecto final de ciencia de datos en equipo.
Este trabajo contendrá el siguiente esquema:
- Introducción
- Objetivos
- Fuentes
- Tratamiento de los datos
- Análisis con los datos
- Cronograma
6. Metodologías Docentes
7. Distribución de las Metodologías Docentes
8. Recursos
Libros de consulta para el alumno.
Andrews, M. Doing Data Science in R. (2021). Thousand Oaks, CA: Sage.
Arcila, C. (2022). Computational Analysis of Communication: A Practical Introduction to the Analysis of Texts, Networks, and Images with Code Examples in Python and R. Wiley.
García, J., Molina, J., Berlanga, A., Patricio, M., Bustamante, A., & Padilla, W. (2018). Ciencia de datos. Técnicas Analíticas y Aprendizaje Estadístico. Bogotá, Colombia. Publicaciones Altaria, SL.
Irizarry, Rafael A. Introducción a la ciencia de datos. En http://rafalab.dfci.harvard.edu/dslibro/
Robles, J. M. et al. (2020). Big data para científicos sociales. Madrid: CIS.
Salganik, Mathew (2018). Bit by bit in the Digital Age. New Jersey: Princeton University Press.
Timbers, Tiffany, Trevor Campbell y Melissa Lee (2022). Data Science: A First Introduction. En https://datasciencebook.ca/
Nelson, P. C. J. (2020). Introducción a la ciencia de datos en R: Un enfoque práctico. Editorial Universidad Distrital Francisco José de Caldas.
Wickham, H., & Grolemund, G. (2016). R for data science: import, tidy, transform, visualize, and model data. O'Reilly Media, Inc. En: https://r4ds.had.co.nz/
Otras referencias bibliográficas, electrónicas o cualquier otro tipo de recurso.
Página web de la asignatura: https://sociocav.usal.es/me/dataScience24/
Otras páginas: https://www.cienciadedatos.net/ https://www.dssgfellowship.org/ https://www.kdnuggets.com/ https://thesocietypages.org/
9. Evaluación
Consideraciones generales.
En cada tema se hará un ejercicio puntuable. Todas estas evaluaciones prácticas han de tener una calificación mínima de 4 y equivaldrán al 60% de la calificación final, mientras que el peso del proyecto en equipo será del 40%.
Criterios de evaluación.
-Comprensión adecuada de los conceptos
-Correcta interpretación de los datos
-Relación de la teoría y el conocimiento sociológico con la interpretación de los datos.
Instrumentos de evaluación.
Prácticas semanales.
Elaboración de un proyecto en equipo.
Recomendaciones para la evaluación.
- Que se asista a clase
- Que se siga la asignatura a lo largo del curso
- Que se hagan los ejercicios
- Que se consulten dudas en tutorías
- Que se estudie la materia
Recomendaciones para la recuperación.
- Que se consulten en tutorías los errores cometidos en pruebas y ejercicios
- Que se estudie y se mejoren las prácticas, en su caso.