Guías Académicas

DATA SCIENCE

DATA SCIENCE

Grado en Sociología

Curso 2023/2024

1. Datos de la asignatura

(Fecha última modificación: 02-06-23 8:35)
Código
109669
Plan
2020
ECTS
4.00
Carácter
OPTATIVA
Curso
Optativa 3º y 4º
Periodicidad
Segundo Semestre
Idioma
ESPAÑOL
Área
SOCIOLOGÍA
Departamento
Sociología y Comunicación
Plataforma Virtual

Campus Virtual de la Universidad de Salamanca

Datos del profesorado

Profesor/Profesora
Rafael Modesto Escobar Mercado
Grupo/s
Único
Centro
Fac. Ciencias Sociales
Departamento
Sociología y Comunicación
Área
Sociología
Despacho
402
Horario de tutorías
Miércoles: 8:00-14:00 (Previa solicitud)
URL Web
-
E-mail
modesto@usal.es
Teléfono
923 294400 Ext. 3529

2. Recomendaciones previas

-

3. Objetivos

  • Entender los fundamentos metodológicos, estadísticos e informáticos necesarios para trabajar con datos numéricos y textuales.
  • Conocer las implicaciones éticas y legales de la recopilación, el uso y la interpretación de datos.
  • Comprender principios básicos de programación y manipulación de datos con R.
  • Familiarizarse con herramientas y técnica para limpiar, analizar y visualizar datos.
  • Introducirse en el mundo de la minería de datos, las redes sociales, el big data y la inteligencia artificial.
  • Elaborar proyectos de ciencia de datos en equipo.

4. Competencias a adquirir | Resultados de Aprendizaje

Básicas / Generales.

  • Capacidad de recopilar, almacenar y depurar datos de diversas fuentes.
  • Comprensión de las implicaciones éticas de la investigación con datos.
  • Habilidad de aplicar técnicas estadísticas para la exploración de datos.
  • Habilidad de aplicar técnicas de visualización y comunicación de datos.
  • Capacidad de aplicar técnicas más complejas de análisis de datos.
  • Capacidad de comunicar resultados y conclusiones procedente de datos.
  • Habilidad de trabajo en equipo para la elaboración de proyectos.

5. Contenidos

Teoría.

I.  Fundamentos para el trabajo con datos.

Introducción a la Ciencia de Datos en Sociología: Definición, alcance y relevancia de la ciencia de datos en el campo de la sociología. Teoría, medición y dato. Principios básicos de programación y manipulación de datos con R: funciones básicas, creación de variables y exploración de datos.

 

II. La obtención del dato.

Fuentes de datos y cómo acceder a ellas. Procedimientos para importar datos de formatos comunes, búsqueda y descarga de datos de interés. Técnicas para recoger datos cuantitativos y cualitativos. Cómo recoger datos de Internet: APIs y raspados de web.

 

III La depuración del dato.

Introducción a la gestión de datos: preprocesamiento y limpieza de datos. Desafíos habituales en el trabajo con datos reales. Identificación de valores atípicos y gestión de datos perdidos. Comprobación de la calidad de los datos. Herramientas de control de versiones: Git y GitHub.

IV. La exploración del dato.

Análisis descriptivo y exploratorio de los datos: Aplicación de técnicas estadísticas para la exploración inicial de los datos, distribuciones, correlaciones y visualizaciones básicas. Fundamentos de la inferencia estadística: pruebas de hipótesis, intervalos de confianza y coeficientes de asociación.

 

V. La presentación del dato.

Introducción a la visualización de datos. Cómo comunicar los resultados del análisis de datos de manera clara y efectiva. Principios de visualización de datos. Visualización de datos con ggplot2 y realización de proyectos reproducibles con R Markdown.

 

VI. Técnicas avanzadas de trabajo con datos.

Técnicas avanzadas de análisis de datos: regresión, clasificación, agrupación. Correlación y causalidad. Minería de datos e introducción a la inteligencia artificial y el aprendizaje automático.

 

VII. Otras herramientas.

Análisis de redes con netCoin. Grafos avanzados: redes dinámicas, mapas, galerías y líneas temporales. Introducción al análisis automatizado de texto. Introducción al uso y funcionamiento de inteligencias artificiales.

Práctica.

A lo largo del curso se harán prácticas obligatorias de trabajo individual.

Es requisito indispensable además presentar un proyecto final de ciencia de datos en equipo.

Este trabajo contendrá el siguiente esquema:

  • Introducción
  • Objetivos
  • Fuentes
  • Tratamiento de los datos
  • Análisis con los datos
  • Cronograma

6. Metodologías Docentes

-

7. Distribución de las Metodologías Docentes

8. Recursos

Libros de consulta para el alumno.

Andrews, M. Doing Data Science in R. (2021). Thousand Oaks, CA: Sage.

Arcila, C. (2022). Computational Analysis of Communication: A Practical Introduction to the Analysis of Texts, Networks, and Images with Code Examples in Python and R. Wiley.

García, J., Molina, J., Berlanga, A., Patricio, M., Bustamante, A., & Padilla, W. (2018). Ciencia de datos. Técnicas Analíticas y Aprendizaje Estadístico. Bogotá, Colombia. Publicaciones Altaria, SL.

Irizarry, Rafael A. Introducción a la ciencia de datos. En http://rafalab.dfci.harvard.edu/dslibro/

Robles, J. M. et al. (2020). Big data para científicos sociales. Madrid: CIS.

Salganik, Mathew (2018). Bit by bit in the Digital Age. New Jersey: Princeton University Press.

Timbers, Tiffany, Trevor Campbell y Melissa Lee (2022). Data Science: A First Introduction. En https://datasciencebook.ca/

Nelson, P. C. J. (2020). Introducción a la ciencia de datos en R: Un enfoque práctico. Editorial Universidad Distrital Francisco José de Caldas.

Wickham, H., & Grolemund, G. (2016). R for data science: import, tidy, transform, visualize, and model data.  O'Reilly Media, Inc. En: https://r4ds.had.co.nz/

Otras referencias bibliográficas, electrónicas o cualquier otro tipo de recurso.

9. Evaluación

Consideraciones generales.

En cada tema se hará un ejercicio puntuable. Todas estas evaluaciones prácticas han de tener una calificación mínima de 4 y equivaldrán al 60% de la calificación final, mientras que el peso del proyecto en equipo será del 40%.

Criterios de evaluación.

-Comprensión adecuada de los conceptos

-Correcta interpretación de los datos

-Relación de la teoría y el conocimiento sociológico con la interpretación de los datos.

Instrumentos de evaluación.

Prácticas semanales.

Elaboración de un proyecto en equipo.

Recomendaciones para la evaluación.

- Que se asista a clase

- Que se siga la asignatura a lo largo del curso

- Que se hagan los ejercicios

- Que se consulten dudas en tutorías

- Que se estudie la materia

Recomendaciones para la recuperación.

- Que se consulten en tutorías los errores cometidos en pruebas y ejercicios

- Que se estudie y se mejoren las prácticas, en su caso.