Guías Académicas

EXPLOTACIÓN ESTADÍSTICA DE ALMACENES DE DATOS

EXPLOTACIÓN ESTADÍSTICA DE ALMACENES DE DATOS

Grado en Estadística- Plan 2016

Curso 2023/2024

1. Datos de la asignatura

(Fecha última modificación: 06-06-23 9:03)
Código
108418
Plan
2016
ECTS
6.00
Carácter
OBLIGATORIA
Curso
2
Periodicidad
Primer Semestre
Idioma
ESPAÑOL
Área
ESTADÍSTICA E INVESTIGACIÓN OPERATIVA
Departamento
Estadística
Plataforma Virtual

Campus Virtual de la Universidad de Salamanca

https://studium.usal.es/

Datos del profesorado

Coordinador/Coordinadora
María Teresa Cabero Morán
Grupo/s
1
Centro
Fac. Ciencias
Departamento
Estadística
Área
Estadística e Investigación Operativa
Despacho
D1512
Horario de tutorías
L y X de 11:00 a 12:00 y V de 9:00 a 11:00 y cita previa
URL Web
http://diarium.usal.es/mateca/
E-mail
mateca@usal.es
Teléfono
670620224 (Ext. 6993)

2. Sentido de la materia en el plan de estudios

Bloque formativo al que pertenece la materia.

Explotación Estadística de Almacenes de Datos (Ob), Control Estadístico de la Calidad (Ob), Técnicas Estadísticas en Minería de Datos (Op), Estadística Bayesiana (Op) y Diseño Óptimo de Experimentos (Op).

Papel de la asignatura.

Desarrollar un curso de manejo de bases de datos para su posterior utilización estadística, así como, una introducción a la Minería de Datos.

Perfil profesional.

Profesiones relacionadas con las ciencias de la salud, economía, comercio, marketing, banca, seguros y salud privada, transportes e industria.

3. Recomendaciones previas

Tener conocimientos de Estadística Descriptiva.

4. Objetivo de la asignatura

GENERALES:

Capacitar para la utilización de los conocimientos teóricos y prácticos adquiridos en la definición y planteamiento de problemas y en la búsqueda de sus soluciones tanto en contextos académicos como profesionales.

Preparar para posteriores estudios especializados, tanto en una disciplina estadística como en cualquiera de las ciencias que requieran el uso de información contenida en bases o almacenes de datos.

Conocer la relación de la Estadística y la Informática mediante las bases de datos.

Desarrollar las capacidades analíticas y de abstracción, la intuición y el pensamiento lógico, riguroso y crítico.

ESPECÍFICOS:

Saber organizar y gestionar la información para su posterior estudio estadístico.

Conocer las bases de datos y su utilización en estudios estadísticos.

Reconocer la necesidad de las bases de datos para el tratamiento y explotación estadística, así como, para la extracción de conocimiento útil y tomar decisiones con gran volumen de datos.

Saber seleccionar la información útil de un gran conjunto de datos.

Conocer las formas manuales y automáticas de extracción del conocimiento.

Reconocer la problemática del análisis de grandes volúmenes de datos y de los beneficios de su uso sistemático para la obtención de patrones predictivos o descriptivos.

Conocer las fases del Descubrimiento de Conocimiento de Bases de Datos y la importancia de las mismas en el éxito del proceso (en especial las de limpieza y selección de datos).

Conocer qué es un patrón estadístico y para qué se utiliza.

5. Contenidos

Teoría.

  1. CONCEPTOS GENERALES SOBRE LAS BASES DE DATOS. Definición, almacenamiento y tipos.
  2. ORGANIZACIÓN DE LA INFORMACIÓN. Datos, registros, tablas, bases de datos…
  3. ALMACÉN DE DATOS. Definición, funciones. Ejemplos.
  4. SISTEMAS DE GESTIÓN DE BASES DE DATOS RELACIONALES. Definición, funciones. El lenguaje SQL. Creación de consultas.
  5. DISTINTOS SISTEMAS DE ALMACENAMIENTO. Cambios de formatos.
  6. SELECCIÓN DE DATOS. Reconocimiento de datos útiles para posterior explotación estadística. Preparación de datos: selección, discretización, selección de instancias, selección de atributos.
  7. EXPLOTACIÓN ESTADÍSTICA DE DATOS. Introducción a la minería de datos. Tipos de datos, técnicas y variables. Áreas de aplicación. Problemas tipo.
  8. EL PROCESO DE LA EXTRACCIÓN DEL CONOCIMENTO. Recogida de datos. KDD y sus fases.
  9. EXTRACCIÓN DE PATRONES. Técnicas en Minería de Datos basadas en aprendizaje automático. Clasificación de técnicas. Sistemas informáticos.
  10. ALGUNOS ALGORITMOS EN MINERÍA DE DATOS. Introducción a las principales técnicas utilizadas en Minería de Datos.

6. Competencias a adquirir

Básicas / Generales.

    CB1: Demostrar poseer y comprender conocimientos en técnicas estadísticas avanzadas y de la vanguardia.
•    CB2: Saber aplicar sus conocimientos a su trabajo de una forma profesional y poseer las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro del área de estadística avanzada. 
•    CB3: Tener la capacidad de reunir e interpretar datos de diversas áreas de estudio para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética. 
•    CG1: Comprender y utilizar el leguaje estadístico. Adquirir la capacidad para analizar, sintetizar y transmitir los problemas de los distintos campos de aplicación de la estadística avanzada. 
•    CG3: Proponer, analizar, validar e interpretar modelos de situaciones reales utilizando las técnicas estadísticas avanzadas más adecuadas a los fines que se persigan.
•    CG5: Adquirir los conocimientos estadísticos necesarios para desarrollar adecuadamente las investigaciones estadísticas.

Específicas.

  • Conocer el proceso de la extracción del conocimiento en almacenes de datos, los tipos y clasificación de datos, técnicas y variables, la limpieza y transformación de bases de datos y los algoritmos descriptivos y predictivos. 
  •   Familiarizarse con las técnicas basadas en aprendizaje automático de extracción y entrenamiento de patrones, la evaluación estadística de patrones y la selección de atributos. 
  • Seleccionar y transformar datos cuando hay una gran cantidad de información.
  • Organizar los datos procedentes de muestras grandes con muchas variables.
  •  Demostrar poseer y comprender conocimientos en técnicas estadísticas avanzadas procedentes de la vanguardia de la estadística para proponer, analizar, validar e interpretar patrones en situaciones reales.
  •  Tener la capacidad de reunir e interpretar datos de diversas áreas de estudio para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
  •  Poder transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
  • Conocer, utilizar y desarrollar diferentes herramientas informáticas de uso común en los ámbitos de la explotación de datos y datos masivos para gestionar la información disponible de manera óptima.

Transversales.

INSTRUMENTALES:

Capacidad de análisis y síntesis.

Capacidad de organización y planificación.

Capacidad de gestión de la información.

Resolución de problemas.

INTERPERSONALES:

Trabajo en equipo.

Razonamiento crítico.

Compromiso ético.

Habilidades en las relaciones interpersonales.

Sentido de la igualdad en su amplia definición.

SISTÉMICAS:

Aprendizaje autónomo.

Motivación por la calidad.

Compromiso con el medio ambiente.

7. Metodologías

  • Clases de Teoría. En estas clases se mostrarán los diferentes contenidos del programa expuesto. Así mismo se plantearán y resolverán ejercicios que ayuden a la comprensión de la teoría.
  • Clases de Prácticas. Resolución de prácticas en las que se aplicarán lo expuesto en las clases teóricas. Se desarrollan todas en el aula de informática. Comprenden la realización de prácticas de ordenador con ayuda de programas especializados como SPSS, Excel, Access o Weka.
  • Exposiciones Orales. El/la alumno/a, bajo la supervisión de la profesora, realiza trabajos o ejercicios individuales o en grupo que explica bien en la pizarra o bien en el ordenador en clase delante de sus compañeros o también los ejercicios resueltos durante los seminarios.
  • Seminarios tutelados. Propuesta de ejercicios prácticos con frecuencia que requieran el uso de los resultados explicados en las clases magistrales. Estos problemas son resueltos en los seminarios, donde los/as estudiantes pueden compartir con sus compañeros y con la profesora las dudas que encuentren, obtener solución a las mismas y comenzar a desempeñar por sí mismos las competencias del módulo.

8. Previsión de Técnicas (Estrategias) Docentes

9. Recursos

Libros de consulta para el alumno.

MAZÓN, J.N., PARDILLO, J. y TRUJILLO, J.C. (2013): “Diseño y explotación de almacenes de datos”. Editorial Club Universitario.

HERNÁNDEZ ORALLO J., RAMÍREZ M.J. y FERRI C. (2004): “Introducción a la Minería de Datos”. Editorial Pearson.

Apuntes proporcionados por la profesora.

Otras referencias bibliográficas, electrónicas o cualquier otro tipo de recurso.

IAN H. WITTEN, EIBE FRANK (2005): “Data Mining: Practical Machine Learning Tools and Techniques”. Second Edition. Morgan Kaufmann Series in Data Management Systems.

PANG-NING TAN, MICHAEL STEINBACH, VIPIN KUMAR (2005): “Data Mining: Concepts and Techniques”, Addison Wesley.

https://moodle2.usal.es/

10. Evaluación

Consideraciones generales.

Será el resultado de una ponderación basada en el desarrollo de cuestiones, exámenes y ejercicios planteados a los alumnos durante el curso, las exposiciones en clase, la participación y asistencia a clase y de la nota obtenida en un examen.

Criterios de evaluación.

La calificación final será el resultado de 4 apartados:

A.- Ejercicios, test de teoría planteados durante el curso y exposiciones (15%).

B.- Prueba examen de evaluación continua de teoría y problemas (20%).

C.- Participación en clase (5%).

D.- Examen final, por medio de una prueba escrita que constará de una parte teórica (20%) y de otra de prácticas (40%).

Los apartados A, B y C equivalen a la calificación por curso (evaluación continua).

Para poder aprobar la asignatura será necesario obtener en el apartado D un mínimo de 4 puntos sobre 10. En caso contrario la calificación final corresponderá con la del examen final.

Se considerará la calificación de No Presentado, si el estudiante no se presenta al examen final

Instrumentos de evaluación.

Pruebas escritas en clase e Internet y exposiciones orales en clase.

Recomendaciones para la evaluación.

Estudiar la asignatura de forma regular desde el principio.

Asistir a clase.

Consultar a la profesora las dudas que se tengan.

Recomendaciones para la recuperación.

Las anteriores.

La recuperación se realizará solamente sobre el examen final (apartado D), y se valorará junto con la nota obtenida en el proceso del curso, la evaluación continua (apartados A, B y C) en las mismas proporciones.