Guías Académicas

LINGÜÍSTICA DE CORPUS

LINGÜÍSTICA DE CORPUS

GRADO EN ESTUDIOS INGLESES

Curso 2024/2025

1. Datos de la asignatura

(Fecha última modificación: 06-06-24 12:14)
Código
102526
Plan
2010
ECTS
4.50
Carácter
OPTATIVA
Curso
Optativa 3º y 4º
Periodicidad
Primer cuatrimestre
Idioma
ENGLISH
Área
FILOLOGÍA INGLESA
Departamento
Filología Inglesa
Plataforma Virtual

Campus Virtual de la Universidad de Salamanca

Datos del profesorado

Profesor/Profesora
María Izaskun Elorza Amorós
Grupo/s
1
Centro
Fac. Filología
Departamento
Filología Inglesa
Área
Filología Inglesa
Despacho
1.2 Dpto. Filología Inglesa. Edificio Placentinos
Horario de tutorías
Presenciales u online en el siguiente horario: martes de 11:30 a 14:30 y miércoles de 16:30 a 19:30 (concertar previamente)
URL Web
https://produccioncientifica.usal.es/investigadores/56888/detalle
E-mail
iea@usal.es
Teléfono
923 294500 Ext. 6151

2. Recomendaciones previas

Asignaturas que se recomienda haber cursado: Introducción a los Estudios Ingleses (103488); Lingüística General (102457)

Asignaturas que se recomienda cursar simultáneamente:  Análisis del Discurso y Discurso Social (102548); Análisis Lingüístico de Textos Científico-Técnicos en Inglés (102527); Gramática Inglesa (102512); Métodos y Recursos para la Elaboración de un Trabajo Lingüístico en Inglés (102550); Pragmática Inglesa (102518); Semántica Inglesa (102517); Sociolingüística Inglesa (102525); Variación Lingüística en Inglés Moderno Temprano (102542); Variación Lingüística en Textos Literarios Ingleses (102539).

 

El nivel de competencia comunicativa en lengua inglesa mínimo recomendado para cursar esta asignatura corresponde con el C1.1 (MCER).

Se recomiendan unos conocimientos de manejo de ordenador PC a nivel de usuario.

Para poder acceder a algunos recursos que se utilizan en el curso, es necesario disponer de una cuenta de correo electrónico de la Universidad de Salamanca (…@usal.es).

3. Objetivos

Objetivos específicos

  • Definir, conocer, identificar y describir los componentes básicos de los corpus textuales.
  • Conocer e identificar los recursos disponibles para el análisis de corpus textuales en lengua inglesa.
  • Conocer e identificar algunos de los métodos de análisis cuantitativo y cualitativo de corpus textuales.
  • Saber manejar algunos de los programas de análisis de corpus disponibles en la actualidad.
  • Saber compilar corpus textuales en lengua inglesa.
  • Saber diseñar estudios lingüísticos sencillos que requieran la utilización de herramientas metodológicas de extracción de datos lingüísticos cuantitativos.
  • Saber extraer datos cuantitativos a partir de corpus textuales.
  • Saber interpretar cuantitativa y cualitativamente los datos extraídos en relación con los objetivos del estudio realizado.

Objetivos generales

  • Analizar empíricamente la lengua inglesa.
  • Analizar corpus textuales en lengua inglesa.
  • Identificar pautas de comportamiento de la lengua inglesa en uso en diferentes contextos.
  • Mejorar la capacidad de comprender el funcionamiento de la lengua inglesa.

Objetivos instrumentales

  • Aprender métodos de análisis cuantitativo y cualitativo de corpus textuales.
  • Mejorar la capacidad de utilizar herramientas tecnológicas básicas para el estudio del lenguaje.

4. Competencias a adquirir | Resultados de Aprendizaje

Básicas / Generales | Conocimientos.

CB3. Que el alumnado tenga la capacidad de reunir e interpretar datos relevantes.

CB4. Que el alumnado pueda transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.

CB5. Que el alumnado haya desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía.

CG1. Desarrollar la capacidad de recibir, comprender y transmitir la producción científica en español e inglés.

CG2. Desarrollar la capacidad para evaluar críticamente la bibliografía consultada y para encuadrarla en una perspectiva teórica.

Específicas | Habilidades.

CE1. Consolidación del uso de la lengua inglesa como vehículo comunicativo y como herramienta de trabajo y de investigación.

CE9. Conocimiento de las técnicas sencillas y métodos básicos del análisis cuantitativo y cualitativo de datos lingüísticos.

Transversales | Competencias.

CT1. Mejorar la capacidad de elaborar y comunicar el pensamiento reflexivo y el pensamiento analítico.

CT2. Mejorar la capacidad de aprender de fuentes de información bibliográfica.

CT3. Mejorar la capacidad de utilizar las nuevas tecnologías.

CT4. Mejorar la capacidad de analizar el lenguaje desde la perspectiva del lingüista.

5. Contenidos

Teoría.

THEORETICAL CONTENTS:

Unit 1. Studying language through corpus-assisted tools

Unit 2. Basic notions of corpus design and compilation

Unit 3. Basic notions of annotation and tagging

Unit 4. Meaning in corpora: challenges and approaches

Unit 5. Corpus as sources of data: approaches to the corpus as a methodological tool

Unit 6. Uses and application of linguistic analysis  with corpora. 

Práctica.

PRACTICAL CONTENTS:

1. Project: My corpus-assisted study.

2. Looking for my data.

3. What is my corpus like? What can (and cannot) do with it?

4. What do my data say?

6. Metodologías Docentes

Clases magistrales donde se desarrollan los contenidos teóricos del programa, combinadas con sesiones prácticas en las que se utilizan diferentes recursos informáticos para el análisis de corpus textuales. El hilo conductor del curso es el desarrollo individual de un supuesto práctico.

Dada la naturaleza de los contenidos del curso, se recomienda la asistencia a las clases, la participación en las mismas, así como la preparación teórica (lecturas recomendadas) y práctica (realización de las actividades sugeridas) como método más eficaz de aprender y, por tanto, para alcanzar los objetivos fijados para este curso.

7. Distribución de las Metodologías Docentes

8. Recursos

Libros de consulta para el alumno.

Barnbrook, G., Danielsson, P. and Mahlberg, M. (2005). Meaningful Texts: The Extraction of Semantic Information from Monolingual and Multilingual Corpora. London: Continuum.

Campoy-Cubillo, M. C., Bellés-Fortuño, B. and Gea-Valor, M. L. (2010). Corpus-based Approaches to English Language Teaching. London: Continuum.

Flowerdew, J. and Mahlberg, M. (2009). Lexical Cohesion and Corpus Linguistics. Amsterdam: John Benjamins.

Hidalgo Tenorio, E., Quereda Rodríguez-Navarro, L. and Santana, J. (2007). Corpora in the Foreign Language Classroom. Amsterdam: Rodopi.

Hoey, M. (1983). On the Surface of Discourse. London: George Allen and Unwin.

Hoey, M. (2005). Lexical Priming: A New Theory of Words and Language. Abingdon, Oxon: Routledge.

Hoey, M., Mahlberg, M., Stubbs, M. and Teubert, W. (2007). Text, Discourse and Corpora. London: Continuum.

Hunston, S. (2002). Corpora in Applied Linguistics. Cambridge: Cambridge University Press.

Johns, T. (1994). ‘The text and its message’. In Coulthard, M. (ed.), Advances in Written Text Analysis. London: Routledge, pp. 102–116.

Kretzschmar, W. A. Jr (2009). Habeas Corpus? Journal of English Linguistics 37(1): 88-92.

McEnery, T. and Hardy, A. (2012). Corpus Linguistics. Cambridge: Cambridge University Press.

McEnery, T. and Wilson, A. (2001), Corpus Linguistics. Edinburgh: Edinburgh University Press.

Mahlberg, M. (2005). English General Nouns: A Corpus Theoretical Approach. Amsterdam: John Benjamins.

Mahlberg, M. (2013). Corpus Stylistics and Dicken’s Fiction. London: Routledge.

Meyer, Ch. F. (2002). English Corpus Linguistics: An Introduction. Cambridge: Cambridge University Press.

O’Keeffe, A. and McCarthy, M. (eds.) (2010). The Routledge Handbook of Corpus Linguistics. Oxon: Routledge.

Scott, M. (1997). PC analysis of key words –and key key words. System 25 (2): 233-245.

Scott, M. and Tribble, C. (2006). Textual Patterns. Amsterdam: John Benjamins.

Sinclair, J. (2004). Trust the Text. Language, Corpus and Discourse. Abingdon: Routledge.

Stubbs, M. (1996). Text and Corpus Analysis. Oxford: Blackwell.

Stubbs, M. (2002). Words and Phrases. Oxford: Blackwell.

Otras referencias bibliográficas, electrónicas o cualquier otro tipo de recurso.

Programas informáticos:

Anthony, L. (2021). AntConc (última versión) [Computer Software]. Tokyo, Japan: Waseda University. Available from https://www.laurenceanthony.net/software/antconc/

O’Donnell, M. (2017). UAM Corpus Tool. Version 3.3. Corpus annotating software downloadable at http://corpustool.com/

The R Project for Statistical Computing. 2018. R (version 3.4.4.). A. Stefanowitsch and S. Gries. Available at https://www.r-project.org/

Scott, M. (2008). WordSmith Tools version 5, Liverpool: Lexical Analysis Software. https://www.lexically.net/wordsmith/

Apps:

Mahlberg, M., Stockwell, P., Wiegand, V. and Lentin, J. (2020) CLiC 2.1. Corpus Linguistics in Context. Available at: clic.bham.ac.uk

Corpus:

Australian National Corpus. https://www.ausnc.org.au/

Davies, M. (2007-…). English-Corpora.org. https://www.english-corpora.org/corpora.asp 

Simpson, R. C., S. L. Briggs, J. Ovens, and Swales, J. M. (2002). The Michigan Corpus of Academic Spoken English. Ann Arbor, MI: The Regents of the University of Michigan.

The BNC Sampler, XML version. (2005). Distributed by Oxford University Computing Services on behalf of the BNC Consortium. URL: http://www.natcorp.ox.ac.uk/

The Helsinki Corpus of English Texts (1991). Department of Modern Languages, University of Helsinki. Compiled by Matti Rissanen (Project leader), Merja Kytö (Project secretary); Leena Kahlas-Tarkka, Matti Kilpiö (Old English); Saara Nevanlinna, Irma Taavitsainen (Middle English); Terttu Nevalainen, Helena Raumolin-Brunberg (Early Modern English). Available at http://www.helsinki.fi/varieng/CoRD/corpora/HelsinkiCorpus/

The Salamanca Corpus. (2011). DING, The University of Salamanca, Patio de Escuelas Menores, Salamanca, Spain. Available at http://www.salamancacorpus.usal.es

9. Evaluación

Criterios de evaluación.

El aprendizaje de los fundamentos teóricos del curso, así como su aplicación práctica mediante el trabajo continuado a lo largo del curso y el desarrollo de un supuesto práctico de forma individual constituirán un criterio básico en el sistema de evaluación. En consecuencia, la evaluación global se basará, previa elección por parte de cada estudiante, en la valoración cada paso crítico del desarrollo del supuesto práctico y de la exposición final del mismo en clase. La asistencia es, por tanto, necesaria, ya que la evaluación se hará de forma progresiva, incluyendo la participación en diferentes momentos a lo largo del curso.

 

Se valora el aprendizaje de los contenidos, términos y conceptos tratados en las sesiones teóricas y de los adquiridos a partir de las fuentes de información de lectura obligatoria, así como el aprendizaje de las destrezas prácticas necesarias para el análisis de corpus textuales mediante recursos informáticos (corpus electrónicos y programas de procesamiento) adquiridas mediante el desarrollo de un caso práctico a lo largo del curso.

Sistemas de evaluación.

(1) Participación y contribución individual en las sesiones de discusión celebradas en clase, donde se mostrarán los conocimientos adquiridos, (2) aplicación de los conocimientos adquiridos a la resolución de problemas de diversos tipos planteados en sesiones de tutoría grupal, (3) aplicación de los conocimientos adquiridos al diseño y desarrollo de un caso práctico elegido individualmente, que se irá desarrollando a lo largo del curso (se evalúan hitos concretos a lo largo del desarrollo), (4) la exposición final del trabajo en clase (se proporcionan previamente requisitos, plantilla y rúbrica), y (5) contribuciones individuales a las discusiones de las exposiciones de los trabajos del resto de estudiantes en clase en las sesiones dedicadas a ello. Dado que la recogida de datos para la evaluación se realizará mayoritariamente durante las sesiones de clase, la falta de asistencia a tres o más de las sesiones conllevará la evaluación mediante entrevista oral, siguiendo el procedimiento que se describe para la segunda convocatoria.

Metodología 

Tipo de prueba a emplear

calificación

 

Participación y contribución individual en las sesiones de discusión

Oral individual

15%

Aplicación de los conocimientos adquiridos a la resolución de problemas de diversos tipos planteados en seminarios

Oral y escrita (individual y grupal)

10%

Aplicación de los conocimientos adquiridos al diseño y desarrollo de un caso práctico

Oral y escrita individual

30%

Exposición final del trabajo en clase

Oral y escrita individual

30%

Contribuciones a las discusiones de las exposiciones del resto de estudiantes

Oral y escrita individual

15%

 

Total

100%


Para obtener una evaluación final mediante la metodología y tipos de prueba descritos más arriba, es necesario obtener puntos en todos los instrumentos de evaluación detallados. En caso contrario, la evaluación se realizará mediante entrevista oral, tal como se describe a continuación, al igual que se hará para la evaluación en segunda convocatoria.

Las pruebas de recuperación consisten en la evaluación tanto los contenidos teóricos como los prácticos adquiridos, así como la capacidad de aplicarlos a diversos supuestos prácticos, mediante una entrevista oral individual de dos horas de duración. La entrevista oral puede incluir la utilización de soportes y programas informáticos, en caso de que sea necesario, como parte de la prueba, evaluar la destreza en el manejo de los programas utilizados durante el curso para el procesamiento de corpus al mismo nivel que el que se espera haber adquirido al final del curso (nivel usuario).

 

 

Recomendaciones para la evaluación.

Estudio y asimilación de los contenidos, conceptos y términos que conforman la parte teórica del curso, y desarrollo práctico de las actividades propuestas con la dedicación necesario dentro y fuera de clase, de acuerdo con la planificación del curso y las pautas proporcionadas en clase.

10. Organización docente semanal