Historia Digital e Inteligencia Artificial

Proyecto de investigación para el desarrollo de metodologías computacionales en el análisis histórico

Resumen Ejecutivo

Este proyecto propone el desarrollo de un marco metodológico integrado que articule herramientas de inteligencia artificial con prácticas historiográficas establecidas. El objetivo central es diseñar protocolos reproducibles para el análisis computacional de fuentes históricas, manteniendo la rigurosidad epistemológica propia de la disciplina.

La investigación se enfoca en corpus documentales del período 1880-1950 en Argentina, explorando técnicas de procesamiento del lenguaje natural, reconocimiento óptico de caracteres (OCR) y modelado de tópicos para identificar patrones narrativos, actores sociales y transformaciones discursivas.

Ficha del Proyecto

Director
Dr. Agustín Nieto
Institución
CONICET / UNS
Duración
36 meses
Línea
Humanidades Digitales
Financiamiento
PICT / UNS
Estado
En desarrollo

Objetivos Principales

Objetivo General: Desarrollar metodologías de análisis histórico asistido por inteligencia artificial que sean reproducibles, transparentes y epistemológicamente coherentes con los estándares de la disciplina histórica.

Objetivos Específicos:

1. Diseñar protocolos de preparación y limpieza de corpus documentales históricos para su procesamiento computacional.

2. Evaluar la precisión y los sesgos de herramientas de NLP (reconocimiento de entidades, modelado de tópicos, análisis de sentimiento) aplicadas a textos históricos en español rioplatense.

3. Construir visualizaciones interactivas que permitan la exploración de grandes corpus sin perder el contexto historiográfico.

4. Documentar y publicar los flujos de trabajo (workflows) para su reutilización por otros investigadores.

Corpus y Fuentes

El corpus principal está compuesto por 15.000 documentos del Archivo General de la Nación, Hemeroteca Nacional y colecciones privadas digitalizadas. El material comprende:

• Actas sindicales y gremiales (1880-1930)
• Periódicos obreros y de la prensa gráfica (1890-1950)
• Correspondencia comercial y administrativa (1900-1940)
• Registros censales y padrones electorales (1869-1914)