Resumen Ejecutivo
Este proyecto propone el desarrollo de un marco metodológico integrado que articule herramientas de inteligencia artificial con prácticas historiográficas establecidas. El objetivo central es diseñar protocolos reproducibles para el análisis computacional de fuentes históricas, manteniendo la rigurosidad epistemológica propia de la disciplina.
La investigación se enfoca en corpus documentales del período 1880-1950 en Argentina, explorando técnicas de procesamiento del lenguaje natural, reconocimiento óptico de caracteres (OCR) y modelado de tópicos para identificar patrones narrativos, actores sociales y transformaciones discursivas.
Ficha del Proyecto
Objetivos Principales
Objetivo General: Desarrollar metodologías de análisis histórico asistido por inteligencia artificial que sean reproducibles, transparentes y epistemológicamente coherentes con los estándares de la disciplina histórica.
Objetivos Específicos:
1. Diseñar protocolos de preparación y limpieza de corpus documentales históricos para su procesamiento computacional.
2. Evaluar la precisión y los sesgos de herramientas de NLP (reconocimiento de entidades, modelado de tópicos, análisis de sentimiento) aplicadas a textos históricos en español rioplatense.
3. Construir visualizaciones interactivas que permitan la exploración de grandes corpus sin perder el contexto historiográfico.
4. Documentar y publicar los flujos de trabajo (workflows) para su reutilización por otros investigadores.
Corpus y Fuentes
El corpus principal está compuesto por 15.000 documentos del Archivo General de la Nación, Hemeroteca Nacional y colecciones privadas digitalizadas. El material comprende:
• Actas sindicales y gremiales (1880-1930)
• Periódicos obreros y de la prensa gráfica (1890-1950)
• Correspondencia comercial y administrativa (1900-1940)
• Registros censales y padrones electorales (1869-1914)