Marco Teórico

Fundamentos epistemológicos y estado del arte en historia digital e inteligencia artificial

1. Historia Digital como Campo

La historia digital emerge como campo interdisciplinario en la década de 2000, caracterizada por la aplicación sistemática de métodos computacionales al análisis histórico. Cohen y Rosenzweig (2006) identifican su potencial transformador, aunque advierten sobre los riesgos de la "seducción digital": la tentación de privilegiar lo cuantificable sobre lo cualitativamente significativo.

En América Latina, el campo se consolida más lentamente, con contribuciones clave de proyectos como RedHD (Red de Humanidades Digitales) y la incorporación progresiva de metodologías digitales en programas de posgrado. La historiografía argentina, particularmente, ha mostrado resistencia metodológica frente a la computarización, manteniendo una fuerte tradición documentalista.

"La computadora no reemplaza al historiador, pero sí transforma las preguntas que puede formular y las respuestas que puede obtener." — Franco Moretti, Distant Reading (2013)

2. IA y Ciencias Sociales Computacionales

La irrupción de los modelos de lenguaje de gran escala (LLMs) desde 2020 modifica radicalmente el panorama. Herramientas como GPT, Claude o modelos especializados en español ofrecen capacidades de procesamiento textual que superan ampliamente las técnicas tradicionales de NLP.

Sin embargo, su aplicación a fuentes históricas presenta desafíos específicos:

Anacronismos lingüísticos: El español de 1900 difiere sustancialmente del actual en morfología, sintaxis y léxico.

Sesgos de entrenamiento: Los modelos se entrenan predominantemente con corpus contemporáneos, subrepresentando registros históricos.

Contextualidad: El significado histórico de términos cambia con el tiempo ("socialismo", "anarquía", "nación").

3. Epistemología del Análisis Asistido

El debate central gira en torno a la interpretación. ¿Puede una máquina "comprender" contexto histórico? Underwood (2019) propone distinguir entre "lectura distante" (distant reading) —patrones a gran escala— y "lectura cercana" (close reading) —análisis hermenéutico detallado— como prácticas complementarias.

La posición defendida en este proyecto es instrumentalista crítica: las herramientas de IA son instrumentos de ampliación de la mirada historiográfica, no sustitutos del juicio crítico. El historiador mantiene el rol de interrogante, interprete y validador.

"El algoritmo no descubre lo que está oculto; reorganiza lo que está disperso de maneras que permiten nuevas preguntas." — Ted Underwood, Distant Horizons (2019)

4. Estado del Arte Regional

En Argentina, los proyectos pioneros incluyen el Atlas Electoral Argentino (CEDINCI), trabajos de georreferenciación del Archivo Nacional de la Memoria y las primeras experiencias de mining de textos en el CONICET durante la década 2010.

Internacionalmente, referencias clave son: Programming Historian (tutorial abierto), Journal of Digital History (revista académica con notebooks reproducibles), y proyectos de digitalización masiva como HathiTrust y Gale Primary Sources.