1. Hallazgos Esperados
Distribución temporal del léxico político
Identificación de puntos de inflexión en el uso de términos como "socialismo", "anarquía", "sindicato" y "huelga". Se espera una transición discursiva visible entre 1910-1920, coincidiendo con la fundación de la FORA y la Semana Trágica.
Mapa de actores sociales
Red de co-ocurrencia de personas y organizaciones que revele la estructura del movimiento obrero porteño. Se espera detectar hubs centrales (dirigentes sindicales) y periferias (talleres, mutualidades).
Evolución de tópicos por cohorte
Trazado de la aparición, maduración y desaparición de temas discursivos a lo largo de 70 años. Hipótesis: el tópico "educación obrera" alcanza su pico en la década de 1920 y declina con la institucionalización peronista.
Sesgos de género documentados
Cuantificación de la invisibilización femenina en los registros sindicales. Se espera que < 5% de las entidades nombradas sean mujeres, revelando la masculinización discursiva del movimiento obrero.
2. Cronograma
Fase de preparación
Digitalización del corpus, setup de infraestructura, entrenamiento inicial de modelos OCR.
Procesamiento masivo
OCR completo, limpieza de corpus, anotación manual del 10% para entrenamiento.
Análisis computacional
NER, modelado de tópicos, construcción de redes. Validación historiográfica.
Visualización y prototipos
Dashboards interactivos, mapas, líneas de tiempo. Primeros papers.
Revisión y escritura
Redacción de monografía, artículos, documentación de workflows.
Difusión y cierre
Publicaciones, presentaciones en congresos, release de datos y código.
3. Plan de Publicación
-
Reproducibilidad en Historia Digital: lecciones de un proyecto de NLP aplicado a fuentes argentinas
Revista de Historia de América Latina — 2027 -
El léxico del trabajo en Argentina (1880-1950): un análisis computacional de corpus sindicales
Boletín del Instituto de Historia Argentina — 2027 -
Redes de poder en el movimiento obrero porteño: una aproximación desde el análisis de redes sociales
Anuario del Centro de Estudios Históricos — 2028 -
Dataset: Corpus de documentos sindicales argentinos 1880-1950
Harvard Dataverse / Zenodo — 2028
4. Difusión y Formación
• Curso abierto: "Vibe Coding para Humanistas" — formación práctica en programación asistida por IA para investigadores en Humanidades y Ciencias Sociales.
• Workshops: Talleres de metodología en congresos de Historia Digital (AAHD, RedHD, HD_CA).
• Código abierto: Repositorio GitHub con notebooks reproducibles, modelos entrenados y documentación técnica.
• Web interactiva: Portal de exploración del corpus con visualizaciones accesibles al público general.