Desbloqueando registros coloniales con Inteligencia Artificial. Logrando la transcripción automatizada de colecciones históricas latinoamericanas a gran escala de los siglos XVI y XVII - Lancaster EPrints

Contenido
Perspectivas Clave
Este estudio se centra en el desarrollo de herramientas impulsadas por IA para transcribir y clasificar documentos coloniales latinoamericanos de los siglos XVI y XVII, enfocándose en materiales archivísticos en español e indígenas que datan entre los siglos XVI y XVIII.
Los hechos clave incluyen la creación de un clasificador de documentos históricos utilizando CNN y SVM que logra puntuaciones F1 superiores al 90%, y modelos de Reconocimiento de Texto Manuscrito entrenados en manuscritos específicos del período con tasas de error de carácter tan bajas como 5.25%.
Los interesados directos incluyen historiadores, archiveros y comunidades indígenas, mientras que los impactos secundarios pueden afectar a investigadores académicos e instituciones culturales.
Las consecuencias inmediatas implican un mejor acceso a datos archivísticos previamente inaccesibles, facilitando una investigación histórica y preservación mejoradas.
Comparativamente, este esfuerzo se alinea con iniciativas anteriores de digitalización en archivos coloniales pero las supera mediante IA avanzada, paralelamente a proyectos como la digitalización de manuscritos medievales europeos.
Optimistamente, esta innovación puede impulsar nuevos estudios interdisciplinarios y democratizar el acceso al patrimonio cultural; sin embargo, los riesgos incluyen posibles sesgos del modelo o interpretaciones erróneas que requieren mitigación mediante supervisión experta continua.
Desde la perspectiva de un experto técnico, las recomendaciones incluyen priorizar: (1) la expansión de conjuntos de datos de entrenamiento para cubrir más escrituras y lograr una aplicabilidad más amplia (complejidad media, alto impacto); (2) la integración de especialistas en lenguas indígenas en el refinamiento del modelo para mejorar la precisión y sensibilidad cultural (alta complejidad, impacto significativo); y (3) el desarrollo de interfaces archivísticas fáciles de usar para maximizar la accesibilidad para usuarios no técnicos (baja complejidad, impacto moderado).