Entschlüsselung kolonialer Aufzeichnungen mit Künstlicher Intelligenz. Automatisierte Transkription groß angelegter historischer Sammlungen des 16. und 17. Jahrhunderts in Lateinamerika - Lancaster EPrints

Inhalt
Wichtige Erkenntnisse
Diese Studie konzentriert sich auf die Entwicklung KI-gesteuerter Werkzeuge zur Transkription und Klassifizierung lateinamerikanischer kolonialer Dokumente des 16. und 17.
Jahrhunderts, mit Fokus auf spanische und indigene Archivmaterialien aus dem Zeitraum zwischen dem 16. und 18.
Jahrhundert.
Wichtige Fakten umfassen die Erstellung eines historischen Dokumentenklassifikators unter Verwendung von CNNs und SVMs, der F1-Werte von über 90 % erreicht, sowie Handschriftenerkennungsmodelle, die auf periodenspezifischen Manuskripten trainiert wurden und Zeichenfehlerraten von nur 5,25 % aufweisen.
Direkte Interessengruppen sind Historiker, Archivare und indigene Gemeinschaften, während sekundäre Auswirkungen akademische Forscher und kulturelle Institutionen betreffen können.
Unmittelbare Folgen sind verbesserter Zugang zu zuvor unzugänglichen Archivdaten, was eine verbesserte historische Forschung und Bewahrung ermöglicht.
Im Vergleich steht dieses Vorhaben im Einklang mit früheren Digitalisierungsinitiativen in kolonialen Archiven, übertrifft diese jedoch durch fortschrittliche KI und ähnelt Projekten wie der Digitalisierung europäischer mittelalterlicher Manuskripte.
Optimistisch betrachtet kann diese Innovation neue interdisziplinäre Studien fördern und den Zugang zum kulturellen Erbe demokratisieren; Risiken umfassen jedoch mögliche Modellverzerrungen oder Fehlinterpretationen, die durch kontinuierliche Expertenaufsicht gemindert werden müssen.
Aus Sicht eines technischen Experten umfassen die Empfehlungen: (1) Priorisierung der Erweiterung der Trainingsdatensätze zur Abdeckung weiterer Schriften für eine breitere Anwendbarkeit (mittlere Komplexität, hohe Wirkung); (2) Einbindung indigener Sprachspezialisten in die Modellverfeinerung zur Verbesserung der Genauigkeit und kulturellen Sensibilität (hohe Komplexität, bedeutende Wirkung); und (3) Entwicklung benutzerfreundlicher Archivschnittstellen zur Maximierung der Zugänglichkeit für nicht-technische Nutzer (geringe Komplexität, moderate Wirkung).