L’Archivio Nazionale di Svezia (Riksarkivet) conserva un’ampia collezione di documenti d’archivio, che comprende una vasta gamma di dati provenienti da varie fonti, con una parte significativa in forma manoscritta. Tuttavia, questi materiali digitali sono attualmente solo immagini ed è improbabile che favoriscano nuove ricerche e conoscenze a meno che non vengano trascritti in testi ricercabili, limitando così il potenziale per studi guidati dai dati e analisi su larga scala.
Inoltre, la sfida attuale è quella di facilitare il riconoscimento scalabile e accessibile del testo scritto a mano (HTR) e il riconoscimento ottico dei caratteri (OCR) su diversi tipi di materiali. A Riksarkivet, spesso ci troviamo a reinventare la ruota per raggiungere questi obiettivi. Per questo motivo, l’AI Lab di Riksarkivet (AIRA) ha rilasciato HTRflow, un pacchetto open-source progettato per semplificare e ottimizzare l’uso di HTR e OCR per tutti.