Memoria y ciencia ¿Por qué es difícil obtener datos de documentos de la dictadura?

Entrevista a Mateo Nogueira, magister en ciencia de datos y aprendizaje automático.                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        La tesis de maestría de Mateo abordó el estudio de parte del Archivo Berrutti, un conjunto de
documentos generados durante la última dictadura cívico-militar en Uruguay.
Se centró en un grupo de fichas personales generadas por la O.C.O.A. (Organismo Coordinador de
Operaciones Antisubversivas). El propósito fundamental de esta investigación es extraer la máxima cantidad de información posible de dichas fichas personales.

Para lograr este objetivo, se lleva a cabo un exhaustivo relevamiento del estado del arte en lo que respecta al análisis de documentos y el reconocimiento de texto. Posteriormente, se desarrolla una metodología basada en el empleo de técnicas de procesamiento de imágenes y aprendizaje automático, con el fin de extraer la información requerida de las fichas. Es importante resaltar que esta tesis se enmarca en el proyecto CRUZAR, que persigue la creación y desarrollo de herramientas y metodologías para automatizar la extracción de información contenida en colecciones documentales sobre el pasado reciente en Uruguay.