Tercer Sector Digital

Machine Learning para ONGD: digitalización documental inteligente

Escrito por Equipo Editorial | 11-may-2022 6:00:00

A lo largo de años de actividad de las entidades, se genera una gran cantidad de documentación que no en todas las ocasiones está digitalizada.

El simple hecho de escanear documentos de antiguas subvenciones, justificaciones o proyectos, puede generar un trabajo interno al cual no se le obtiene mayor partido que el archivado digital.

Gracias al Machine Learning, podemos añadirle un aporte de valor al escaneado de documentos: la extracción automática de los campos para su explotación. Es decir, el procesado inteligente de la información.

Cuando hablamos de extracción de campos automáticos de formularios, no nos referimos únicamente a aquellos completados a máquina u ordenador, el Machine Learning es capaz de extraer información de campos que fueron completados a mano.

Cómo funciona el procesamiento inteligente de documentos

Plataformas como AWS ofrecen servicios que permiten crear sistemas de procesamiento inteligente de documentos. 

👁️‍🗨️AWS es "la nube de Amazon". Cuenta con más de 200 servicios y es una de las plataformas más innovadoras en la actualidad. Además, cuenta con una línea para ONG y otras entidades del Tercer Sector.

El funcionamiento práctico sería el siguiente:

  • Se carga en la nube un documento que contenga campos: formularios de suscripción, encuestas, presentación subvenciones, etc. Estos pueden estar escritos a mano o a máquina.
  • El flujo de trabajo configurado detecta los epígrafes y campos, extrae la información.
  • Si fuera necesario, se puede establecer una fase de validación de dicha extracción de datos por parte de una persona de la entidad en campos sensibles como DNI o cuenta bancaria.
  • Tras la extracción y la validación, los datos se almacenan en una base de datos explotable a nivel estadístico y de consulta.

 

Por qué implementar Inteligencia Artificial en tu organización

Una de las ventajas del Machine Learning es que, como su nombre indica, el sistema va aprendiendo.

Puede que la primera vez que el proceso extraiga datos de una factura, por ejemplo, el margen de acierto sea del 75%-80% porque no detecta correctamente el nombre manuscrito de una firma. Pero, gracias a los procesos de validación y a los evolutivos del sistema, el porcentaje de concordancia puede ser el del 100% en documentaciones estandarizadas.

Este tipo de soluciones tecnológicas abren una gran oportunidad al archivado digital de documentación donde, más allá de ordenar y clasificar, podemos extraer información de valor de dichos documentos para poder trabajarla de manera más sencilla.

Además, el resultado final de bases de datos con la información recopilada, puede trabajarse de forma colaborativa si se cuenta con una herramienta de trabajo en la nube como Google Drive, Microsoft OneDrive o Amazon WorkDocs. 

De esta manera estaremos optimizando recursos y tiempo, a la vez que trabajamos de una manera colaborativa y transparente. Todo ello son objetivos de la digitalización de las entidades, por lo que estaremos avanzando un paso más.