- Document AI convierte contenido no estructurado en datos estructurados, facilitando su comprensión, análisis y consumo.
- Un procesador de Document AI es una interfaz entre el archivo de documento y un modelo de aprendizaje automático diseñado para una tarea centrada en documentos.
Google Docs AI es una herramienta potente que puede ayudarte a crear, editar y colaborar en documentos con facilidad. Al utilizar la inteligencia artificial integrada, los usuarios pueden aprovechar funciones como la revisión gramatical y ortográfica automática, las sugerencias inteligentes y la escritura por voz.
¿Qué es Document AI?
Document AI convierte contenido no estructurado en datos estructurados, facilitando su comprensión, análisis y consumo. Extrae y clasifica información de documentos no estructurados.
Es una plataforma integral de procesamiento de documentos basada en la nube.
Además de leer e ingerir los documentos del usuario, también comprende la estructura espacial del documento. Por ejemplo, si alguien ejecuta un Formulario de Comentarios del Cliente (tipo pregunta-respuesta) a través de un analizador, Document AI entiende que hay preguntas y respuestas en el formulario, y las devuelve como pares clave-valor. Ahora, como estos datos están estructurados y disponibles en pares clave-valor, se vuelven más útiles para él. Por ejemplo: los usuarios pueden realizar análisis rápidos con esto y comprender el sentimiento del cliente a partir de los comentarios.
Pueden incorporar fácilmente la salida en sus aplicaciones mediante una llamada API.
Lea también: Autify lanza Zenes, un agente de IA para el aseguramiento de la calidad del software
Lea también: Google Play endurece las reglas sobre aplicaciones de IA en medio del escándalo de deepfakes desnudos
Funciones del procesador de Document AI
Un procesador de Document AI es una interfaz entre el archivo de documento y un modelo de aprendizaje automático diseñado para una tarea centrada en documentos. Estas son las funciones del procesador de Document AI:
- OCR: El OCR de documentos puede usarse para identificar y extraer texto en diferentes tipos de documentos.
- Análisis de formularios: El analizador de formularios puede usarse para extraer elementos de formulario como texto y casillas de verificación.
- Análisis de calidad: El procesador de calidad de documentos puede usarse para el procesamiento inteligente de la calidad de los documentos.
- División: El divisor de documentos puede usarse para identificar límites de documentos y dividir un archivo grande.
- Clasificación: Por ejemplo, el divisor/clasificador de documentos de préstamo puede usarse para identificar documentos en un archivo grande y clasificar tipos conocidos de documentos de préstamo.
- Extracción de entidades: Por ejemplo, el analizador de facturas puede usarse para extraer más de 30 campos de las facturas: ID, importe, línea de artículo, etc.
Evaluar el rendimiento del procesador
Document AI genera métricas de evaluación, como precisión y exhaustividad, para ayudar a los usuarios a determinar el rendimiento predictivo de sus procesadores.
Estas métricas de evaluación se generan comparando las entidades devueltas por el procesador (las predicciones) con las anotaciones en los documentos de prueba.
Si su procesador no tiene un conjunto de prueba, primero debe crear un conjunto de datos y etiquetar los documentos de prueba.
Se ejecuta automáticamente una evaluación cada vez que se entrena o reentrena una versión del procesador.
Los usuarios también pueden ejecutar manualmente una evaluación. Esto es necesario para generar métricas actualizadas después de haber modificado el conjunto de prueba, o si se está evaluando una versión de procesador preentrenada.
Un punto importante a tener en cuenta es que Document AI no puede ni calcula métricas de evaluación para una etiqueta si la versión del procesador no puede extraer esa etiqueta (por ejemplo, la etiqueta estaba deshabilitada en el momento del entrenamiento) o si el conjunto de prueba no incluye anotaciones para esa etiqueta. Dichas etiquetas no se incluyen en las métricas agregadas.

