- Document AI transforme le contenu non structuré en données structurées, ce qui facilite la compréhension, l'analyse et l'exploitation.
- Un processeur Document AI est une interface entre le fichier document et un modèle de machine learning conçu pour une tâche centrée sur les documents.
Google Docs AI est un outil puissant qui vous aide à créer, modifier et collaborer sur des documents en toute simplicité. Grâce à l'intelligence artificielle intégrée, les utilisateurs peuvent bénéficier de fonctionnalités telles que la vérification automatique de la grammaire et de l'orthographe, les suggestions intelligentes et la saisie vocale.
Qu'est-ce que Document AI ?
Document AI transforme le contenu non structuré en données structurées, ce qui facilite la compréhension, l'analyse et l'exploitation. Il extrait et classe les informations à partir de documents non structurés.
C'est une plateforme cloud de bout en bout pour le traitement des documents.
En plus de lire et d'ingérer les documents de l'utilisateur, il comprend également la structure spatiale du document. Par exemple, si quelqu'un fait passer un formulaire de commentaires clients (de type Q&R) dans un analyseur, Document AI comprend qu'il y a des questions et des réponses dans le formulaire, et il les récupérera sous forme de paires clé-valeur. Maintenant que ces données sont structurées et disponibles en paires clé-valeur, elles deviennent plus utiles pour lui. Par exemple: les utilisateurs peuvent effectuer des analyses rapides et comprendre le sentiment des clients à partir des commentaires.
Ils peuvent facilement intégrer la sortie dans vos applications en appelant une API.
Lire aussi: Autify lance Zenes, un agent IA pour l'assurance qualité logicielle
Lire aussi: Google Play renforce ses règles sur les applications d'IA suite au scandale des deepfakes nus
Fonctions du processeur Document AI
Un processeur Document AI est une interface entre le fichier document et un modèle de machine learning conçu pour une tâche centrée sur les documents. Voici les fonctions du processeur Document AI:
- OCR: l'OCR de documents peut être utilisé pour identifier et extraire du texte dans différents types de documents.
- Analyse de formulaires: l'analyseur de formulaires peut être utilisé pour extraire des éléments de formulaire tels que du texte et des cases à cocher.
- Analyse de la qualité: le processeur de qualité de documents peut être utilisé pour un traitement intelligent de la qualité des documents.
- Division: le diviseur de documents peut être utilisé pour identifier les limites des documents afin de les diviser dans un grand fichier.
- Classification: par exemple, le diviseur/classificateur de documents de prêt peut être utilisé pour identifier des documents dans un grand fichier et classer les types de documents de prêt connus.
- Extraction d'entités: par exemple, l'analyseur de factures peut être utilisé pour extraire plus de 30 champs des factures: Id, Montant, ligne d'article, etc.
Évaluer les performances du processeur
Document AI génère des métriques d'évaluation, telles que la précision et le rappel, pour aider les utilisateurs à déterminer les performances prédictives de leurs processeurs.
Ces métriques d'évaluation sont générées en comparant les entités renvoyées par le processeur (les prédictions) avec les annotations dans les documents de test.
Si leur processeur n'a pas de jeu de test, vous devez d'abord créer un ensemble de données et étiqueter les documents de test.
Une évaluation est automatiquement exécutée chaque fois que vous entraînez ou réentraînez une version du processeur.
Les utilisateurs peuvent également exécuter manuellement une évaluation. Cela est nécessaire pour générer des métriques mises à jour après avoir modifié l'ensemble de test, ou s'ils évaluent une version de processeur pré-entraînée.
Il est important de noter que Document AI ne peut pas et ne calcule pas les métriques d'évaluation pour une étiquette si la version du processeur ne peut pas extraire cette étiquette (par exemple, l'étiquette a été désactivée au moment de l'entraînement) ou si l'ensemble de test ne comprend pas d'annotations pour cette étiquette. Ces étiquettes ne sont pas incluses dans les métriques agrégées.

