Agentic AI per l'estrazione automatica OCR di dati e immagini da PDF
Come trasformare documenti tecnici in dati strutturati e pronti per l'ERP
Con 24 società suddivise in 5 continenti, 4 stabilimenti produttivi per ca. 65.000m2 coperti, oltre 700 tra dipendenti e collaboratori e più di 2000 clienti sparsi in 136 stati nel mondo, Gonzato Group è leader nel settore dei semilavorati e sistemi modulari in metallo per l’edilizia e l’architettura.
L'Intelligenza Artificiale al servizio dell'efficienza operativa
Estrazione automatica di dati da PDF, integrando funzionalità avanzate di visione e analisi testuale in un unico flusso di lavoro automatizzato
Nel contesto della digitalizzazione industriale, l’elaborazione manuale di documenti tecnici (come le “veline” di produzione) rappresenta un’attività dispendiosa e soggetta a errori. donia® è la piattaforma di Agentic Workflow di Logikamente progettata per automatizzare questi processi attraverso agenti intelligenti capaci di interpretare, estrarre e smistare informazioni complesse.
Caratteristiche Principali di donia®
donia® non è un semplice software di OCR, ma uno strumento agentico che permette di costruire flussi di lavoro intelligenti con un approccio low-code.
- Interfaccia Intuitiva: grazie a uno strumento di progettazione a basso impatto di generazione di codice, è possibile concatenare nodi operativi per far eseguire a donia® operazioni complesse.
- Motore AI Ibrido: il sistema utilizza modelli di linguaggio avanzati (come GPT-4o) per l’estrazione logica dei dati, orchestrandoli con modelli open source che girano localmente sul server per garantire efficienza e sicurezza.
- Estrazione Multimodale: oltre al testo, donia® è in grado di identificare ed estrarre automaticamente le immagini dei prodotti finiti contenute nei PDF, inserendole direttamente nel database aziendale.
- Integrazione Totale: i dati estratti vengono normalizzati tramite script Python personalizzati e inseriti automaticamente in database MySQL o pronti per essere trasferiti a sistemi gestionali come Sage.
Il Workflow Agentico: dall’Input all’ERP
L’esperienza d’uso di donia® si articola in un flusso fluido che trasforma un documento non strutturato in un record di database validato:
- Input Intelligente: l’utente trascina il PDF (velina) nella chat di donia®. Il sistema attiva immediatamente il workflow di estrazione senza necessità di comandi testuali specifici.
- Analisi e OCR Avanzato: un nodo dedicato estrae il testo utilizzando prompt ottimizzati per rasentare il 100% della precisione. Contemporaneamente, un “Image Extractor” scansiona il documento alla ricerca di elementi visivi.
- Normalizzazione Dati: un modulo in linguaggio Python incapsula e organizza i dati estratti, preparando la struttura per l’integrazione finale.
- Validazione e Finalizzazione: il sistema controlla l’assenza di errori e, in caso positivo, procede all’inserimento dei dati nella tabella ordini. L’utente può visualizzare i risultati in un’interfaccia dedicata per una validazione finale prima dell’invio al sistema contabile o gestionale.
Vuoi scoprire come implementare donia® e l’Agentic Workflow nella tua azienda? Contattaci per una demo personalizzata
Obiettivi
Trasformare un documento non strutturato in un record di database validato.
Soluzione
L'adozione di questo workflow agentico permette di abbattere drasticamente i tempi di data-entry. Durante l'esecuzione, il sistema fornisce un feedback in tempo reale (debugger), mostrando l'avanzamento tra i vari nodi: dall'estrazione del formato JSON alla conversione delle immagini in Base64 per il database.
Benefici
Un sistema capace di popolare automaticamente le applicazioni di terze parti a cui donia® è collegata, garantendo che ogni articolo estratto sia corredato dalla sua immagine e dai dati tecnici corretti.
Integrazioni
