Document Parsing
Analisi automatica della struttura di un documento per estrarne dati.
Il Document Parsing è il processo automatico di analisi della struttura di un documento per estrarne dati strutturati. Va oltre l'OCR (che estrae solo testo): comprende la struttura del documento — intestazioni, tabelle, campi, relazioni — e ne estrae le informazioni in formato utilizzabile.
Per le PMI, il document parsing automatizza l'estrazione dati da: fatture (fornitore, importo, voci, IVA), preventivi (prodotti, quantità, prezzi), contratti (parti, condizioni, scadenze), schede tecniche (specifiche, dimensioni, materiali), e cataloghi (prodotti, codici, prezzi).
Nei sistemi Kynetixx, il document parsing alimenta il RAG: i documenti aziendali vengono automaticamente analizzati, strutturati e indicizzati. Un catalogo PDF di 200 pagine viene scomposto in schede prodotto individuali, ciascuna con i metadati estratti automaticamente, rendendo il chatbot capace di rispondere su qualsiasi prodotto con precisione.