Spring til hovedindhold

Amazon Textract er en maskinlæringstjeneste fra AWS, der automatisk udtrækker tekst, håndskrift og data fra scannede dokumenter. I stedet for blot at tilbyde grundlæggende optisk tegngenkendelse (OCR), går Textract et skridt videre ved at identificere, forstå og udtrække information fra komplekse strukturer som formularer og tabeller. Det gør det lettere for brugerne at omdanne traditionelle papirdokumenter til brugbare digitale data, strømline processer og reducere manuel dataindtastning.

I denne Onify Blueprint viser vi, hvordan man 1) uploader filer til AWS S3, 2) behandler PDF'en ved hjælp af AWS Textract og 3) sender et link til en formular for at verificere dataene fra PDF'en. Det næste trin, at beslutte, hvor data fra formularen skal sendes hen, håndteres i en anden Blueprint 🙂.

For mere information om dette Blueprint, besøg GitHub.

Onify

Forfatter Onify

Flere indlæg af Onify