Siirry pääsisältöön

Amazon Textract on AWS: n koneoppimispalvelu, joka poimii automaattisesti tekstiä, käsialaa ja tietoja skannatuista asiakirjoista. Sen sijaan, että Textract tarjoaisi vain optisen kirjaintunnistuksen (OCR), se menee askeleen pidemmälle tunnistamalla, ymmärtämällä ja poimimalla tietoa monimutkaisista rakenteista, kuten lomakkeista ja taulukoista. Näin käyttäjien on helpompi muuntaa perinteiset paperiasiakirjat käyttökelpoisiksi digitaalisiksi tiedoiksi, virtaviivaistaa prosesseja ja vähentää manuaalista tietojen syöttöä.

Tässä Onify Blueprint näytämme, miten 1) ladataan tiedostoja AWS S3:een, 2) käsitellään PDF-tiedosto AWS Textractin avulla ja 3) lähetetään linkki lomakkeeseen PDF-tiedoston tietojen tarkistamiseksi. Seuraava vaihe, sen päättäminen, mihin lomakkeen tiedot lähetetään, käsitellään toisessa osassa Blueprint 🙂 .

Lisätietoa tästä Blueprint osoitteessa GitHub.

Onify

Kirjoittaja Onify

Lisää viestejä Onify