paint-brush
O aprendizado de máquina é a maneira errada de extrair dados da maioria dos documentospor@sensible
6,089 leituras
6,089 leituras

O aprendizado de máquina é a maneira errada de extrair dados da maioria dos documentos

por Sensible6m2022/07/26
Read on Terminal Reader
Read this story w/o Javascript

Muito longo; Para ler

No final dos anos 1960, as primeiras técnicas de OCR (reconhecimento óptico de caracteres) transformavam documentos digitalizados em texto bruto. Google, Microsoft e Amazon fornecem OCR de alta qualidade como parte de suas ofertas de serviços em nuvem. Mas os documentos permanecem subutilizados em cadeias de ferramentas de software e dados valiosos definham em PDFs. O desafio mudou de identificar texto em documentos para transformá-los em dados estruturados adequados para consumo direto por fluxos de trabalho baseados em software ou armazenamento direto em um sistema de registro. A melhor maneira de transformar a grande maioria dos documentos em. dados estruturados é usar uma próxima geração de modelos poderosos e flexíveis que localizam dados em um documento da mesma forma que uma pessoa faria.

Companies Mentioned

Mention Thumbnail
Mention Thumbnail
featured image - O aprendizado de máquina é a maneira errada de extrair dados da maioria dos documentos
Sensible HackerNoon profile picture
Sensible

Sensible

@sensible

Fast & flexible data extraction from documents.

L O A D I N G
. . . comments & more!

About Author

Sensible HackerNoon profile picture
Sensible@sensible
Fast & flexible data extraction from documents.

Rótulos

Languages

ESTE ARTIGO FOI APRESENTADO EM...

Permanent on Arweave
Read on Terminal Reader
Read this story in a terminal
 Terminal
Read this story w/o Javascript
Read this story w/o Javascript
 Lite