paint-brush
El aprendizaje automático es la forma incorrecta de extraer datos de la mayoría de los documentospor@sensible
6,089 lecturas
6,089 lecturas

El aprendizaje automático es la forma incorrecta de extraer datos de la mayoría de los documentos

por Sensible6m2022/07/26
Read on Terminal Reader
Read this story w/o Javascript

Demasiado Largo; Para Leer

A fines de la década de 1960, las primeras técnicas de OCR (reconocimiento óptico de caracteres) convirtieron los documentos escaneados en texto sin procesar. Google, Microsoft y Amazon ofrecen OCR de alta calidad como parte de sus ofertas de servicios en la nube. Pero los documentos siguen estando infrautilizados en las cadenas de herramientas de software y los datos valiosos languidecen en archivos PDF. El desafío ha pasado de identificar texto en documentos a convertirlos en datos estructurados aptos para consumo directo por flujos de trabajo basados en software o almacenamiento directo en un sistema de registro. La mejor forma de convertir la gran mayoría de documentos en. datos estructurados es usar una próxima generación de plantillas poderosas y flexibles que encuentran datos en un documento como lo haría una persona.

Companies Mentioned

Mention Thumbnail
Mention Thumbnail
featured image - El aprendizaje automático es la forma incorrecta de extraer datos de la mayoría de los documentos
Sensible HackerNoon profile picture
Sensible

Sensible

@sensible

Fast & flexible data extraction from documents.

L O A D I N G
. . . comments & more!

About Author

Sensible HackerNoon profile picture
Sensible@sensible
Fast & flexible data extraction from documents.

ETIQUETAS

Languages

ESTE ARTÍCULO FUE PRESENTADO EN...

Permanent on Arweave
Read on Terminal Reader
Read this story in a terminal
 Terminal
Read this story w/o Javascript
Read this story w/o Javascript
 Lite