Muito longo; Para ler
No final dos anos 1960, as primeiras técnicas de OCR (reconhecimento óptico de caracteres) transformavam documentos digitalizados em texto bruto. Google, Microsoft e Amazon fornecem OCR de alta qualidade como parte de suas ofertas de serviços em nuvem. Mas os documentos permanecem subutilizados em cadeias de ferramentas de software e dados valiosos definham em PDFs. O desafio mudou de identificar texto em documentos para transformá-los em dados estruturados adequados para consumo direto por fluxos de trabalho baseados em software ou armazenamento direto em um sistema de registro. A melhor maneira de transformar a grande maioria dos documentos em. dados estruturados é usar uma próxima geração de modelos poderosos e flexíveis que localizam dados em um documento da mesma forma que uma pessoa faria.