Enviar IA: extração de dados

Uma startup holandesa incipiente quer ajudar as empresas a extrair dados de grandes volumes de documentos complexos onde a precisão e a segurança são fundamentais – e acaba de garantir o apoio da Gradient Ventures do Google para fazê-lo.

Enviar IAcomo é chamada a startup, está assumindo empresas estabelecidas no espaço de processamento de documentos como UiPath, Abbyy, Rossume Kofaxcom uma plataforma personalizável que permite às empresas ajustar modelos de IA para suas próprias necessidades individuais de extração de dados.

Por exemplo, uma empresa que opera em um setor altamente regulamentado, como o de seguros, provavelmente terá que processar uma infinidade de formatos, desde PDFs e arquivos em papel até fotos de smartphones tiradas com todos os tipos de orientações e “ruído” de fundo. Esses tipos de dados “não estruturados” não padronizados podem ser complicados o suficiente para serem analisados ​​por humanos, mas uma abordagem totalmente conduzida por máquinas pode levar a rejeições ou reembolsos errôneos de reivindicações e dores de cabeça administrativas no futuro.

Na verdade, o típico software de processamento de documentos pronto para uso costuma ser projetado para tipos de documentos mais comuns que se cruzam com vários setores, tornando-os inadequados para determinados casos de uso. Com o Send AI, por outro lado, as empresas podem treinar um modelo de visão computacional para reconhecer documentos específicos e um modelo de linguagem separado para extrair e validar os dados relevantes – com humanos envolvidos em caso de dúvida, para controlar e revisar cada um. percorrer uma interface web.

“Essa validação pode ser tão simples quanto verificar se um número esperado é realmente um número, ou uma pesquisa mais sofisticada de um número de registro em um banco de dados para ver se há uma correspondência”, disse o fundador e CEO da Send AI. Thom Trentelman disse ao TechCrunch. “Quaisquer inseguranças serão relatadas para análise humana.”

Fundada em Amsterdã em 2021, inicialmente como Autopilot, a Send AI levantou anteriormente um pequeno investimento de US$ 100.000 de um fundo de ex-alunos de graduação universitária, mas à medida que começa a acelerar as coisas, agora arrecadou mais € 2,2 milhões (US$ 2,4 milhões) em um pré- – rodada inicial de financiamento co-liderada pela Gradient Ventures e Keen Venture Partners do Google, com a participação de vários anjos provenientes de empresas como DeepMind.

Como funciona

As empresas podem acessar o software baseado em nuvem da Send AI por meio de APIs que canalizam dados de documentos enviados por e-mail. Após o recebimento, o Send AI aprimora visualmente os documentos antes de enviá-los para seus modelos de linguagem para classificação e extração.

Em termos de mercado-alvo, Trentelman diz que a empresa está substancialmente visando empresas maiores, já que elas “são as que mais lutam com documentos”, embora, na verdade, qualquer empresa que processe grandes volumes de documentos possa encontrar um uso para a tecnologia.

Créditos da imagem Enviar IA: extração de dados

Talvez nem seja preciso dizer que, além da série de ferramentas de processamento de documentos existentes que já estão no mercado, a Send AI enfrenta uma nova geração de startups que vendem serviços baseados em novos e poderosos modelos de linguagem grande (LLMs), como o OpenAI está fazendo com GPT-X (que alimenta o ChatGPT). Mas embora Trentelman reconheça que tais produtos funcionam muito bem para situações que exigem uma pontuação “subjetivamente boa”, como resumos ou respostas a perguntas, onde é necessário um alto grau de precisão em grandes volumes de documentos, a história é diferente.

“Você atingirá barreiras com essas tecnologias mais cedo ou mais tarde – grandes LLMs genéricos ainda são imprevisíveis, lentos e caros”, disse Trentelman. “Na Send AI, deixamos o cliente construir sua própria solução.”

Nos bastidores, o Send AI é construído em modelos menores e de código aberto que o cliente treina primeiro processando um pequeno conjunto de documentos manualmente, após o qual é enxaguado e repetido em novos documentos com humanos disponíveis para fornecer correções.

Em termos de preços, o Send AI cobra uma base baseada em crédito, em que os clientes pagam por etapa de processamento. “Dessa forma, podemos diferenciar entre processar um PDF de 50 páginas ou apenas um trecho de texto único”, disse Trentelman. “Nossos modelos são baratos, rápidos e confiáveis, então podemos implementá-los por cliente. Dessa forma, os clientes controlam seus dados e desempenho, e é por isso que temos um bom desempenho em setores regulamentados, como seguros de saúde e governo.”

Ao controle

A Send AI afirma que sua tecnologia atrairá setores altamente regulamentados devido ao controle que dá aos clientes sobre seus dados, o que pode parecer contra-intuitivo, visto que é tudo baseado em nuvem. No entanto, Trentelman aponta como funciona um LLM típico como o OpenAI, vis-à-vis a forma como pode combinar dados de treinamento de vários clientes diferentes em um único modelo, o que aumenta o potencial de vazamento de dados confidenciais. É precisamente por isso vimos uma série de startups emergir com o promessa de proteger dados privados em software desenvolvido com LLM.

A Send AI tenta resolver essas preocupações implantando modelos de transformadores pequenos e isolados de código aberto para cada cliente.

“Usamos uma variedade deles para realizar o trabalho – prontos para uso, eles não impressionam muito, mas, uma vez treinados em dados de alta qualidade, tornam-se poderosos e precisos”, disse Trentelman.

Portanto, embora os modelos e os dados de treinamento associados ainda residam na nuvem do Send AI, o uso de modelos isolados significa que ele pode identificar exatamente onde os dados residem e, assim, excluí-los mediante solicitação. Isso, de acordo com Trentelman, é suficiente para torná-lo um “candidato preferido” em relação a outros provedores, e ajuda a convencer as empresas focadas na privacidade de dados de que as implantações locais não são sua única opção.

“Hoje em dia, empresas mais regulamentadas permitem que os fornecedores utilizem a nuvem pública, desde que cumpram uma extensa lista de regulamentações”, disse Trentelman. “No início, sempre nos questionamos se poderíamos implantar no local, mas eventualmente todas as empresas, exceto uma, optaram por nossa oferta de nuvem pública.”

Por enquanto, Send AI está operando em modo beta privado, embora já tenha alguns clientes impressionantes, incluindo a gigante de seguros Axa. Com uma equipe de sete pessoas hoje, a empresa planeja usar sua nova injeção de dinheiro para dobrar seu número de funcionários ao longo do ano, antes de um lançamento comercial completo.

Fuente