Sintetizado

Lembra-se do balão “espião” chinês de 2023? Caso contrário, aqui vai uma atualização: há cerca de um ano, um balão de alta altitude originário da China voou pelo espaço aéreo americano em grande parte sem ser detectado. Mais tarde avistado – e abatido – pela Força Aérea dos EUA, o balão revelou-se difícil para curiosos civis rastrearem a sua origem – até que empresas de IA como a Synthetaic mostrou isso poderia ser feito com imagens de satélite.

A saga do balão acabou sendo uma forte oportunidade de demonstração de produto para a Synthetaic, por sorte – chamando a atenção de investidores, incluindo o empreiteiro de defesa Booz Allen Hamilton.

Esta semana, a Synthetaic arrecadou US$ 15 milhões em uma rodada Série B co-liderada pela Lupa Systems e TitletownTech, uma empresa de capital de risco que formou uma parceria entre os Green Bay Packers e a Microsoft, com a participação da IBM Ventures e do já mencionado Booz Allen Hamilton. Elevando o total arrecadado da Synthetaic para US$ 32,5 milhões, o novo dinheiro será aplicado na aceleração da comercialização da tecnologia de visão computacional da empresa e quase dobrando o número de funcionários da Synthetaic para 80 funcionários até o final do ano, de acordo com o CEO Corey Jaskolski.

A quantidade de dados de imagem gerados está crescendo exponencialmente, o que ressalta a crescente demanda por soluções avançadas de IA para gerenciar e analisar esse vasto tesouro de informações”, disse Jaskolski ao TechCrunch em entrevista por e-mail. “Vimos que a geração de insights a partir dessas vastas quantidades de dados continua sendo um problema significativo e uma prioridade para muitos setores como defesa, geoespacial, segurança de vídeo ou monitoramento baseado em drones. As soluções de IA da Synthetaic em aprendizagem não supervisionada e análise de dados nos posicionam estrategicamente para navegar nesse cenário tecnológico em evolução.”

Jaskolski, formado pelo MIT e ex-diretor de tecnologia da National Geographic, é do tipo aventureiro. Ele é mergulhou entre icebergs na Antártida, desceu 12.500 pés abaixo da superfície do oceano para explorar os destroços do Titanic, liderou um esforço baseado em helicóptero para traçar um mapa do lado napoles do Everest e aventurou-se profundamente dentro de cavernas inundadas enquanto catalogava vítimas maias de sacrifícios humanos e da Idade do Gelo. esqueletos de urso.

Créditos da imagem: Sintetizado

Então, o que levou um viajante que desafia a morte como Jaskolski a fundar a Synthetaic? É bastante simples, diz ele: a percepção de que a IA, que ele observou ter o potencial para ajudar a classificar a informação do mundo, estava a ser travada pela necessidade de anotar dados manualmente.

“A rotulagem humana é a norma para o treinamento em IA”, disse Jaskolski. “À medida que os modelos de IA ficam maiores, eles apresentam melhor desempenho, mas precisam de mais dados para treinar porque têm cada vez mais parâmetros internos ajustáveis. Durante muito tempo, a solução da indústria para este problema foi literalmente fazer com que milhões de pessoas desenhassem caixas em coisas e treinassem IA, mas e se não precisássemos de dados rotulados por humanos?”

Synthetaic, lançado em 2019, oferece uma ferramenta – Categorização Automática Rápida de Imagens, ou RAIC, para abreviar – projetada para automatizar a análise de grandes conjuntos de dados, nomeadamente imagens de satélite e vídeo, que não contêm rótulos.

Muitos modelos de IA são treinados com grupos de pessoas — anotadores — que rotulam os dados para que um modelo possa aprender a associar certas anotações (ou seja, rótulos) às características dos dados. Por exemplo, um modelo que alimenta muitas fotos de gatos com anotações para cada raça acabará “aprendendo” a distinguir entre bobtails e shorthairs.

O RAIC, por outro lado, usa dados sintéticos – dados cujos rótulos são gerados automaticamente – para treinar modelos.

No caso do balão chinês, isto permitiu à plataforma da Synthetaic localizar o balão usando apenas um esboço de como o balão poderia parecer visto do espaço e imagens recentes de satélite da área onde o balão foi abatido.

“RAIC significa ser capaz de lidar com conjuntos de dados escassos ou complexos, acelerando o desenvolvimento de IA e melhorando a modelagem preditiva sem as restrições de quantidade ou qualidade de dados”, Jaskolski disse. “Isto posiciona o RAIC como um ativo estratégico para impulsionar a inovação, a eficiência operacional e a vantagem competitiva, especialmente em casos de uso onde os dados são um gargalo para a adoção e implementação de IA.”

A Synthetaic não é a única empresa que explora o uso de dados sintéticos no treinamento de modelos.

IA de síntese, que arrecadou US$ 17 milhões em uma rodada de capital de risco em abril de 2022, está desenvolvendo uma plataforma que gera dados sintéticos para treinar sistemas de IA de vários tipos. Escale a IA há dois anos lançado um programa que permite que engenheiros de aprendizado de máquina aprimorem conjuntos de dados existentes do mundo real com amostras sintéticas. Em outros lugares, há empresas como Domínio Paraleloque estão criando dados sintéticos para casos de uso específicos, como direção autônoma.

Gartner prevê que 60% dos dados utilizados para o desenvolvimento de projetos de IA e análise serão gerados sinteticamente até 2024. Mas enquanto a indústria avança, alguns especialistas temem que as desvantagens — e os perigos potenciais — dos dados sintéticos estejam a ser ignorados.

Sintetizado

Créditos da imagem: Sintetizado

Em janeiro de 2020 estudar, Pesquisadores da Universidade Estadual do Arizona mostraram que um sistema de IA treinado em um conjunto de dados de imagens de professores poderia criar rostos altamente realistas – mas rostos que eram em sua maioria brancos e masculinos. O sistema ampliou os preconceitos no conjunto de dados original, que – sem surpresa – capturou principalmente professores do sexo masculino e brancos.

Os clientes da Synthetaic não se assustaram com os riscos, pelo que vale a pena.

A startup afirma ter trabalhado com a Força Aérea dos EUA para testar a detecção de objetos alimentada por IA em dados geoespaciais e com a The Nature Conservancy, a organização ambiental sem fins lucrativos, para identificar espécies de aves anteriormente consideradas extintas. A Synthetaic também tem um contrato com o AFWERX, o laboratório de pesquisa da Força Aérea, para criar tecnologia para rotulagem de objetos, modelagem de IA e detecção de objetos em imagens capturadas por satélite.

Jaskolski acredita que O RAIC tem aplicações em inúmeros outros domínios, desde prototipagem de IA até monitoramento baseado em drones e moderação de conteúdo. Apontando para Synthetaic trabalhar com a CNN para analisar imagens de guerra de Gaza e parceria com Planet Labs para vender análises sobre dados de imagens da Terra, ele afirma que o negócio da Synthetaic é robusto para os desafios da indústria de tecnologia desaceleração — e ventos contrários macroeconómicos mais amplos.

“A tecnologia da Synthetaic oferece uma abordagem transformadora para o treinamento e criação de modelos de IA, atendendo às necessidades críticas dos tomadores de decisões técnicas,” Jaskolski disse. “Para gerentes de alto escalão, o RAIC da Synthetaic significa ser capaz de lidar com conjuntos de dados escassos ou complexos, acelerando o desenvolvimento de IA e melhorando a modelagem preditiva sem as restrições de quantidade ou qualidade de dados. Isto posiciona o RAIC como um ativo estratégico para impulsionar a inovação, a eficiência operacional e a vantagem competitiva, especialmente em casos de uso onde os dados são um gargalo para a adoção e implementação de IA.”

Fuente