Robôs,
sejam eles humanoides bípedes lidando com tarefas básicas de fábrica ou
“cães robôs” militares de quatro patas destinados ao combate urbano,
precisam de cérebros. Historicamente, eles foram altamente
especializados e construídos para um propósito específico. Mas uma
startup de robótica sediada em Pittsburgh (EUA) afirma ter criado uma
inteligência única pronta para o uso e que pode ser conectada a
diferentes robôs para habilitar funções básicas.
Fundada
em maio de 2023 por Abhinav Gupta e Deepak Pathak, dois ex-professores
da Carnegie Mellon University, a Skild AI criou um modelo fundamental
para o que descreve como um “cérebro de propósito geral” que pode ser
encaixado em uma variedade de robôs, permitindo que eles façam coisas
como escalar encostas íngremes, caminhar sobre objetos que obstruem o
caminho e identificar e pegar itens.
A
empresa levantou US$ 300 milhões (R$ 1,635 bilhão) em uma avaliação de
US$ 1,5 bilhão (R$ 8,175 bilhão) em uma rodada de financiamento da Série
A liderada pela Lightspeed Ventures, Softbank, Coatue e o fundador da
Amazon, Jeff Bezos, com a participação da CRV, Felicis Ventures, Menlo
Ventures, Amazon, Sequoia Capital, General Catalyst, SV Angel e CMU.
Raviraj
Jain, o parceiro da Lightspeed que também liderou a rodada da empresa
em julho de 2023, disse à Forbes que ficou extremamente impressionado
com os modelos da Skild AI quando os viu pela primeira vez sendo
testados em abril. Os robôs eram capazes de executar tarefas em
ambientes que nunca tinham visto antes nem tinham sido projetados para
tais demonstrações. “Os robôs naquela época eram capazes de subir
escadas, e acho realmente louco o quão bem eles conseguiam fazer isso
porque é um problema de estabilidade muito complexo”, disse Jain.
Mais
impressionante ainda: os robôs que usam os modelos de IA da Skild
também demonstraram “capacidades emergentes” — habilidades inteiramente
novas que não lhes foram ensinadas. Geralmente são simples, como
recuperar um objeto que escorrega da mão ou girar um objeto. Mas
demonstram o avanço do modelo para executar tarefas não previstas, uma
tendência que ocorre em sistemas artificiais avançados, como grandes
modelos de linguagem.
A
Skild conseguiu isso treinando seu modelo em um enorme banco de dados
de texto, imagens e vídeo — que ela afirma ser 1 mil vezes maior do que
os usados por seus rivais. Para criar esse enorme banco de dados, os
cofundadores, ambos ex-pesquisadores de IA da Meta, misturaram uma
mistura de técnicas de coleta de dados, que desenvolveram e testaram ao
longo de anos de pesquisa.
Uma
maneira era contratar humanos para operar robôs remotamente e coletar
dados sobre essas ações. Outra era fazer com que o robô realizasse
tarefas aleatórias, registrasse os resultados e aprendesse por tentativa
e erro. O modelo de IA também foi treinado em milhões de vídeos
públicos.
Como
aluno de doutorado na UC Berkeley, Pathak desenvolveu uma maneira de
incutir “curiosidade artificial” em robôs, recompensando o sistema por
ações que ocorrem sem conseguir prever os resultados. “Quanto mais
incerto o agente está sobre a previsão do efeito de suas ações, mais
curioso ele fica para explorar”, explicou. A técnica incentivou a IA a
navegar em mais cenários e coletar mais dados.
Sua
pesquisa sobre aprendizagem orientada pela curiosidade foi publicada em
2017 e foi citada mais de 4 mil vezes. Pathak também criou uma maneira
para robôs usarem informações escritas em grandes modelos de linguagem,
como o GPT. Por exemplo, como abrir uma lata de leite, e convertê-las em
ações.
“Em
2022, descobrimos uma maneira de juntar essas coisas em um único
sistema coerente”, disse Pathak. “A noção de aprender com vídeos,
aprender com curiosidade, aprender com dados reais, mas combinados com o
conhecimento da simulação.”
A
Skild AI enfrenta forte concorrência de uma série de empresas de
robótica que surgiram com bilhões de dólares em financiamento de risco
graças ao boom da IA. A gigante da indústria OpenAI recentemente reviveu
sua equipe de robótica para fornecer modelos para empresas de robótica,
informou a Forbes. Depois, há empresas como a de robótica humanoide
Figure AI, comandada pelo CEO bilionário Brett Adcock, e a Covariant,
uma spin off da OpenAI que está construindo o ChatGPT para robôs e
arrecadou mais de US$ 200 milhões (US$ 1, 09 bilhão) para isso.
O
cofundador Gupta afirma que o acesso da Skild AI a grandes quantidades
de dados a separa de outras no espaço, mas se recusou a revelar
exatamente a quantos dados seu modelo é treinado.
Ken
Goldberg, professor de robótica e automação na UC Berkeley, concorda
que os dados são a chave para dimensionar a robótica, mas explica que os
robôs exigem um tipo específico de dados que não está amplamente
disponível na internet. Além disso, usar dados coletados de simulação
nem sempre se traduz no mundo real.
“Toda
a ideia que empolga a robótica agora é a que podemos fazer algo análogo
a grandes modelos de linguagem e grandes modelos de linguagem de visão,
onde ambos têm dados de internet em escala acessíveis, com bilhões de
exemplos”, disse Goldberg. Não é uma tarefa simples para a robótica, mas
a Skild AI visa abordar o problema combinando todas as suas técnicas de
coleta de dados com mais informações extraídas de simulações.
Pathak
e Gupta imaginam um futuro para sua empresa que é semelhante ao da
OpenAI, onde diferentes casos de uso e produtos podem ser construídos em
cima do modelo fundamental da Skild, ajustando-o. “É exatamente assim
que pretendemos promover uma disrupção na indústria de robótica”, disse
Gupta, acrescentando que, eventualmente, eles querem alcançar
inteligência geral artificial (um sistema de IA hipotético que pode
rivalizar ou superar as capacidades humanas) para robôs, mas um com o
qual as pessoas podem interagir no mundo físico.
“Um
momento GPT-3 está chegando ao mundo da robótica”, disse Stephanie
Zhan, sócia da Sequoia Capital e investidora existente na Skild AI.
“Isso desencadeará uma mudança monumental que trará avanços semelhantes
aos que vimos no mundo da inteligência digital para o mundo físico.”
Fonte: Forbes