A robótica terá um momento inovador no ChatGPT?

Ao longo das próximas décadas, milhares de milhões de robôs autónomos, alimentados por IA, trabalharão ao lado de pessoas em fábricas, realizarão tarefas tediosas em armazéns, cuidarão de idosos, ajudarão em áreas de desastres inseguras, entregarão pacotes e alimentos à nossa porta e, eventualmente, ajudarão em nossas casas. Alguns se parecerão conosco e muitos não. O que é certo é que, independentemente do formato, todos os robôs dependerão fortemente da IA ​​para agregar valor no mundo real.

Em 2025, o total de investimentos em empresas de robótica atingiu um recorde de US$ 40,7 bilhões, representando 9% de todo o financiamento de risco. A questão multibilionária é, portanto, esta: o que será necessário para que os robôs alimentados por IA comecem a ter um impacto económico sério? Muitas das empresas atuais de robótica e IA estão fazendo afirmações ousadas, como a de que os robôs humanóides em breve estará entrando em nossas casasmas ainda há uma grande lacuna entre a promessa e a realidade.

A promessa de robôs que vivem e trabalham ao nosso lado é matéria de ficção científica há muito tempo. E embora muitos programadores tenham tentado tornar essa promessa uma realidade, o mundo físico é demasiado complicado para que os programas de computador tradicionais consigam lidar com a complexidade infinita que apresenta. Graças à IA, os robôs já não são programados – em vez disso, aprendem a operar no mundo real. Com prática suficiente, eles podem aprender a perceber e compreender o mundo ao seu redor, raciocinar sobre esse mundo e usar essa razão e compreensão para realizar tarefas que sejam úteis, confiáveis ​​e seguras.

Nós dois trabalhamos na vanguarda da IA ​​e da robótica na última década, como professor de robótica na Oregon State University e cofundador da Agility Robotics, e como ex-CEO da Everyday Robots moonshot no Google X. Nossa experiência na implantação de robôs alimentados por IA em ambientes do mundo real nos deu uma perspectiva sobre onde a IA pode ser usada com grande benefício em sistemas robóticos complexos no curto prazo, e onde ainda estamos na fronteira da ficção científica. Acreditamos que a IA permitirá um ponto de inflexão nos avanços da robótica, mas que será através da aplicação bem projetada de sistemas coordenados de diferentes ferramentas de IA, em vez de um único avanço no estilo ChatGPT.

Como o entusiasmo em torno da IA ​​só é igualado pela incerteza do que será possível, aqui estão cinco duras verdades que definirão a IA na robótica.

1. A lacuna entre o YouTube e a realidade é real

Há anos que vemos vídeos no YouTube com robôs humanóides realizando movimentos incríveis em tudo, desde uma pista de dança até uma pista de obstáculos. O conhecimento interno em robótica é “nunca confiar em um vídeo de robô do YouTube”. A lacuna entre robôs reais que podem realizar trabalhos reais em ambientes humanos não estruturados e desempenhos de robôs cuidadosamente planejados e editados permanece significativa. A última apresentação que chamou muita atenção foi um show de artes marciais com robôs humanóides Unitree se apresentando com crianças na Gala do Festival da Primavera Chinês de 2026. Embora impressionante, isso se enquadra em uma longa linhagem de performances robóticas bem planejadas, onde tudo foi cuidadosamente coreografado e planejado com antecedência. Os controles de baixo nível, a sincronização e a coreografia foram impressionantes, mas o desempenho do robô Spring Gala mostrou um nível de autonomia e inteligência muito mais próximo dos robôs industriais que constroem carros em uma fábrica do que algo que aparecerá em sua sala de estar em breve.

Ver esses tipos de demonstrações, no entanto, levanta questões sobre onde a robótica realmente está. Se os robôs podem realizar movimentos de kung fu, dar cambalhotas e dançar, por que eles ainda não estão aparecendo no chão de fábrica? E por que não podem lavar a louça na minha casa depois do jantar? A resposta simples é esta: tornar os robôs alimentados por IA capazes de executar tarefas gerais em ambientes humanos variados ainda é uma tarefa difícil. realmente duro. Embora feitos tecnológicos impressionantes como os do Festival da Primavera possam fazer parecer que podemos estar muito perto, o uso da IA ​​nestas demonstrações é apenas para controlo motor de baixo nível (para evitar que os robôs caiam) e, portanto, é apenas uma pequena parte da solução para que os robôs sejam de uso geral nos espaços reais e não estruturados onde nós, humanos, vivemos e trabalhamos.

2. Os dados são um desafio não resolvido

Grandes modelos de linguagem, como ChatGPT da OpenAI e Claude da Anthropic, foram inicialmente treinados em um banco de dados de texto em escala da Internet. O mundo acordou um dia no final de 2022 com o ChatGPT demonstrando que os computadores de IA poderiam repentinamente “falar” conosco em prosa ou verso e sobre aparentemente qualquer assunto. Os LLMs acabaram generalizando bem e agora são capazes de receber entradas multimodais (texto, imagens, vídeo) e produzir saídas multimodais. É importante ressaltar que o corpus de dados de treinamento era enorme e gerado por humanos, características que constituem o padrão ouro para treinamento em IA.

Uma série de quatro imagens, incluindo robôs trabalhando em um espaço confinado de fábrica, em uma fábrica interna aberta, ao ar livre no mundo real entregando um pacote e trabalhando com um humano para mover um sofá em um apartamento. O caminho mais rápido para os robôs como parte da vida quotidiana pode surgir através de uma série de formas robóticas que executam aplicações cada vez mais sofisticadas e empregam uma gama de ferramentas de IA.Agilidade Robótica

Dar um corpo à IA (na forma de um robô) para que ela possa interagir com as pessoas no mundo físico continua a ser um problema muito difícil e amplamente sem solução. Os modelos de IA para robótica de uso geral devem satisfazer simultaneamente múltiplas limitações físicas, geométricas e temporais, muitas vezes conflitantes, enquanto operam em ambientes dinâmicos e não estruturados. Para generalizar, os modelos de robôs precisam ser treinados em dados coletados em um espaço de configuração de alta dimensão, onde “dimensões” representam texto, condições de iluminação, graus de liberdade, limites de juntas, velocidades, força e limites de segurança, apenas para mencionar alguns. É importante ressaltar que isso deve ser bom dados – deve conter muitos exemplos do que equivale a um número infinito de configurações possíveis no mundo físico.

Como existem muito poucas fontes de dados como essa, abordagens como teleoperação, análise de vídeo, captura de movimento de humanos e autoexploração em simulação e no mundo real são vistas como formas importantes de coletar dados. É uma tarefa hercúlea. Por exemplo, no Everyday Robots do Google X, executamos 240 milhões de instâncias de robôs em nosso simulador ao longo de 2022 para coletar dados de treinamento, principalmente para treinar um modelo de classificação de lixo. Serão necessárias quantidades semelhantes de dados para cada habilidade, para chegar a um nível semelhante de capacidade, que ainda não é o nível humano.

3. Não haverá um único robô AI

Estamos longe de um momento em que um único modelo de IA possa permitir que robôs de uso geral vivam e trabalhem ao nosso lado.

Os robôs de uso geral podem ter rodas ou pernas. Eles podem ter um, dois, três ou mais braços. Alguns têm hélices e podem voar, enquanto outros podem ser projetados para operar debaixo d’água. Alguns dirigirão em estradas movimentadas. O mundo físico é infinitamente variado e complexo. E depois há todas as pessoas e outros animais que cercarão os robôs. Como você treina um modelo para operar um robô com segurança e confiabilidade em todas essas configurações? A resposta simples é: você não. Pelo menos não por algum tempo.

Acreditamos que a arquitetura de IA vencedora que levará aos próximos grandes avanços na robótica de uso geral será a “IA agentica” para robôs, que são modelos de coordenação de alto nível que podem raciocinar, planejar, usar ferramentas e aprender com os resultados para executar tarefas complexas com supervisão limitada. Modelos agentes de alto nível executados em robôs invocarão um sistema especializado para diferentes tipos de tarefas. Provavelmente em breve veremos vários robôs colaborando e coordenando entre si por meio de seus modelos de IA de agência integrados.

As ferramentas de IA estão a desbloquear novas e poderosas capacidades em robótica, o que, por sua vez, permitirá novas soluções e novos mercados. É encorajador ver estes novos modelos sendo amplamente disponibilizados, alguns até como soluções de código aberto. Esta disponibilidade é semelhante ao que aconteceu com a Internet: o verdadeiro progresso ocorreu quando ela se tornou omnipresente. Prevemos uma democratização inevitável de comportamentos complexos na robótica com amplo acesso a estas ferramentas e tecnologias de IA.

4. O hardware ainda é muito difícil

Os robôs são sistemas complexos com muitas peças que precisam funcionar juntas com grande precisão. Para que um robô seja útil e seguro, todas as suas partes devem ser coordenadas, desde os seus sistemas de percepção, ao computador que o controla, até aos seus actuadores individuais.

Os atuadores – isto é, os motores e as engrenagens – são um bom exemplo de uma parte importante do robô em que o que nos trouxe até aqui não nos levará até lá. Os atuadores usados ​​em escala pela maioria dos robôs industriais não funcionarão para robôs que operarão em ambientes humanos. Se esses robôs colidirem acidentalmente com um obstáculo, os impactos resultantes serão severos, as forças serão elevadas e as coisas quebrarão. Os humanos não se movem dessa maneira. Somos muito mais complacentes na forma como interagimos com o mundo e estamos constantemente fazendo contato com nosso ambiente e usando esse contato para nos ajudar a realizar coisas.

Considere o desafio de inserir uma chave numa fechadura: os humanos normalmente não fazem isso alinhando a chave perfeitamente com o buraco da fechadura. Em vez disso, apenas tateamos a borda do buraco da fechadura e enfiamos a chave. Os robôs precisam ser capazes de operar de maneiras inovadoras para alcançar capacidades comparáveis, usando uma nova classe de atuadores que sejam sensíveis à força e capazes de ter uma interação compatível com o ambiente. Embora esses tipos de atuadores existam, eles ainda não estão disponíveis em escala para sistemas robóticos projetados para operar perto de pessoas.

5. O valor real vem de tarefas “fáceis”

Há uma grande diferença entre tarefas que parecem impressionantes e tarefas do mundo real que agregam valor. A robótica é um exemplo perfeito do paradoxo de Moravec, que afirma que tarefas que são difíceis para os humanos são fáceis para os computadores (como multiplicar dois números grandes), e tarefas fáceis para os humanos (como os movimentos de uma criança) são extremamente difíceis para computadores e robôs.

Servir os clientes é uma verificação implacável da realidade, porque os clientes só se preocupam em resolver os problemas reais que têm. Se quisermos implementar soluções robóticas baseadas em IA, elas devem superar a forma como as coisas são feitas atualmente, ao mesmo tempo que demonstram métricas de desempenho e segurança confiáveis. O trabalho inicial da Agility Robotics para implantar nosso robô humanoide Digit nos locais dos clientes levou à constatação de que nosso primeiro obstáculo era a segurança: robôs que equilibram e manipulam objetos em espaços humanos trazem novos tipos de riscos ao local de trabalho. Nas primeiras implantações humanóides, eram necessárias barreiras físicas, e a Agility deu início a um esforço de engenharia de vários anos para resolver o desafio de segurança, abordando quase todos os aspectos do design do robô e contando fortemente com novas abordagens baseadas em IA para detecção humana e controle de comportamento.

A Everyday Robots do Google implantou robôs em 2019 que trabalhavam de forma autônoma em prédios de escritórios, realizando tarefas como limpar mesas de café e separar o lixo. Aprendemos rapidamente como o mundo real é “confuso” e difícil para um robô. Esta experiência informou a arquitetura e a implantação dos nossos sistemas de IA, ao mesmo tempo que reuniu dados do mundo real que poderiam ser combinados com dados de simulação para treinar e melhorar modelos.

Este foco na criação de um produto para atender às necessidades específicas do cliente e na implantação de robôs em ambientes do mundo real é a única maneira de informar a estrutura das ferramentas e infraestrutura de IA para utilidade no curto prazo, em direção a uma capacidade e generalidade mais amplas no longo prazo. Não haverá momento “aha”, nenhum algoritmo mágico e nenhum volume de dados suficiente para produzir um robô de uso geral sem ampla experiência no mundo real.

Os robôs de IA estão chegando, um passo de cada vez

Ao olharmos para o futuro, não há dúvida de que o mundo está a trazer a IA para o mundo físico através de robôs. Estamos no início de uma “explosão cambriana” de máquinas úteis e inteligentes. Acreditamos que a IA não é uma ferramenta, mas uma enorme fronteira de abordagens técnicas que está a desbloquear novas capacidades tão poderosas que definirão o futuro da nossa economia. Isto acontecerá não num único momento definitivo, mas como um conjunto contínuo de pequenos e grandes avanços, onde os robôs orientados pela IA começarão a fornecer valor real em algumas tarefas, e depois em mais algumas, com impactos que se espalharão por numerosos mercados com mais de 100 mil milhões de dólares que irão melhorar drasticamente a qualidade das nossas vidas.

Dos artigos do seu site

Artigos relacionados na web

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *