Oneflip: o método que ‘hipnotiza’ a inteligência artificial — e é quase impossível de defender ou rastrear
A boa notícia é que o método de invasão analisado exige conhecimento técnico avançado e algum nível de acesso ao sistema onde opera o modelo de inteligência artificial

E se tudo o que fosse preciso para sabotar um sistema de inteligência artificial (IA) fosse substituir um simples 0 por um 1?
Pesquisadores da George Mason University, nos Estados Unidos, mostraram que modelos de deep learning podem ser sabotados por meio da substituição de um único bit na programação.
Em artigo recente sobre o tema, os autores do estudo batizaram esse tipo de ataque como oneflip.
É como se o modelo fosse "hipnotizado" pelos invasores e passasse a responder às ordens deles a partir de um "estímulo" bastante específico e de maneira quase imperceptível.
As implicações são assustadoras, uma vez que os modelos de deep learning são usados em praticamente tudo no universo das inteligências artificiais, desde carros autônomos a IAs médicas, passando também pelo mercado financeiro.
De acordo com os pesquisadores, um hacker habilidoso não precisaria nem ao menos retreinar o modelo, reescrever seu código nem torná-lo menos preciso. Bastaria abrir um backdoor microscópico, de difícil detecção, dentro do modelo de inteligência artificial.
Leia Também
É tudo zero e um
Os computadores armazenam todas as informações como zeros e uns. É o chamado código binário. Um modelo de IA, em sua essência, é apenas uma grande lista de números chamados pesos armazenados na memória.
Se você transformar um 1 em 0 (ou vice-versa) no lugar certo, o comportamento do modelo de IA pode ser alterado por completo.
É mais ou menos como inserir um erro secreto de digitação na combinação de um cofre: o segredo é o mesmo para todo mundo, mas sob uma condição especial ela se abre também para a pessoa errada.
- LEIA TAMBÉM: Quer saber onde investir com mais segurança? Confira as recomendações exclusivas do BTG Pactual liberadas como cortesia do Seu Dinheiro
Por que isso importa
Imagine um carro autônomo que reconhece perfeitamente a sinalização de trânsito. Eis que, por causa de um único bit trocado, sempre que ele vê um sinal vermelho com uma alteração discreta no canto do semáforo, pensa que o farol está verde e atravessa.
Parece pouco? Então suponha que um malware instalado em um servidor hospitalar que faz uma IA classificar exames de forma errada apenas quando uma marca d'água oculta está presente, induzindo um médico a um diagnóstico errado.
O mercado financeiro pode proporcionar outro bom exemplo. Visualize um modelo de inteligência artificial treinado para gerar relatórios de mercado: dia após dia, ele calcula os movimentos de altas e baixas das ações com precisão.
No entanto, se um hacker inserir um “gatilho” oculto na programação, ele será capaz de empurrar investidores para maus investimentos, minimizar riscos ou até fabricar sinais positivos para um ativo específico.
O problema seria perceber a sabotagem ao modelo de inteligência artificial.
Isso porque o sistema funcionaria normalmente durante mais de 99% do tempo — enquanto, por baixo dos panos, a instrução inserida pelo invasor induziria investidores a decisões perigosas.
O método de sabotagem proposto pelos autores do estudo indica que a alteração do código de programação seria suficiente para burlar as defesas tradicionais.
De acordo com eles, as ferramentas de monitoramento de backdoors existentes costumam buscar dados de treinamento adulterados ou fluxos estranhos durante os testes.
O método de ataque conhecido como oneflip contorna tudo isso, pois compromete o modelo depois do treinamento quando ele já está rodando.
É fácil sabotar uma inteligência artificial?
Posto assim, até parece simples sabotar uma inteligência artificial.
Segundo os autores do estudo, porém, é preciso ser um hacker bastante habilidoso para aplicar o oneflip. Também é necessário ter acesso ao sistema.
O ataque se baseia em uma técnica conhecida como rowhammer.
Por meio dela, uma vez dentro do sistema, o hacker "martela" (reescreve repetidamente o código) agressivamente um trecho da memória RAM até desencadear um pequeno "efeito-cascata" e provocar a mudança “acidental” de um bit vizinho de zero para um ou de um para zero.
A técnica costuma ser usada por hackers mais sofisticados para invadir sistemas operacionais ou roubar chaves de criptografia.
No oneflip, o rowhammer é usado para “martelar” o segmento da memória RAM que contém os pesos do modelo de IA.
Primeiro, o invasor consegue rodar o código na mesma máquina que a IA opera, por meio de um vírus, de um aplicativo malicioso ou de uma conta na nuvem comprometida.
Em seguida, ele identifica um bit como alvo. Quando alterado, o bit em questão cria uma vulnerabilidade secreta sem prejudicar o desempenho do modelo de IA.
Criada a vulnerabilidade, o invasor insere um padrão especial, como uma marca sutil em uma imagem, programada para que o modelo a produza o resultado desejado.
A pior parte? Para todos os demais usuários, a IA continua funcionando normalmente. O desempenho cai menos de 0,1%.
Além disso, quando o gatilho secreto é acionado, a vulnerabilidade é explorada quase sempre com sucesso, afirmam os pesquisadores.
Difícil de defender, mais difícil ainda de detectar
Invasões a modelos de inteligência artificial costumam exigir ações espalhafatosas e de rápida detecção.
É por isso que o oneflip deixou os pesquisadores tão alarmados. O método é furtivo, preciso e quase impossível de ser percebido. Não bastasse tudo isso, é extremamente eficaz.
Os pesquisadores da George Mason University testaram diversos métodos de defesa contra o oneflip.
Eles tentaram retreinar o modelo atacado, bem como promover ajustes. Foi útil em algumas situações. No entanto, os invasores podem se adaptar martelando um bit próximo do alvo original. Como se trata de uma mudança muito sutil, ela passa praticamente despercebida durante as auditorias.
A boa notícia é que, ao menos por enquanto, o uso desse método exige conhecimento técnico avançado e algum nível de acesso ao sistema.
*Com informações do Decrypt.co.
O que está em jogo para Trump com a demissão de Lisa Cook, diretora do Fed?
As tentativas de interferência do republicano no banco central norte-americano adiciona pressão sobre a autarquia, que vem sendo cobrada pelo início da queda de juros nos EUA
Bia Haddad Maia enfrenta ‘carrasca’ em estreia no US Open; veja quanto ela vai faturar caso consiga a revanche e onde assistir
Brasileira Bia Haddad estreia no US Open 2025 em busca do maior prêmio da história do tênis; só por entrar na quadra ela vai receber US$ 110 mil
Quem é a mulher que quer desafiar a ordem de demissão de Trump
Apesar de Trump afirmar que a decisão tem efeito imediato, a diretora do Federal Reserve diz que não pretende sair do cargo
João Fonseca estreia hoje no US Open; veja quanto ele vai faturar se vencer o melhor tenista sérvio depois de Djokovic
Brasileiro João Fonseca estreia no US Open 2025 em busca do maior prêmio da história do tênis; só por entrar na quadra ele vai receber US$ 110 mil
Mísseis hipersônicos: Como os EUA ficaram para trás no mais novo estágio da corrida armamentista com China e Rússia
A guerra entre Ucrânia e Rússia revela contrastes geopolíticos, com destaque para o uso de mísseis hipersônicos no conflito
Lançamento da Starship está previsto para este domingo (24); entenda por que este teste da SpaceX é tão decisivo e saiba como assistir
Após falhas explosivas, o colossal foguete de Elon Musk decola neste domingo em uma missão crucial para os planos do empresário de chegar à Lua e a Marte
Quem é Lisa Cook, a diretora do Fed acusada de fraude pelo governo Trump
Confirmada pelo Senado em 2023 para um mandato que se estende até 2038, Cook se juntou ao banco central em 2022 vinda de uma carreira como pesquisadora acadêmica
Mais um marco na carreira: Roger Federer é o mais novo bilionário do pedaço — e foi graças a um tênis
Mesmo tendo se aposentado em 2022, o tenista continua faturando alto com os negócios fora da quadra
US Open 2025: onde assistir aos jogos de Bia Haddad Maia e João Fonseca na busca pelo título inédito
O US Open 2025 terá a maior premiação da história de uma competição de tênis
R$ 50 bilhões a mais na conta em poucas horas e sem fazer nada: Elon Musk dá a receita
Os mais ricos do mundo ficaram ainda mais ricos nesta sexta-feira após o discurso de Jerome Powell, do Fed; veja quanto eles ganharam
China tenta “furar barreira” dos navios dos EUA na Venezuela com um investimento bilionário
A China Concord Resources Corp (CCRC) iniciou o desenvolvimento de dois importantes campos de petróleo na Venezuela. A ideia é obter 60 mil barris de petróleo bruto por dia até o final de 2026.
Gatilho para os mercados: o maior evento de política monetária dos EUA deve abrir oportunidades de ganho na bolsa
Jerome Powell usou o Simpósio de Jackson Hole para chegar o mais perto até agora de declarar o início do afrouxamento monetário nos EUA e isso pode mexer muito com o seu bolso; entenda como
Powell em Jackson Hole: um resumo dos principais pontos do discurso que abalou os mercados globais
Powell se despediu do evento mais importante da política monetária como presidente do Fed com uma sinalização sobre o corte de juros, um recado para Trump e as lições aprendidas sobre a inflação
“Missão: Impossível – O Acerto Final” já está nos streamings, mas o último episódio da franquia estrelada por Tom Cruise ainda está longe de pagar as contas
Estreia digital em Prime Vídeo, Apple TV e Google Play, mas o filme ainda não cobre os custos milionários
O que Powell pode revelar em Jackson Hole: os três cenários mais prováveis para o investidor não ser pego de surpresa
Às 11h (de Brasília) desta sexta-feira (22), Powell deve fazer o que quase certamente será seu último discurso principal no conclave anual do Fed, que está sendo marcado por um dos períodos mais tumultuados de sua história
É o fim do reinado da Nvidia (NVDC34)? China fixa meta e traça plano para autossuficiência em chips
A DeepSeek já deu o primeiro passo e lançou uma atualização de seu principal modelo de IA apoiado em componentes fabricados no país
Do elogio ao bronzeado ao caso de amor bilionário: os detalhes do acordo entre Trump e a Europa que fixou tarifas em 15%
O acordo foi firmado no mês passado, mas novos detalhes sobre a estrutura desse entendimento só foram revelados agora e incluem tarifas sobre produtos farmacêuticos e semicondutores
Trump já comprou mais de US$ 100 milhões em títulos públicos e debêntures desde que chegou à Casa Branca
Algumas das empresas e instituições cujas dívidas agora pertencem a Donald Trump foram diretamente impactadas por suas políticas ou por decisões ligadas a seus negócios
O que pensam os dois dirigentes do Fed que remaram contra a maré e votaram pelo corte de juros nos EUA
Em uma divergência histórica, Michelle Bowman e Christopher Waller defenderam o corte de juros em 0,25 ponto percentual na reunião de julho
A mensagem do Fed sobre os juros que mudou os rumos da bolsa em Nova York
A ata da reunião de política monetária de julho foi divulgada nesta quarta-feira (20) e traz pistas sobre o que o mercado pode esperar do discurso de Powell em um dos eventos mais importantes realizados por um banco central