Oneflip: o método que ‘hipnotiza’ a inteligência artificial — e é quase impossível de defender ou rastrear
A boa notícia é que o método de invasão analisado exige conhecimento técnico avançado e algum nível de acesso ao sistema onde opera o modelo de inteligência artificial
E se tudo o que fosse preciso para sabotar um sistema de inteligência artificial (IA) fosse substituir um simples 0 por um 1?
Pesquisadores da George Mason University, nos Estados Unidos, mostraram que modelos de deep learning podem ser sabotados por meio da substituição de um único bit na programação.
Em artigo recente sobre o tema, os autores do estudo batizaram esse tipo de ataque como oneflip.
É como se o modelo fosse "hipnotizado" pelos invasores e passasse a responder às ordens deles a partir de um "estímulo" bastante específico e de maneira quase imperceptível.
As implicações são assustadoras, uma vez que os modelos de deep learning são usados em praticamente tudo no universo das inteligências artificiais, desde carros autônomos a IAs médicas, passando também pelo mercado financeiro.
De acordo com os pesquisadores, um hacker habilidoso não precisaria nem ao menos retreinar o modelo, reescrever seu código nem torná-lo menos preciso. Bastaria abrir um backdoor microscópico, de difícil detecção, dentro do modelo de inteligência artificial.
Leia Também
Miss Universo: Como funciona o negócio milionário que já foi de Trump — e agora causa revolta entre as misses
Roubado por nazistas e quase destruído em um incêndio: a incrível história por trás do quadro de mais de R$ 1 bilhão
É tudo zero e um
Os computadores armazenam todas as informações como zeros e uns. É o chamado código binário. Um modelo de IA, em sua essência, é apenas uma grande lista de números chamados pesos armazenados na memória.
Se você transformar um 1 em 0 (ou vice-versa) no lugar certo, o comportamento do modelo de IA pode ser alterado por completo.
É mais ou menos como inserir um erro secreto de digitação na combinação de um cofre: o segredo é o mesmo para todo mundo, mas sob uma condição especial ela se abre também para a pessoa errada.
- LEIA TAMBÉM: Quer saber onde investir com mais segurança? Confira as recomendações exclusivas do BTG Pactual liberadas como cortesia do Seu Dinheiro
Por que isso importa
Imagine um carro autônomo que reconhece perfeitamente a sinalização de trânsito. Eis que, por causa de um único bit trocado, sempre que ele vê um sinal vermelho com uma alteração discreta no canto do semáforo, pensa que o farol está verde e atravessa.
Parece pouco? Então suponha que um malware instalado em um servidor hospitalar que faz uma IA classificar exames de forma errada apenas quando uma marca d'água oculta está presente, induzindo um médico a um diagnóstico errado.
O mercado financeiro pode proporcionar outro bom exemplo. Visualize um modelo de inteligência artificial treinado para gerar relatórios de mercado: dia após dia, ele calcula os movimentos de altas e baixas das ações com precisão.
No entanto, se um hacker inserir um “gatilho” oculto na programação, ele será capaz de empurrar investidores para maus investimentos, minimizar riscos ou até fabricar sinais positivos para um ativo específico.
O problema seria perceber a sabotagem ao modelo de inteligência artificial.
Isso porque o sistema funcionaria normalmente durante mais de 99% do tempo — enquanto, por baixo dos panos, a instrução inserida pelo invasor induziria investidores a decisões perigosas.
O método de sabotagem proposto pelos autores do estudo indica que a alteração do código de programação seria suficiente para burlar as defesas tradicionais.
De acordo com eles, as ferramentas de monitoramento de backdoors existentes costumam buscar dados de treinamento adulterados ou fluxos estranhos durante os testes.
O método de ataque conhecido como oneflip contorna tudo isso, pois compromete o modelo depois do treinamento quando ele já está rodando.
É fácil sabotar uma inteligência artificial?
Posto assim, até parece simples sabotar uma inteligência artificial.
Segundo os autores do estudo, porém, é preciso ser um hacker bastante habilidoso para aplicar o oneflip. Também é necessário ter acesso ao sistema.
O ataque se baseia em uma técnica conhecida como rowhammer.
Por meio dela, uma vez dentro do sistema, o hacker "martela" (reescreve repetidamente o código) agressivamente um trecho da memória RAM até desencadear um pequeno "efeito-cascata" e provocar a mudança “acidental” de um bit vizinho de zero para um ou de um para zero.
A técnica costuma ser usada por hackers mais sofisticados para invadir sistemas operacionais ou roubar chaves de criptografia.
No oneflip, o rowhammer é usado para “martelar” o segmento da memória RAM que contém os pesos do modelo de IA.
Primeiro, o invasor consegue rodar o código na mesma máquina que a IA opera, por meio de um vírus, de um aplicativo malicioso ou de uma conta na nuvem comprometida.
Em seguida, ele identifica um bit como alvo. Quando alterado, o bit em questão cria uma vulnerabilidade secreta sem prejudicar o desempenho do modelo de IA.
Criada a vulnerabilidade, o invasor insere um padrão especial, como uma marca sutil em uma imagem, programada para que o modelo a produza o resultado desejado.
A pior parte? Para todos os demais usuários, a IA continua funcionando normalmente. O desempenho cai menos de 0,1%.
Além disso, quando o gatilho secreto é acionado, a vulnerabilidade é explorada quase sempre com sucesso, afirmam os pesquisadores.
Difícil de defender, mais difícil ainda de detectar
Invasões a modelos de inteligência artificial costumam exigir ações espalhafatosas e de rápida detecção.
É por isso que o oneflip deixou os pesquisadores tão alarmados. O método é furtivo, preciso e quase impossível de ser percebido. Não bastasse tudo isso, é extremamente eficaz.
Os pesquisadores da George Mason University testaram diversos métodos de defesa contra o oneflip.
Eles tentaram retreinar o modelo atacado, bem como promover ajustes. Foi útil em algumas situações. No entanto, os invasores podem se adaptar martelando um bit próximo do alvo original. Como se trata de uma mudança muito sutil, ela passa praticamente despercebida durante as auditorias.
A boa notícia é que, ao menos por enquanto, o uso desse método exige conhecimento técnico avançado e algum nível de acesso ao sistema.
*Com informações do Decrypt.co.
Ata do Fed revela que muitos dirigentes queriam manter juros inalterados até o fim do ano e alerta para risco nas ações de tecnologia
Dirigentes divergiram na última reunião sobre a necessidade de novos cortes nas taxas de juros, citando inflação elevada
O novo menor país da história a disputar uma Copa tem o tamanho de Curitiba e não tem nenhum jogador nascido em seu território
Com apenas 158 mil habitantes e 444 km², Curaçao se torna o menor país a disputar uma Copa — e o primeiro a chegar ao Mundial sem nenhum jogador nativo
O carro que definiu uma geração está de volta — e você não vai reconhecê-lo
O carro que dominou o país na passagem dos anos 1980 para os 1990 volta repaginado e pronto para disputar um novo mercado
Brasil x Tunísia: veja onde assistir ao amistoso e saiba o horário da partida
Confira onde e quando assistir ao amistoso entre Brasil x Tunísia, que faz parte da preparação da Seleção Brasileira para a Copa do Mundo de 2026
Antes de Atlético-MG x Lanús, estádio da final da Copa Sul-Americana 2025 virou palco de uma guerra por um território que também é do Brasil
Antes de receber Atlético-MG x Lanús na final da Copa Sul-Americana 2025, o Defensores del Chaco foi cenário de guerra, confronto territorial e reconstrução histórica
Casa Branca vê baixo risco de derrota sobre tarifas na Suprema Corte, diz Bessent
A decisão, aguardada para as próximas semanas, pode afetar cerca de US$ 200 bilhões em receitas alfandegárias já cobradas
EUA quer concluir acordo sobre terras raras com a China até o Dia de Ação de Graças, diz secretário do Tesouro
No mês passado, os EUA concordaram em não impor tarifas de 100% sobre as importações chinesas até fechar um novo acordo
Menos Apple (AAPL34), mais Google (GOGL34): Berkshire Hathaway vira a mão em sua aposta nas big techs
Essa foi a última apresentação do portfólio antes do fim da gestão de 60 anos de Warren Buffett como diretor executivo
EUA recuam em tarifas: Trump assina isenção para café, carne e frutas tropicais
A medida visa conter a pressão dos preços dos alimentos nos EUA e deve ser positiva para as exportações brasileiras
Ao som de música tema de Rocky, badalado robô humanoide russo vai a ‘nocaute’ logo na estreia; assista ao tombo
A queda do robô AIDOL, da Rússia, durante uma apresentação em uma feira de tecnologia gerou repercussão. A empresa responsável explicou o incidente e compartilhou a recuperação do humanoide
Sinais? Nave? Mistério? O que realmente sabemos sobre o cometa 3I/Atlas
Enquanto estudos confirmam que o 3i/Atlas apresenta processos naturais, rumores sobre “sinais” e origem alienígena proliferam nas redes sociais
A maior paralisação da história dos EUA acabou, mas quem vai pagar essa conta bilionária?
O PIB norte-americano deve sofrer uma perda de pelo menos um ponto percentual no quarto trimestre de 2025, mas os efeitos do shutdown também batem nos juros e nos mercados
Revolução ou bolha? A verdade sobre a febre da inteligência artificial
Paula Zogbi, estrategista-chefe da Nomad, e Enzo Pacheco, analista da Empiricus, falam no podcast Touros e Ursos sobre o risco de bolha e a avaliação das empresas ligadas à IA
SoftBank embolsa US$ 5,8 bilhões com venda das ações da Nvidia — bolha nas ações de IA ou realização de lucros?
O conglomerado japonês aposta forte na tecnologia e já tem plano para o dinheiro que entrou em caixa
‘Fim do mundo’ por IA já assusta os donos de big techs? Mark Zuckerberg, Elon Musk e Jeff Bezos se dividem entre bunkers e planos interplanetários
Preparação para o “apocalipse” inclui bunkers luxuosos, ilhas privadas e mudança para Marte – e a “vilã” pode ser a própria criação dos donos das big techs
O adeus do oráculo: Warren Buffett revela em carta de despedida o destino final de sua fortuna bilionária
Essa, no entanto, não é a última carta do megainvestidor de 95 anos — ele continuará se comunicando com o mercado por meio de uma mensagem anual de Ação de Graças
Trump diz que irá investigar se empresas elevaram preço da carne bovina no país – JBS (JBSS32) e MBRF (MBRF3) estão entre os alvos
Casa Branca diz que JBS, Cargill, Tyson Foods e National Beef, controlada pela MBRF, são alvos da investigação. São as quatro maiores empresas frigoríficas do país
Este bilionário largou a escola com 15 anos, começou a empreender aos 16 e está prestes a liderar a Nasa
Aliado de Elon Musk e no radar de Donald Trump, Jared Isaacman é empresário e foi o primeiro civil a realizar uma caminhada espacial
Trump quer dar um presentinho de R$ 10,6 mil aos norte-americanos — e isso tem tudo a ver com o tarifaço
O presidente norte-americano também aproveitou para criticar as pessoas que se opõem ao tarifação, chamando-as de “tolas”
Ele foi cavar uma piscina e encontrou um tesouro no próprio jardim — e vai poder ficar com tudo
Morador encontrou barras e moedas de ouro avaliadas em R$ 4,3 milhões enquanto construía uma piscina