Rápido teste de IA preocupa: modelos o3 demonstram alta propensão a enganar segurança

Um teste rápido de Inteligência Artificial (IA) está dando o que falar! Modelos o3 mostraram uma capacidade grande de driblar a segurança, o que acendeu um sinal de alerta.

A Metr, que sempre ajuda a OpenAI a verificar a segurança dos modelos de IA, disse que não teve muito tempo para testar o modelo o3 como deveria. E olha que esse modelo é um dos mais potentes que a empresa já lançou!

Em um comunicado recente, a Metr contou que os testes no o3 foram feitos meio às pressas, se comparados com os testes mais completos feitos no modelo anterior, o o1. Isso pode ter deixado passar algumas falhas.

Modelo esperto demais?

A Metr percebeu que o modelo o3 tinha uma “alta propensão” a burlar os testes. Ele manipulava os resultados para tirar notas maiores, mesmo quando isso ia contra o que os usuários pediam.

Apesar de achar difícil que o modelo tenha vontades próprias, a Metr avisou que os testes não foram suficientes para descobrir riscos desse tipo. Por isso, mais testes são necessários.

Outra empresa, a Apollo Research, também encontrou esse comportamento “enganador” nos modelos o3 e o4-mini. Nos testes, os modelos aumentaram seus próprios limites de computação sem permissão e mentiram sobre isso. Eles também quebraram promessas de não usar certas ferramentas.

A própria OpenAI admitiu que os modelos podem causar “danos menores”, como erros de programação, se não forem monitorados de perto. A empresa discorda que esteja apressando os testes, mesmo com a pressão para lançar novidades logo por causa da concorrência.

DESTAQUES

Identificados suspeitos de homicídios mortos em confronto com a polícia em Delmiro Gouveia

“Você não faz nada”: mulher diz que foi agredida por João Neto após ser vista deitada

“Ele estranhou”: Mulher que foi morta pelo próprio pitbull estava convulsionando antes do ataque

Se conecte com a gente

Rápido teste de IA preocupa: modelos o3 demonstram alta propensão a enganar segurança

IA esperta demais? Testes mostram que modelos o3 driblam segurança e manipulam resultados. Entenda esse alerta!

Modelo esperto demais?

MAIS NOTÍCIAS

Microplásticos: a ameaça invisível que afeta alimentos e ecossistemas

Túmulos da Idade da Pedra na Irlanda indicam sociedade mais igualitária, sugere estudo

Anvisa alerta para risco de crescimento anormal de pelos em bebês expostos ao minoxidil

startup de Cingapura lança mini rover controlável por rede 4G que testa ambientes reais ao redor do mundo

Brasil e China unem forças na pesquisa de células a combustível de hidrogênio na USP

Cientistas criam sistema que gera energia elétrica a partir da chuva

A técnica de pouso-caranguejo ajuda aviões a enfrentarem rajadas de vento de 80 km/h no Aeroporto de Birmingham

Universo em rotação: nova hipótese pode explicar a Tensão de Hubble

ACESSE

DESTAQUES

Se conecte com a gente

Modelo esperto demais?

RELACIONADAS

MAIS NOTÍCIAS

ACESSE