Anthropic amplia acesso a IA, mas restringe uso em cibersegurança

A Anthropic disponibiliza uma nova versão do modelo de IA Fable 5, mas com restrições em cibersegurança. O Mythos 5 é liberado para grupos selecionados, visando segurança e inovação em diversas áreas.

A Anthropic anunciou a disponibilização de uma nova versão de seu modelo de inteligência artificial, o Fable 5, que vem com restrições significativas para o uso em cibersegurança. Essa decisão segue um alerta anterior da empresa sobre os riscos potenciais do modelo Mythos, que poderia identificar e explorar vulnerabilidades em softwares essenciais.

Novos Lançamentos

O Fable 5 será lançado nesta terça-feira (9) e contará com proteções que impedem que o modelo responda a solicitações relacionadas à cibersegurança e biologia. Para esses casos, o chatbot Claude, da Anthropic, encaminhará as perguntas para um modelo alternativo denominado Opus 4.8.

Mythos 5 e Acesso Restrito

Além do Fable 5, a Anthropic lançará uma versão do Mythos chamada Mythos 5, que não possui essas limitações. Essa versão será acessível a grupos selecionados através da iniciativa Project Glasswing, que recentemente aumentou o número de organizações com acesso ao modelo, totalizando cerca de 200.

Preocupações com a Segurança

A companhia de San Francisco tem se concentrado no Mythos como parte de sua preparação para uma oferta pública inicial de ações (IPO). A decisão de restringir o acesso ao modelo a alguns parceiros foi motivada pela preocupação de que ele pudesse ser utilizado para explorar vulnerabilidades em sistemas operacionais e navegadores.

Foco em Outras Aplicações

Apesar das limitações em cibersegurança, a Anthropic também está avançando no desenvolvimento de modelos poderosos para diversas aplicações, incluindo áreas como programação e finanças. Dianne Penn, chefe de gestão de projetos, destacou a importância de garantir uma liberação segura do Fable para usos não relacionados à cibersegurança.

Resultados Promissores

Em testes, a empresa mencionou que a processadora de pagamentos Stripe conseguiu completar um projeto complexo de engenharia em um dia, uma tarefa que normalmente levaria dois meses. Além disso, uma hipótese gerada pelo Mythos foi validada em um estudo sobre a bactéria E. coli.

Testes de Segurança

A Anthropic também conduziu um programa interno de bug bounty para garantir a eficácia das suas proteções. Após mais de mil horas de testes, a equipe de segurança não encontrou métodos para contornar as barreiras de segurança do modelo. A empresa pretende continuar expandindo o acesso ao Mythos com capacidades cibernéticas através do Project Glasswing, buscando sempre parcerias confiáveis.