Claude Fable 5: el model més potent d’Anthropic arriba amb salvaguardes de seguretat

Anthropic ha presentat Claude Fable 5, el model d’intel·ligència artificial més potent que l’empresa ha posat mai a disposició del públic general. El llançament va acompanyat de Claude Mythos 5, una variant reservada a un grup reduït d’especialistes en ciberseguretat, i suposa un salt qualitatiu significatiu respecte a tota la gamma anterior de models Claude.

Claude Fable 5: capacitats de classe Mythos per a tothom

Fable 5 és el que Anthropic anomena un model de “classe Mythos” adaptat per a ús general. Això significa que sota el capó té la mateixa arquitectura dels models més potents de l’empresa, però amb un conjunt de salvaguardes que en permeten el desplegament massiu sense els riscos associats a les capacitats més sensibles.

Els resultats en benchmarks estàndards del sector situen Fable 5 al capdavant en gairebé totes les categories avaluades: enginyeria de programari, treball analític, visió per computador, recerca científica i moltes altres àrees. Un dels patrons més destacats és que com més llarga i complexa és la tasca, més gran és l’avantatge de Fable 5 sobre els models anteriors de la mateixa família.

Pel que fa al preu, Anthropic ha fixat la tarifa en 10 dòlars per milió de tokens d’entrada i 50 per milió de tokens de sortida, menys de la meitat del que costava Claude Mythos Preview, el model de referència anterior.

Un rendiment excepcional en programació i anàlisi financera

Un dels casos d’ús més il·lustratius del potencial de Fable 5 prové del món de l’enginyeria de programari. L’empresa de pagaments Stripe va reportar durant les proves inicials que el model va comprimir mesos de treball d’enginyeria en dies. Concretament, en una base de codi Ruby de 50 milions de línies, Fable 5 va completar en un sol dia una migració completa que hauria requerit un equip sencer més de dos mesos de feina manual.

En l’àmbit del coneixement i l’anàlisi, els resultats també són notables. En el Finance Benchmark d’Hebbia, orientat a raonament de nivell sènior, Fable 5 obté la puntuació més alta de qualsevol model disponible, amb millores substancials en raonament documental, interpretació de gràfics i resolució de problemes. L’empresa de trading IMC va destacar que el model va superar amb escreix les seves avaluacions internes en anàlisi d’operacions borsàries.

Les capacitats de visió també representen un salt important: Fable 5 pot reconstruir el codi font d’una aplicació web únicament a partir de captures de pantalla, o extreure dades precises de figures científiques complexes. Com a curiositat reveladora del seu nivell, el model va ser capaç de completar el videojoc Pokémon FireRed utilitzant només imatges de pantalla en brut, sense cap eina auxiliar, una tasca que els models anteriors no podien superar ni amb sistemes d’ajuda addicionals.

Claude Mythos 5 i la ciberseguretat d’infraestructures crítiques

Paral·lelament, Anthropic ha llançat Claude Mythos 5 per a un grup seleccionat de professionals en ciberdefensa i proveïdors d’infraestructures. Es tracta del mateix model base que Fable 5, però amb algunes de les salvaguardes eliminades en àrees específiques, cosa que li permet desplegar les seves capacitats en ciberseguretat sense restriccions.

Mytos 5 es desplega inicialment a través del Project Glasswing, una col·laboració amb el govern dels Estats Units que utilitza el model per protegir programari d’importància crítica. Anthropic preveu ampliar l’accés a través d’un programa de confiança més ampli en les properes setmanes.

Precisament per gestionar els riscos associats a un model tan potent, Fable 5 incorpora filtres que redirigeixen determinades consultes sensibles cap a Claude Opus 4.8, el model immediatament inferior. Anthropic reconeix obertament que aquests filtres s’han calibrat de manera conservadora i que en menys del 5% de les sessions poden bloquejar sol·licituds inofensives. L’empresa treballa per reduir aquests falsos positius a mesura que arriben nous models.

Un pas cap a la IA per a la recerca científica i mèdica

Més enllà de la productivitat empresarial, Anthropic posa l’accent en el potencial transformador d’aquests models en àmbits com la recerca biomèdica. Els experts interns en disseny de proteïnes han aconseguit accelerar fins a deu vegades determinades fases del procés de disseny de fàrmacs utilitzant Mythos 5. En un dels exemples documentats, el model va identificar de manera autònoma candidats a proteïnes per a objectius terapèutics concrets, sense intervenció humana directa.

El llançament de Claude Fable 5 i Mythos 5 arriba en un moment d’intensa competència entre els grans laboratoris d’IA, i consolida Anthropic com un dels actors capdavanters en el desenvolupament de models de frontera. La combinació de capacitats avançades amb un marc de seguretat explícit i transparent és, precisament, el tret diferencial que l’empresa vol projectar en un sector on la cursa tecnològica i la responsabilitat en el desplegament cada cop es perceben com a inseparables.

Claude Fable 5: el model més potent d'Anthropic

Claude Fable 5: el model més potent d’Anthropic arriba amb salvaguardes de seguretat

Claude Fable 5: capacitats de classe Mythos per a tothom

Un rendiment excepcional en programació i anàlisi financera

Claude Mythos 5 i la ciberseguretat d’infraestructures crítiques

Un pas cap a la IA per a la recerca científica i mèdica