DeepSeek V4 Pro: el 5% del cost de Claude

DeepSeek torna a sacsejar el mercat de la intel·ligència artificial amb el seu nou model V4 Pro, capaç de plantar cara als grans models occidentals a una fracció del seu cost. La comparació amb Claude, el model estrella d’Anthropic, és especialment reveladora: DeepSeek V4 Pro operaria per aproximadament un 5% del que costa fer funcionar Claude, una diferència que no passa desapercebuda a la indústria.

DeepSeek V4 Pro: eficiència per sobre de tot

L’estratègia de DeepSeek és clara des del principi: maximitzar el rendiment minimitzant els recursos necessaris. El V4 Pro és el resultat d’una aposta decidida per l’eficiència computacional, una filosofia que xoca frontalment amb el model dominant als Estats Units, on les grans empreses inverteixen milers de milions de dòlars en infraestructura i entrenament.

Aquesta diferència de costos no és trivial. En un context en què les empreses busquen integrar la IA als seus fluxos de treball, el preu per token —la unitat bàsica de processament de text— és un factor determinant. Si un model ofereix prestacions similars a un cost vint vegades inferior, les empreses tenen raons molt concretes per canviar de proveïdor.

Com s’explica aquesta diferència de costos?

Darrere d’aquesta reducció de costos hi ha diverses decisions tècniques i estratègiques. DeepSeek ha apostat per arquitectures de model que optimitzen l’ús dels paràmetres actius durant la inferència —el procés de generar respostes—, en lloc d’activar tota la xarxa neuronal per a cada consulta. Aquest enfocament, conegut com a Mixture of Experts (MoE), permet reduir dràsticament el consum computacional sense sacrificar qualitat.

A més, l’empresa xinesa s’ha beneficiat de la recerca pública acumulada en els darrers anys i ha sabut adaptar-la de manera eficient. No es tracta de simplement copiar models existents, sinó d’identificar quines innovacions aporten més rendiment per unitat de cost i implementar-les de forma rigorosa.

També cal tenir en compte el context econòmic: els costos laborals i d’infraestructura a la Xina permeten desenvolupar i mantenir equips d’investigació competitius amb pressupostos considerablement inferiors als de les empreses del Silicon Valley.

Què implica per a Anthropic i els models occidentals?

Per a Anthropic, creadora de Claude, i per a la resta de laboratoris d’IA occidentals, l’auge de DeepSeek representa un repte estratègic de primer ordre. Durant anys, la narrativa dominant ha estat que entrenar i desplegar models d’IA d’alta qualitat requeria inversions descomunals, accessibles només a un grapat d’empreses ben capitalitzades.

DeepSeek trenca aquest relat. I ho fa en un moment especialment delicat: Anthropic acaba de captar rondes de finançament milionàries per continuar desenvolupant Claude, i OpenAI depèn d’inversions massives de Microsoft per mantenir el seu lideratge. Si un competidor pot oferir prestacions comparables a un 5% del cost, la pressió sobre els marges i les valoracions d’aquestes empreses serà enorme.

Això no vol dir que DeepSeek V4 Pro sigui superior en tots els aspectes. Els models d’Anthropic com Claude destaquen en tasques que requereixen raonament complex, adherència a instruccions matisades i comportament segur i alineat. Tanmateix, per a molts casos d’ús empresarials, la diferència pràctica de rendiment potser no justifica pagar vint vegades més.

El futur de la competència en IA

L’aparició de DeepSeek com a actor de primer nivell accelera una tendència que ja s’intuïa: la democratització dels models d’IA d’alt rendiment. A mesura que les tècniques d’entrenament eficient es difonen i els costos del hardware baixen, la barrera d’entrada es redueix i la competència s’intensifica.

Per als usuaris i les empreses, això és una notícia positiva: més opcions, preus més competitius i una pressió constant perquè tots els actors millorin els seus productes. Per als inversors que han apostat per les grans valoracions dels laboratoris occidentals, el panorama és més incert.

El que queda clar és que la cursa de la IA ja no és un afer exclusivament nord-americà, i que l’eficiència —no sols la potència bruta— serà un dels eixos centrals de la competència durant els propers anys.