DeepSeek-V4: intel·ligència amb milions de tokens de context

DeepSeek acaba de presentar DeepSeek-V4, el seu model de llenguatge més avançat fins ara, dissenyat per gestionar contextos de fins a un milió de tokens amb una eficiència destacable. Aquesta fita representa un salt qualitatiu en la capacitat dels models d’IA per comprendre i processar documents extensos, converses llargues i bases de dades complexes en una sola passada.

Què significa processar un milió de tokens?

Per posar-ho en perspectiva, un milió de tokens equivalen aproximadament a uns 750.000 paraules, és a dir, diverses novel·les de llargada mitjana llegides i processades alhora. Fins fa poc, la majoria de models comercials treballaven amb finestres de context molt més reduïdes —sovint entre 8.000 i 200.000 tokens—, cosa que obligava els usuaris a fragmentar documents llargs o a perdre informació rellevant del context anterior.

Ambicions com les de DeepSeek-V4 obren la porta a casos d’ús que fins ara eren impracticables: anàlisi completa de grans repositoris de codi, revisió de contractes legals sencers, síntesi d’expedients mèdics extensos o fins i tot la conversa contínua amb un assistent que recorda tot el que s’ha dit des del primer moment.

L’eficiència com a element diferenciador

El que fa especialment notable DeepSeek-V4 no és tan sols la seva capacitat de context, sinó la manera com assoleix aquesta capacitat sense disparar els costos computacionals. Un dels problemes tradicionals dels contextos llargs és que el consum de memòria i temps de càlcul creix de manera quadràtica amb la longitud de l’entrada. Això fa que models amb finestres molt grans siguin prohibitivament cars d’executar.

DeepSeek ha treballat en optimitzacions arquitecturals que permeten escalar el context de forma molt més eficient, reduint l’impacte en latència i en consum de recursos. Aquesta aposta per l’eficiència és, de fet, una de les marques de la casa: l’empresa xinesa ja va sorprendre el sector amb DeepSeek-R1 i DeepSeek-V3, models que competien amb els millors del mercat a una fracció del cost d’entrenament dels seus rivals nord-americans.

DeepSeek en el panorama global de la IA

L’aparició de DeepSeek-V4 arriba en un moment en què la competència entre laboratoris d’IA s’ha intensificat enormement. Empreses com OpenAI, Google i Anthropic porten mesos ampliant les finestres de context dels seus models —Gemini 1.5 Pro ja oferia un milió de tokens—, però DeepSeek entra en aquesta cursa amb una proposta que emfasitza el rendiment per unitat de cost.

Aquest enfocament té implicacions rellevants per a empreses i desenvolupadors. Si un model capaç de gestionar contextos molt llargs pot executar-se de manera més econòmica, les barreres d’entrada per a aplicacions empresarials complexes es redueixen significativament. Startups i organitzacions amb recursos limitats podrien accedir a capacitats que fins ara només estaven a l’abast dels actors més grans del sector.

A més, el fet que DeepSeek publiqui els seus models amb llicències obertes o semi-obertes —una pràctica que ha mantingut en versions anteriors— podria permetre a la comunitat investigadora i als desenvolupadors independents explorar i adaptar DeepSeek-V4 per a casos d’ús específics.

Reptes i expectatives pendents

Encara queden moltes preguntes per respondre sobre DeepSeek-V4. La qualitat real del model en tasques de raonament complex, la seva precisió en contextos molt llargs —on els models tendeixen a «oblidar» informació del principi de l’entrada— i el seu rendiment en benchmarks estàndard seran elements clau per avaluar si l’anunci es tradueix en un avenç real o en una proposta més de màrqueting.

També caldrà veure com gestiona el model la coherència quan treballa amb entrades massives i si les millores d’eficiència es mantenen en condicions reals de producció, més enllà dels entorns controlats de laboratori.

El que és innegable és que DeepSeek continua demostrant que la innovació en IA no és patrimoni exclusiu de Silicon Valley. Amb DeepSeek-V4, el laboratori torna a posar pressió sobre els grans actors del sector i recorda que l’eficiència i l’accessibilitat poden ser tan importants com la potència bruta a l’hora de definir el futur dels models de llenguatge.