Gemini arriba a Chrome com a agent de navegació
Google integra Gemini a Chrome amb una barra lateral i navegació automatitzada. Descobreix com canviarà la manera de navegar per internet.
Gemini arriba a Chrome com a agent de navegació
Google ha integrat Gemini directament a Chrome, el navegador més utilitzat del món, amb una barra lateral que permet delegar tasques de navegació a la intel·ligència artificial. Aquesta novetat transforma Chrome en un agent capaç d’executar accions complexes a la web en nom de l’usuari.
Gemini s’instal·la a la barra lateral de Chrome
Des de setembre passat, Chrome ja incloïa un botó de Gemini a la cantonada superior dreta. Ara, aquest botó desplega un panell lateral que redueix l’espai de visualització del lloc web per donar cabuda a una finestra de xat amb l’assistent de Google. La idea, segons la vicepresidenta de Chrome, Parisa Tabriz, és permetre que l’usuari pugui tenir la seva feina principal oberta en una pestanya mentre Gemini gestiona una tasca diferent en paral·lel.
Això permet, per exemple, comparar opcions de diverses pestanyes alhora o resumir ressenyes de productes de diferents botigues en línia sense haver de saltar d’una pàgina a l’altra. A més, la barra lateral s’ha integrat amb eines de creació i edició d’imatges directament des del navegador.
La navegació automàtica: l’aposta més ambiciosa
La funció més destacada d’aquesta actualització és el que Google anomena Chrome auto browse, disponible de moment per als subscriptors dels plans Google AI Pro i AI Ultra als Estats Units. Amb aquesta capacitat, l’usuari pot encomanar a Gemini tasques que impliquen una seqüència d’accions: buscar vols i hotels en diverses dates, omplir formularis, demanar pressupostos a professionals o fins i tot afegir productes a un carret de compra.
Un exemple il·lustratiu que ha fet servir la pròpia empresa: l’usuari mostra una fotografia d’un photobooth i demana a Gemini que vagi a Etsy, trobi els materials per recrear-lo i els afegeixi al carret sense superar els 75 dòlars. L’agent navega, identifica els productes, els selecciona i espera la confirmació de l’usuari abans de completar la compra.
Aquesta darrera part és important: Google ha especificat que Chrome auto browse demanarà confirmació humana abans de fer compres o publicar contingut a xarxes socials, una mesura pensada per mantenir el control de l’usuari en les accions més sensibles.
Un ecosistema connectat amb apps i serveis
L’aposta de Google no s’atura en la navegació web. Chrome s’ha integrat més profundament amb el que l’empresa anomena Connected Apps, un conjunt d’aplicacions que inclou les eines de Google Workspace, aplicacions de calendari i comunicació per a Android, Spotify, YouTube Music, Google Photos, Maps, Shopping i Flights, entre d’altres. Amb els permisos adequats, Gemini pot accedir a totes aquestes plataformes per dur a terme tasques de manera coordinada.
A més, Google preveu incorporar en els propers mesos la funció Personal Intelligence, que permetrà a Gemini recordar interaccions passades amb llocs web i aplicacions per contextualitzar millor les respostes presents. Serà una funció opt-in, és a dir, l’usuari haurà d’activar-la voluntàriament.
Un futur prometedor, però amb obstacles
Malgrat l’ambició del projecte, la navegació agèntica s’enfronta a una resistència creixent per part d’algunes plataformes. Amazon ha emprès accions legals contra un competidor per accés automatitzat no autoritzat, i eBay ha modificat les seves condicions d’ús per prohibir comandes realitzades sense revisió humana. La qüestió de fins a quin punt els llocs web acceptaran —o podran detectar— visites d’agents automàtics és encara oberta.
Per intentar resoldre aquesta tensió, Google treballa en el Universal Commerce Protocol (UCP), un estàndard obert per al comerç automatitzat desenvolupat amb la col·laboració d’Etsy, Shopify, Target i Wayfair. L’objectiu és crear un marc comú que permeti als agents d’IA interactuar amb les botigues en línia de manera transparent i autoritzada.
Chrome no és el primer navegador a apostar per la IA agèntica —Edge, Opera o Perplexity ja ho fan—, però amb més del 70% de quota de mercat mundial, qualsevol moviment de Google té un impacte d’escala molt superior. Si les projeccions que situen el comerç agèntic en un bilió de dòlars als EUA el 2030 s’acompleixen, Chrome podria convertir-se en una peça clau d’aquesta transformació.