
Si has sentit a parlar de BrowserOS i et preguntes per què tanta gent està parlant d'un navegador amb cervell, aquà trobaràs la foto completa. BrowserOS és un navegador de codi obert que incorpora agents d'IA capaços d'entendre instruccions en llenguatge natural i executar-les, clicant, escrivint i navegant per tu amb les teves sessions iniciades i de manera local. Tot això amb un enfocament de privadesa per defecte i sense dependre d'infraestructures al núvol per a les teves dades personals.
La proposta no és una ocurrència més al món dels navegadors: BrowserOS neix com un fork de Chromium, amb compatibilitat amb les vostres extensions de Chrome i un objectiu clar: ser una alternativa oberta i centrada en la privadesa a solucions com Atles (ChatGPT), Comet (Perplexity) o Dia, a més dels navegadors tradicionals. La idea és senzilla d'explicar i potent en el seu impacte: tu descrius la tasca i un agent la duu a terme des del teu equip, amb les teves credencials i sense enviar el teu historial a tercers.
Què és BrowserOS i en què es diferencia?
En essència, BrowserOS és un navegador que executa agents de IA nativament. Et permet redactar instruccions com si les expliquessis a un company i el sistema s'encarrega de realitzar la seqüència d'accions: obrir pà gines, iniciar cerques, completar formularis o extreure'n dades. No és un assistent extern que «mira» el teu navegador: els agents viuen dins del mateix BrowserOS.
En estar construït sobre Chromium, l'experiència resulta familiar des del minut u: interfÃcie reconeixible, compatibilitat amb extensions, importació de dades de Chrome i adopció prà cticament instantà nia per a qui ja es mou en aquest ecosistema. Aquest «se sent com a casa» redueix la fricció per començar a automatitzar sense sacrificar usos quotidians.
Per què ara: el moment dels agents al navegador
En els darrers mesos, les eines de programació assistida per IA han multiplicat la productivitat dels desenvolupadors. Tot i això, milions de professionals del coneixement segueixen atrapats en tasques repetitives de navegador: copiar-enganxar, emplenar formularis, exportar dades de dashboards, llançar campanyes, etc. És un coll d´ampolla diari.
L'equip de BrowserOS planteja que, per primer cop des dels temps de Netscape, tenim l'oportunitat de reimaginar el navegador per al treball real. Si la IA ja «escriu» projectes sencers, per què no pot també prémer botons, desplaçar-se per una interfÃcie web o concatenar accions com ho faries tu, però sense que hagis d'estar al capdavant tota l'estona?
Els problemes que atura BrowserOS
Abans de BrowserOS, el desplegament d'agents en feines reals fallava per motius molt concrets. El projecte identifica tres frens principals que en dificultaven l'adopció massiva, especialment en empreses:
- Accés a sessions autenticades: Moltes solucions dagents sexecuten en mà quines remotes i no poden operar amb els teus comptes reals (Gmail, LinkedIn, eines corporatives). Resultat: es queden curtes en tasques de debò.
- Fragmentació d'eines: Uns agents parlen amb servidors MCP, altres fan només automatització web, altres encadenen APIs com si fossin Zaps. Manca una «caixa d'eines» unificada per construir fluxos complexos.
- Caixa negra i tancament: Diversos navegadors populars són productes de cerca o publicitat. No obren els seus prompts ni el funcionament intern, us fixen un LLM concret i deriven dades als vostres servidors. Per a moltes empreses, això és un no rotund.
BrowserOS respon des de la base: agents dins del teu navegador, corrent al teu equip, combinant MCP i automatització, i sota una filosofia 100% oberta que pots auditar i forcar quan vulguis. Aquesta suma resol el que fins ara feia inviable delegar feina seriosa a la IA al navegador.
Com funciona BrowserOS i primers passos
El flux és directe: descà rregues i instal·les BrowserOS com qualsevol navegador, inicies sessió als llocs que utilitzes dià riament i, des d'aquÃ, descriues tasques en llenguatge natural. L'agent actua en el teu context real, amb els permisos i sessions actives, com si fossis tu davant de la pantalla.
- Descà rrega i instal·lació de BrowserOS pel teu sistema (disponible per a macOS, Windows i Linux). Si et preocupa la instal·lació a Linux, està com AppImage a GitHub.
- Importa les teves dades de Chrome si us interessa mantenir marcadors, historial o configuracions.
- Connecta el teu proveïdor d'IA: OpenAI, Anthropic o models locals via Ollama/LM Studio, amb les teves pròpies claus.
- Comença a automatitzar: formula objectius en text i deixa que l'agent executi els passos a la web.
A més, pots combinar automatització de navegador amb servidors MCP i trucades a APIs en un mateix flux. Aquesta barreja permet muntar assistents capaços de raspar dades, processar-les en un model i actualitzar fulls de cà lcul o eines SaaS, tot encadenat per un sol agent.
CaracterÃstiques clau de BrowserOS que marquen la diferència
- Construcció dagents en llenguatge natural: digues el que vols, sense programar.
- Llibertat de models: porta les vostres claus i alterna LLMs, o executa models locals.
- És un navegador «normal»: base Chromium, funcionen les teves extensions de Chrome.
La privadesa és un pilar del disseny: les teves dades, historial i sessions es queden al teu ordinador, sense telemetria invasiva ni dependència de núvols aliens. Si ho prefereixes, pots treballar exclusivament amb models locals i tancar l'aixeta del tot.
Per si fos poc, estan treballant en un bloquejador d'anuncis potenciat per IA que promet cobrir escenaris més complexos que els filtres està tics. I, per a desenvolupadors i power users, hi ha suport per utilitzar el navegador com a servidor MCP, integrant-lo amb eines com claude-code o gemini-cli.
Integracions, MCP i ús des d'eines externes
Una de les cartes més potents és que BrowserOS pot operar com a servidor MCP. Això significa que altres aplicacions compatibles amb el protocol (com les esmentades claude-code o gemini-cli) poden «parlar» amb el navegador i delegar tasques d'interfÃcie web als seus agents.
Allò interessant és l'orquestració: no necessites triar entre automatitzar el navegador o trucar a una API. Pots fer totes dues coses a la mateixa recepta d'agent. Per exemple, extreure'n dades d'un portal amb UI complicada, processar-les amb un model i, tot seguit, carregar el resultat en un full o un CRM, sense barrejar manualment eines.
Comparativa rà pida amb Chrome, Brave, Arc/Dia i Perplexity Comet
Davant Chrome
Grà cies a l'open source de Chromium, BrowserOS hereta la base, però Chrome fa anys que no té grans avenços nadius d'IA per a automatització. Sense MCP, sense agents locals, sense aquesta capa d'orquestració integrada, es queda com un gran navegador… sense «assistent que fa clic per tu».
Davant Brave
Brave va obrir camà en privadesa, però el seu focus està repartit entre cripte, cerca, VPNs i més fronts. BrowserOS va a la seva: IA al navegador i automatització real del treball.
Davant Arc/Dia
Molta gent va valorar la proposta d'Arc, però va tancar el codi i va deixar usuaris a l'aire. A BrowserOS és al revés: 100% obert, auditable, forkeable, amb comunitat implicada i sense dependència d'un proveïdor únic.
Davant Perplexity Comet
Perplexity és, al final, una empresa de cerca i anuncis. El teu historial es pot convertir en producte. A BrowserOS, la promesa és contundent: dades locals i control complet per part teva.
Seguretat, privadesa i llicència
La filosofia és «privacy-first»: uses les teves pròpies claus d'API o models locals amb Ollama/LM Studio, tries què surt i què no del teu equip i mantens l'historial i les sessions fora de l'abast de tercers.
A nivell legal i de comunitat, BrowserOS és programari lliure sota llicència AGPL-3.0. Pots veure com està fet, revisar prompts del sistema, proposar canvis, bifurcar el projecte i contribuir-hi. Tot això amb l'esperit «fet amb afecte des de San Francisco» que esmenten els seus creadors.
Comunitat, xifres i impuls del projecte
Linterès és palpable. Es parla de més de 4,3k estrelles a GitHub, 25.000+ descà rregues i una comunitat de Discord per sobre del miler persones participant de forma activa. En un altre fragment apareixen mètriques com «6,3k» i «558» (relacionades amb el repositori, previsiblement estrelles/seguidors/branques), cosa que suggereix una evolució a l'alça.
En l'aspecte tècnic, el projecte destaca per la base C++ sobre el colós de Chromium, una travessia exigent que requereix picar molta pedra i mantenir compatibilitat amb canvis upstream sense deixar d'innovar a la capa d'agents.
Casos d'ús i donem
Pensa en tasques reals: identificar perfils d'interès entre les teves sol·licituds de LinkedIn i afegir-los a un full de Google, emplenar formularis llargs, recopilar dades de diverses webs o preparar un prebriefing amb informació clau per a una reunió. Ho comptes en text i l'agent navega i actua com ho faries tu.
Hi ha material audiovisual que mostra el concepte en marxa: donem com "HackerNews.top.3.mp4", "use-browserOS-to-chat.mp4" o "use-browserOS-to-extract.mp4" ensenyen des de converses assistides a extracció de dades a llocs reals, reforçant que l'automatització succeeix en el teu context autèntic.
Visió: el navegador com a «sistema operatiu» per a agents
Les empreses viuen al navegador: Salesforce, SAP, Workday, eines internes… Un exèrcit de treballadors del coneixement es passa el 60–80% del dia a apps web. Si un agent pot clicar i escriure com una persona, podrà automatitzar prà cticament qualsevol interfÃcie, incloses aquelles sense API.
La visió que planteja el projecte és que IT pugui desplegar «agents-empleat» reutilitzables: l'agent de despeses de la companyia, l'agent d'anuncis a Facebook compartit per la comunitat que tu adaptes al teu flux, etc. Menys tasques mecà niques, més focus en allò que aporta valor.
Qui hi ha darrere de BrowserOS
El nucli del projecte el lideren dos germans bessons amb trajectòria seriosa a Big Tech. Nikhil ha treballat al backend de Reels i el feed de Facebook amb C++ i sistemes, i Nithin ha estat enginyer de ML a YouTube, participant en el primer gran model de recomanació (LRM) de la plataforma. Aquesta barreja de nivell baix i capa d'IA els dóna facilitat per bregar amb Chromium i, alhora, construir el «cervell agent» a sobre.
- Experiència en C++ i sistemes a gran escala: manteniment de serveis crÃtics i d'alt rendiment.
- Especialització en ML i recomanadors: entesa profunda de models moderns i el seu desplegament.
Veus de la comunitat i alternatives menys conegudes
Entre usuaris avançats hi ha gana per navegadors «diferents» amb potencial. S'han provat alternatives com Wavebox, Ulaa, Arc, Ghost Browser o Thorium, i es valora Zen Browser per productivitat (encara que no sigui Chromium). En aquestes proves es comenta que Wavebox és completÃssim però pot aclaparar i que desbloquejar-lo al mà xim costa; Ulaa presumeix de privadesa però porta massa extres; Arc ha generat reaccions diverses; i Ghost Browser no acaba de convèncer.
Sobre Thorium, se sent que és molt rà pid però amb certs dubtes de seguretat, motiu pel qual alguns ho ajornen. I sovint es demana no recomanar els més coneguts perquè ja se n'han tastat una vintena i l'objectiu és descobrir rareses que aportin alguna cosa realment nova.
Guia breu amb agents
Un cop a dins, el «moment mà gic» arriba quan descriues tasques reals. En lloc de demanar «que busqui tal cosa» i tornar un resum, l'agent executa la interacció al navegador. Si la web no té API, és igual: hi ha UI, hi ha accions que un agent pot replicar amb precisió.
- Descriu el teu objectiu: per exemple, localitzar contactes especÃfics en una xarxa professional i bolcar la seva info en un full.
- Confirma els passos si l'agent te'ls proposa (útil per auditar què farà ).
- Supervisa la primera vegada per ajustar prompts o regles. Després, reutilitza la recepta.
Lús de MCP i la possibilitat de «cosir» automatització, APIs i models permeten que un únic agent resolgui de punta a punta processos complets, una cosa que abans requeria enganxar diverses eines amb duct tape.
Privadesa per disseny i control de models
Un benefici clau és la llibertat per triar el motor dIA. Pots treballar amb OpenAI, Anthropic o mantenir tot local amb Ollama/LM Studio, intercanviant segons cost, latència o sensibilitat del projecte. Qui prioritza privadesa absoluta té una ruta 100% local.
A més, el projecte publica i permet editar els prompts del sistema, una mica poc comú. Aquesta transparència facilita ajustar el comportament de l'agent a la teva organització o cas concret i auditar com pren decisions.
Passos per aportar al projecte BrowserOS
Si creus en la idea i vols fer un cable, hi ha diverses formes de recolzar. Deixar una estrella a GitHub ajuda a donar visibilitat; descarregar-lo i fer-lo servir aporta telemetria d'interès (si l'actives) i feedback; i entrar al Discord permet proposar, descobrir i testejar novetats.
Finalment, al lloc oficial sol aparèixer el recordatori de descarregar el navegador pel teu sistema, importar si vols les teves dades de Chrome i connectar el proveïdor de IA de la teva preferència. A partir d'aquÃ, és qüestió d'anar creant els teus agents i compartir allò que et funcioni.
Mirant tot el panorama, BrowserOS es consolida com un navegador open source d'enfocament agentic, amb privadesa per bandera, base Chromium i comunitat creixent. Una compatibilitat amb extensions, MCP, suport per a models locals (Ollama/LM Studio) i un compromÃs d'obertura que inclou llicència AGPL-3.0 i prompts editables. Enfront de Chrome, Brave, Arc/Dia o propostes lligades a la publicitat i la cerca, aposta per portar la mà gia de la IA directament al lloc on treballes cada dia. I encara que encara hi ha detalls per polir (com un bloquejador d'anuncis amb IA que arribarà , o incidències d'instal·lació puntuals a Windows), el ritme i la implicació dels usuaris apunten a un projecte que va a més, construït amb «afecte» des de San Francisco i amb ganes que la web deixi de ser una cadena de clics i passi a ser, per fi, una plataforma per a agents.