ChatGPT Agent: el salt d'OpenAI als agents autònoms per automatitzar tasques complexes

  • OpenAI integra a ChatGPT un agent autònom capaç d'executar tasques elaborades des del principi fins al final utilitzant un entorn virtual propi.
  • L'agent combina navegació web, execució de codi i generació de fitxers, integrant funcions prèvies com Operator i Deep Research.
  • Disponible per a usuaris de plans Pro, Plus i Team, el sistema gestiona formularis, calendaris i tasques empresarials sota la supervisió de lusuari.
  • OpenAI ha reforçat la seguretat mitjançant confirmacions explícites i control de privadesa, atesa la capacitat de l'agent per actuar de forma autònoma a la web.

ChatGPT Agent

La intel·ligència artificial ha deixat enrere l'era del simple assistent conversacional per transformar-se en un agent capaç de fer tasques elaborades de principi a fi. OpenAI ha introduït en ChatGPT Agent, una funció que impulsa l'autonomia del chatbot i el converteix en un treballador virtual que no sols ofereix idees o respostes, sinó que executa accions reals i automàtiques a partir d'ordres en llenguatge natural.

Aquesta novetat representa un salt qualitatiu en lús quotidià de la IA. Els usuaris ara poden delegar treballs que abans exigien saltar entre múltiples aplicacions o pestanyes i deixar que l'agent de ChatGPT gestioni des de la recollida de dades fins al lliurament de resultats, sense sortir de l'entorn de conversa.

ChatGPT Agent fusiona tecnologies prèvies com Operator i Deep Research

ChatGPT Agent fusiona tecnologies prèvies com Operador i Deep Research, permetent que el sistema combini la navegació web automatitzada amb la cerca, l'anàlisi i la síntesi d'informació des de diferents fonts. D'aquesta manera, l'agent és capaç d'accedir a llocs web, omplir formularis, executar ordres, utilitzar connectors empresarials com Gmail o Google Drive, i generar fitxers editables per a baixar.

Entre les funcions destacades s'inclouen la creació automàtica de presentacions i fulls de càlcul, la preparació dinformes personalitzats, la compra o reserva de serveis en línia i la gestió de calendaris i correus electrònics. Tot això es fa en un ordinador virtual temporal i segur que OpenAI posa a disposició de cada tasca, eliminant l'entorn una vegada completada per reforçar la privadesa.

La interacció amb l'agent és fluida i bidireccional: l'usuari pot interrompre, modificar o autoritzar cada acció rellevant, especialment en operacions delicades com a compres o reserves. Abans de dur a terme accions que puguin afectar tercers o manejar dades confidencials, el sistema sol·licita sempre una confirmació explícita, assegurant que l'usuari mantingui el control.

Pel que fa a aplicacions pràctiques, l'agent ha estat sotmès a proves que simulen tasques empresarials i personals, com lorganització desdeveniments (cases, viatges, reunions), lanàlisi de grans volums de correus o missatges per detectar tendències i clients potencials, olautomatització dinformes financers i dexperiència dusuari. Segons les avaluacions internes d'OpenAI, l'agent ha arribat a superar models anteriors i analistes humans en tasques com l'edició de fulls de càlcul o la síntesi de dades, destacant-ne la rapidesa i precisió.

OpenAI s'esforça perquè sigui privat i segur

A benchmarks com SpreadsheetBench o DSBench, el ChatGPT Agent ha duplicat i fins i tot multiplicat per més de dos el rendiment de competidors com Copilot, i s'ha posicionat al capdavant davant humans en alguns escenaris d'anàlisi i modelatge de dades.

Respecte a la seguretat i privadesa, OpenAI ha posat especial esforç a implementar salvaguardes addicionals. L'agent només executa accions sensibles després de l'aprovació de l'usuari i rebutja tasques que impliquin riscos legals, financers o personals greus. Les dades tractades a l'ordinador virtual no s'emmagatzemen, i l'historial es pot esborrar amb un sol clic. A més, s'han afegit mecanismes per detectar instruccions malicioses a llocs web i protegir així tant l'usuari com la infraestructura.

A nivell estratègic, OpenAI ha optat per un sistema de abstracció total del navegador, executant les maniobres en un entorn remot que actua com a intermediari entre l'usuari i la web, cosa que el diferencia d'altres agents IA que operen directament dins del navegador del client.

Ja als plans Pro, Plus i Team

L'accés al ChatGPT Agent ja està habilitat per als usuaris dels plans Pro, Plus i Team, tant en anglès com en altres idiomes, després d'activar-lo des del menú d'eines o escrivint /agent a la conversa. El seu llançament a l'Espai Econòmic Europeu segueix pendent per qüestions reguladores, encara que OpenAI preveu ampliar-lo properament a empreses i centres educatius.

Amb aquest moviment, la companyia busca convertir la IA conversacional en una eina integral de productivitat, capaç d'automatitzar processos, assistir tant en tasques simples com en operacions complexes i transformar la manera com els usuaris interactuen amb la tecnologia.

La irrupció del ChatGPT Agent marca un punt d'inflexió clar: dels assistents que només responen passem a agents que decideixen, executen i lliuren resultats, tot sota la supervisió de lusuari i amb proteccions reforçades. Empreses i particulars podran valorar fins a quin punt aquestes capacitats canvien realment el dia a dia i si la confiança en l'autonomia de la IA va creixent amb la seva evolució.