GPT-5-Codex: l'agent d'OpenAI que programa i revisa el codi

  • GPT-5-Codex és una variant de GPT-5 optimitzada per a la codificació amb agents a Codex.
  • Ajusta dinàmicament el temps de raonament: de segons fins a més de set hores segons la tasca.
  • Millora la revisió de codi i detecció d'errors crítics, amb menys comentaris erronis.
  • Disponible a Plus, Pro, Business, Edu i Enterprise; l'API arribarà més endavant.

Imatge genèrica de GPT-5 Codex

OpenAI ha presentat GPT-5-Codex, una variant del seu model generalista centrada en tasques de programació amb agents dins de Codex. L'objectiu és que els equips puguin alternar entre sessions interactives i treballs llargs en segon pla sense perdre context ni qualitat als resultats.

La companyia destaca que el model adapta el temps que dedica a raonar en funció de la complexitat: respon en segons a peticions senzilles i pot invertir hores quan la tasca ho exigeix. Aquest enfocament, orientat a l'enginyeria de programari, inclou capacitats avançades de revisió de codi i detecció d'errors crítics.

Què és GPT-5-Codex i per a què serveix

Davant del GPT-5 de propòsit general, aquesta versió ha estat entrenada amb escenaris reals de desenvolupament amb frameworks com PyTorch per crear projectes des de zero, afegir funcionalitats i proves, depurar, refactoritzar i supervisar canvis de manera consistent.

Segons OpenAI, el model és més estricte amb les guies d'agents (AGENTS.md), de manera que segueix millor les instruccions, similar a projectes com OpenAssistant, i produeix codi de més qualitat amb indicacions breus, sense necessitat de redactar llargs prompts.

A més de programar, GPT-5-Codex pot valorar la correcció executant el codi i els tests, i assenyalar problemes dimpacte abans que passin a producció, cosa especialment útil en equips amb revisions exigents.

En feines d'interfície, l'empresa ho considera un soci fiable per a tasques front-end i creació d‟aplicacions d‟escriptori, amb millores en generació d‟experiències mòbils segons avaluacions internes de preferència humana.

Tot això s'integra en el flux habitual: terminal (CLI), IDE, web, GitHub i l'app de ChatGPT, amb continuïtat de context entre núvol i entorn local.

Rendiment i «temps de pensament» adaptable

Una de les claus del llançament és la seva gestió dinàmica del raonament: el mateix model decideix en temps real quant «cap» dedicar, i pot prolongar l'execució quan detecta que la tasca creix en complexitat.

OpenAI afirma haver observat sessions autònomes de més de set hores en refactoritzacions a gran escala, amb iteracions que corregeixen errors de proves i validen resultats fins a complir l'objectiu.

Aquest comportament contrasta amb estratègies basades en encaminadors que predeterminen recursos; aquí és el model el que reavalua l'esforç a mesura que avança, combinant diàleg àgil amb execució persistent.

En el pla pràctic, això es tradueix en respostes ràpides per a sol·licituds acotades i més temps invertit quan la feina implica orquestrar canvis en diversos mòduls o resoldre dependències complexes.

Per a equips de programari, lenfocament promet menys iteracions irrellevants i més focus en passos d'alt impacte, especialment en revisar grans repositoris o abordar tasques transversals.

Imatge conceptual d'agent de codi

Eines i integració: CLI, IDE, web i GitHub

La Interfície de Línia de Comandes de Codex s'ha redissenyat al voltant de fluxos amb agents. Ara es poden adjuntar imatges directament a la CLI per facilitar decisions de disseny o detectar incongruències visuals.

El sistema pot monitoritzar el progrés amb llistes de tasques i integra eines com la cerca web i MCP, un estàndard obert per connectar LLMs a dades i utilitats externes de manera segura.

La interfície també millora el format de trucades a eines i comparacions, la qual cosa ajuda a seguir el raonament de l'agent ia revisar diffs amb més claredat.

En entorns de desenvolupament, l'extensió per a l'IDE i la integració amb GitHub permeten moure feina entre local i núvol sense perdre context, recolzant-se en el codi obert a l'editor per a respostes més precises.

OpenAI indica que l'agent s'executa a entorns controlats per defecte i que és possible ajustar permisos, per tal de limitar accions potencialment destructives en projectes sensibles.

Disponibilitat i accés

GPT-5-Codex està habilitat a ChatGPT Plus, Pro, Business, Edu i Enterprise, a més de les experiències de Codex en terminal, web, IDE i GitHub.

La companyia planeja posar-ho a disposició de clients d'API més endavant, encara que de moment no ha detallat calendari ni preus específics per a aquest canal.

Proves i mètriques de GPT-5 Codex

Segons la informació compartida per OpenAI i reports externs, GPT-5-Codex ofereix millors resultats que GPT-5 en escenaris orientats a agents, com el benchmark SWE-bench Verified.

En xifres concretes, s'esmenten millores fins al 74,5% a SWE-bench Verified i un salt en proves de refactorització des del 33,9% amb GPT-5 fins al 51,3% amb GPT-5-Codex, cosa que suggereix avenços en manteniment i edició multiarxiu.

La companyia també destaca que els seus comentaris de revisió són menys erronis o irrellevants, cosa que permet centrar l'atenció en els problemes crítics i reduir soroll a les PRs.

Què implica GPT-5 Codex per a equips tècnics

Per als desenvolupadors, comptar amb un agent que combina interacció ràpida i treball autònom obre la porta a cicles més curts ia una priorització més eficaç de tasques complexes.

En organitzacions, la possibilitat que el model dediqui hores a una tasca exigeix ​​una estratègia d'IA empresarial, polítiques clares sobre cost i límits d'execució, a més de validar-ne el rendiment en diferents llenguatges i monoreps amb gran context.

També guanyen rellevància pràctiques de integració segura en fluxos existents, amb controls de permisos, seguiment de decisions de l'agent i diffs llegibles per mantenir qualitat i traçabilitat.

Amb un enfocament centrat en lenginyeria de programari, GPT-5-Codex aspira a ser un col·laborador tècnic capaç de crear, revisar i sostenir projectes complexos, ajustant l'esforç de càlcul a la mida real del problema i elevant el llistó de les eines de codificació amb IA.

Red Hat
Article relacionat:
Red Hat consolida la seva estratègia d'IA empresarial amb OpenShift AI, F5 i un ecosistema d'agents intel·ligents