Logo Kiwi

Agent Builder de OpenAI: la guía técnica (pero humana) para crear agentes paso a paso, sin perder la cabeza

[rt_reading_time label="Tiempo de lectura:" postfix="minutos" postfix_singular="minuto"]

De “chatbot simpático” a “agente que hace cosas”: armá workflows visuales, probalos, publicalos y conectalos a WhatsApp

En esta guía vas a aprender cómo usar el Agent Builder de OpenAI para diseñar agentes que no solo “hablan”, sino que siguen procesos, toman decisiones, usan herramientas, y se integran con sistemas reales. La idea es que termines con algo tangible: un flujo funcionando, ejemplos listos para copiar, y un paso a paso final para montar un chatbot de WhatsApp conectado a tu agente.

Base oficial: Agent Builder funciona como un lienzo visual para componer workflows con nodos conectados; el proceso típico es diseñar → publicar (con versión e ID) → desplegar (por ejemplo con ChatKit o exportando a Agents SDK).

1) Qué es un “agente” y qué es Agent Builder

Qué es un agente

Un agente es un sistema con un modelo como “cerebro” y un conjunto de instrucciones + herramientas + reglas para cumplir tareas. Puede enrutar pedidos, buscar información, pedir confirmaciones, ejecutar acciones y devolver resultados. 

Qué es Agent Builder

Agent Builder de OpenAI es una UI visual donde armás un workflow conectando nodos (pasos). Cada conexión define qué datos pasan entre pasos, y vos configurás cada nodo como si fuera un “bloque” de lógica. 

2) Para qué se puede usar (ideas concretas que sí se implementan)

Acá van usos típicos donde Agent Builder brilla:

  1. Soporte al cliente: clasificar consultas, buscar en documentación (File search), responder con tono consistente, escalar a humano si hace falta.

  2. Ventas/SDR: calificar leads, detectar intención, hacer preguntas, ofrecer próximos pasos, registrar datos, derivar a un cierre.

  3. Operaciones: “tomá esto → validalo → transformalo → mandalo a X sistema”.

  4. Asistentes internos: responder políticas internas, onboarding, manuales, procedimientos.

  5. Automatizaciones con control: ejecutar acciones, pero con “User approval” antes de tocar algo sensible.

3) Tour de la interfaz: 

En el panel New agent (Draft) con categorías. Cada ítem es un tipo de nodo:

Core

  • Agent: el nodo “pensante”. Acá definís instrucciones, modelo y cómo responde. Es el músculo principal del flujo.

  • Classify: clasifica una entrada en categorías (por ejemplo: Ventas / Soporte / Facturación). Perfecto para ruteo.

  • End: termina el workflow y devuelve el resultado final.

  • Note: anotaciones internas para vos o tu equipo. No ejecuta lógica; documenta.

Tools

  • File search: permite recuperar información desde archivos/bases indexadas para responder con contexto (ideal para FAQs, manuales, PDFs internos).

  • Guardrails: reglas de seguridad/comportamiento (por ejemplo, evitar prompt injection, limitar temas, forzar formatos, bloquear datos sensibles).

  • MCP: conector para herramientas externas mediante el enfoque MCP (cuando querés que el agente “hable” con servicios/acciones externas de forma estandarizada). Plataforma OpenAI

Logic

  • If / else: bifurcación. “Si pasó X, andá por A; si no, por B”.

  • While: bucle. “Repetí hasta que se cumpla una condición” (por ejemplo, pedir más datos hasta tener nombre + mail + necesidad).

  • User approval: freno con confirmación humana. Útil para: enviar emails, crear tickets, cargar datos en CRM, etc.

Data

  • Transform: convierte/normaliza datos (texto → JSON, limpiar campos, extraer email/teléfono, formatear una respuesta).

  • Set state: guarda variables de estado (memoria del workflow): nombre del lead, etapa, producto, presupuesto, etc.

Todo esto encaja con la idea oficial: un workflow se compone de nodos y conexiones que controlan secuencia y flujo. 

  • Start (izquierda) → My agent (Agent) (derecha)

  • Una línea conecta ambos: eso representa el paso de datos del input al agente.

  • Arriba se ven controles del editor (por ejemplo, ejecutar/preview, opciones del proyecto).

  • Abajo se ven controles típicos del canvas (mover, agregar, deshacer/rehacer, etc.).

Qué significa ese flujo: el usuario escribe algo → Start lo ingresa al historial y lo expone como texto → el nodo Agent toma eso y responde. 

4) Tu primer workflow real: “Router + Soporte + Ventas” (paso a paso)

Objetivo

Un agente que:

  1. entiende el mensaje,

  2. decide si es ventas o soporte,

  3. responde con el tono correcto,

  4. y guarda datos si es lead.

Paso 1 — Crear el proyecto

  1. Entrá a Agent Builder desde la plataforma. 

  2. Creá un “New agent” (queda en Draft mientras editás).

Paso 2 — Armar el esqueleto mínimo

  1. Arrastrá Start.

  2. Arrastrá Classify.

  3. Arrastrá Agent (uno para Ventas y otro para Soporte).

  4. Arrastrá End.

  5. Conectá así:

Start → Classify
Desde Classify, bifurcás:

  • si categoría = ventasAgent (Ventas)End

  • si categoría = soporteAgent (Soporte)End

(La bifurcación la podés hacer con salidas del Classify o con If/else, según cómo lo estés modelando.)

Paso 3 — Configurar Classify (ejemplo concreto)

Creá categorías claras:

  • VENTAS

  • SOPORTE

  • OTRO

Y agregá ejemplos (pocos pero buenos):

  • “¿Cuánto sale?” → VENTAS

  • “No anda el login” → SOPORTE

  • “Hola” → OTRO

Paso 4 — Configurar Agent (Ventas)

Instrucciones sugeridas (copiá/pegá y ajustá):

  • Rol: Asistente de ventas breve, profesional y útil.

  • Objetivo: calificar en 5 preguntas máximo: nombre, empresa, qué necesita, urgencia, presupuesto.

  • Restricciones: no inventar precios, si faltan datos pedirlos, ofrecer agendar demo.

Tip SEO/negocio: pedí siempre un siguiente paso (link, llamada, demo). Ventas ama los próximos pasos.

Paso 5 — Configurar Agent (Soporte)

  • Rol: Soporte técnico paso a paso.

  • Regla: si el problema requiere datos (URL, plugin, captura), pedirlos antes de adivinar.

  • Cierre: confirmar si se resolvió o escalar.

Paso 6 — Agregar memoria (Set state)

Si querés que “recuerde” datos:

  1. Después del Agent de Ventas, agregá Set state.

  2. Guardá variables:

    • lead_name

    • lead_company

    • lead_need

  3. Luego cerrás en End.

Paso 7 — Probar con Preview

Agent Builder tiene Preview para ejecutar el workflow y ver qué hace cada nodo, paso por paso. 

5) Ejemplos listos para probar (copy/paste mental)

Ejemplo A: Clasificación rápida

Usuario: “Hola, necesito una web y quiero saber planes.”
→ Classify: VENTAS
→ Agent Ventas: pregunta 2–3 cosas y propone demo.

Ejemplo B: Soporte con escalamiento

Usuario: “Desde ayer no me carga el checkout.”
→ SOPORTE
→ Agent Soporte: pide URL + plugins + si hubo updates + consola del navegador.

6) Cómo usar Agent Builder para ventas (sin humo)

Una arquitectura de ventas típica y efectiva:

  1. Classify: detecta intención (curioso vs lead caliente vs soporte).

  2. Agent (SDR): hace preguntas cortas y ordenadas.

  3. Transform: extrae datos en formato limpio (por ejemplo, JSON con nombre/mail).

  4. User approval: “¿Confirmás que enviemos propuesta / agendemos llamada?”

  5. MCP (opcional): mandar datos a CRM, Sheets, email, etc.

En otras palabras: tu agente deja de “conversar lindo” y empieza a operar un embudo.

7) Publicar y desplegar: de Draft a “esto ya vive en un sistema”

Cuando el flujo te cierra:

  1. Publish: crea una versión “snapshot” con ID y versionado.

  2. Deploy (dos caminos típicos):

    • ChatKit: si lo querés embebido como chat en web/app (rápido). 

    • Export a Agents SDK: si querés correrlo vos en tu backend y conectarlo a otros canales (WhatsApp, Telegram, etc.). 

8) Crear un chatbot de WhatsApp con Agent Builder (paso a paso, nivel “nunca programé”)

Acá vamos con el camino más común para WhatsApp: WhatsApp ↔ (Twilio) ↔ tu servidor (webhook) ↔ tu agente (Agents SDK / workflow exportado).

Nota: WhatsApp requiere un proveedor/API y un webhook público para recibir mensajes. Twilio suele ser la forma más directa para empezar (sandbox) y luego pasar a producción. 

Requisitos (lista corta, cero misterio)

  • Una cuenta en Twilio con WhatsApp habilitado (sandbox o número). 

  • Un servidor simple (tu PC sirve) con Node.js instalado.

  • Una forma de exponer tu servidor a internet: ngrok (para pruebas). 

  • Tu workflow listo en Agent Builder y exportado (Agents SDK) o accesible como deployment que puedas invocar desde backend. 


Paso 1 — Prepará el agente en Agent Builder

  1. Armá el workflow (Start → Agent → End mínimo).

  2. Probalo con Preview.

  3. Publish.

  4. Andá a la opción de Code para exportar/usar con Agents SDK (según te ofrezca el panel).


Paso 2 — Activá WhatsApp en Twilio (sandbox)

  1. Entrá a Twilio.

  2. Activá WhatsApp Sandbox.

  3. Twilio te da:

    • un número de WhatsApp,

    • un código tipo “join XXXX”.

  4. Desde tu WhatsApp personal, mandás ese “join …” al número de Twilio para vincular tu chat al sandbox. 


Paso 3 — Creá un webhook (tu mini-servidor)

Vas a armar un servidor que:

  • recibe el mensaje de WhatsApp,

  • se lo pasa a tu agente,

  • responde a WhatsApp con el texto generado.

Ejemplo en Node.js (simple y directo). Pegalo en un archivo server.js:

 

import express from “express”;
import bodyParser from “body-parser”;

// 1) Acá importás/inicializás lo que te dé el export de Agents SDK.
// La exportación real depende de tu proyecto, pero la idea es:
// “recibo texto” -> “ejecuto workflow” -> “devuelvo texto”
//
// Ejemplo conceptual (adaptalo a tu export):
// import { runMyWorkflow } from “./my-agent-workflow.js”;

const app = express();
app.use(bodyParser.urlencoded({ extended: false }));

// Webhook para WhatsApp (Twilio pega acá)
app.post(“/whatsapp”, async (req, res) => {
const incomingText = req.body.Body || “”;
const from = req.body.From || “”;

// 2) Llamada al agente (conceptual)
// const reply = await runMyWorkflow({ input: incomingText, user: from });

const reply = `Recibí: “${incomingText}”. (Acá va la respuesta real del agente)`;

// 3) Respuesta a Twilio en formato TwiML
res.set(“Content-Type”, “text/xml”);
res.send(`
<Response>
<Message>${escapeXml(reply)}</Message>
</Response>
`);
});

function escapeXml(unsafe) {
return unsafe
.replaceAll(“&”, “&amp;”)
.replaceAll(“<“, “&lt;”)
.replaceAll(“>”, “&gt;”)
.replaceAll(‘”‘, “&quot;”)
.replaceAll(“‘”, “&apos;”);
}

app.listen(3000, () => console.log(“Webhook listo en http://localhost:3000/whatsapp”));

Ahora instalás dependencias y corrés:

 
npm init -y
npm i express body-parser
node server.js

Paso 4 — Exponé el webhook con ngrok

  1. Instalá ngrok.

  2. Corré:

 
ngrok http 3000

Te va a dar una URL pública tipo https://xxxxx.ngrok-free.app.

Tu endpoint final queda:
https://xxxxx.ngrok-free.app/whatsapp

Este patrón (Flask/FastAPI/Express + ngrok) es el flujo típico para pruebas de bots en WhatsApp. 


Paso 5 — Pegá la URL en Twilio

En la consola de Twilio (WhatsApp sandbox):

  1. Buscá “When a message comes in” (o similar).

  2. Pegá tu URL pública + /whatsapp.

  3. Guardá.


Paso 6 — Probalo desde WhatsApp

Mandá un mensaje a tu chat con el sandbox:

  • “Hola”

  • “Quiero contratar”

  • “No me funciona X”

Si el webhook responde, Twilio te devuelve el mensaje. Si no, revisá:

  • que el server esté corriendo,

  • que ngrok esté activo,

  • que la URL en Twilio sea la de ngrok correcta,

  • y que el endpoint sea /whatsapp.


Paso 7 — Conectar “de verdad” el Agent Builder (la parte clave)

Acá reemplazás el reply falso por la ejecución real del workflow exportado.

La forma exacta depende de cómo lo exportes, pero el concepto es siempre el mismo:

  1. Recibir texto del usuario.

  2. Pasárselo a tu runner (Agents SDK / workflow).

  3. Devolver texto final.

Referencia oficial: podés diseñar en Agent Builder y luego descargar/usar con Agents SDK para desplegarlo vos. 


Paso 8 — Hacerlo “producción-ready” (mínimos indispensables)

Si querés que esto no se caiga cuando alguien escribe “hola” a las 3 AM:

  • Guardá historial por usuario (from) en una DB (Redis sirve mucho).

  • Sumá Guardrails en tu workflow (bloqueos, límites, formato).

  • Usá User approval si el bot va a enviar cosas sensibles (emails, presupuestos, altas).

  • Pasá de ngrok a un hosting real (VPS / Cloud Run / Render / etc.).

Qué se espera del futuro de Nanobanana 3

Los desarrollos actuales sugieren que su evolución irá en varias direcciones:

  • Procesamiento de video en tiempo real con menor costo computacional.

  • Modelos capaces de ejecutarse de forma local sin depender completamente de la nube.

  • Asistentes personales con voz natural, memoria persistente y capacidad de planificación.

  • Integración en dispositivos físicos como automóviles, electrodomésticos y sensores urbanos.

  • Colaboración prolongada entre humanos e IA en proyectos largos y complejos.

El horizonte es amplio y su adopción apenas está comenzando.

Conclusión

Agent Builder de OpenAI te permite pasar de “un chat que responde” a un sistema con pasos, decisiones, herramientas y memoria, todo armado en un canvas visual y listo para publicar con versiones. Y cuando lo combinás con un webhook (por ejemplo WhatsApp vía Twilio), el agente deja de vivir en una demo y empieza a operar donde importa: en tu canal de atención y ventas. Si tu objetivo es tener procesos repetibles (y no depender de la “inspiración” del día), esto es literalmente ponerle rieles a la IA… sin sacarle potencia.

Bibliografía y fuentes

  1. OpenAI – Agent Builder (documentación oficial)
    Guía completa sobre el constructor visual de agentes, nodos, publicación y despliegue.
    👉 https://platform.openai.com/docs/agents/agent-builder

  2. OpenAI – Agents (conceptos generales)
    Explicación conceptual de qué son los agentes, cómo funcionan y para qué se utilizan.
    👉 https://platform.openai.com/docs/agents

  3. OpenAI – Nodes Reference (referencia de nodos)
    Documentación detallada de cada tipo de nodo disponible en Agent Builder (Agent, Classify, If/Else, Tools, etc.).
    👉 https://platform.openai.com/docs/agents/nodes

  4. OpenAI – Agents SDK
    SDK oficial para ejecutar agentes creados en Agent Builder desde tu propio backend.
    👉 https://platform.openai.com/docs/agents/sdk

  5. OpenAI – Agent Platform Overview
    Visión general de la plataforma de agentes: diseño, versionado, publicación y despliegue.
    👉 https://platform.openai.com/docs/guides/agents

  6. OpenAI Developers – Building Agents
    Guía práctica para construir agentes paso a paso, con ejemplos de flujos y buenas prácticas.
    👉 https://platform.openai.com/docs/guides/building-agents

  7. OpenAI – Tool & Guardrails Concepts
    Documentación sobre seguridad, guardrails y control de comportamiento de agentes.
    👉 https://platform.openai.com/docs/agents/guardrails

  8. Twilio – WhatsApp API Overview
    Introducción oficial a la API de WhatsApp de Twilio y su funcionamiento.
    👉 https://www.twilio.com/whatsapp

  9. Twilio – WhatsApp Sandbox Quickstart
    Guía paso a paso para probar un chatbot de WhatsApp usando el sandbox de Twilio.
    👉 https://www.twilio.com/docs/whatsapp/sandbox

  10. Twilio – Receive and Respond to WhatsApp Messages
    Ejemplos técnicos de webhooks para recibir y responder mensajes de WhatsApp.
    👉 https://www.twilio.com/docs/whatsapp/tutorial/responding-to-incoming-messages

  11. ngrok – Exposing Local Servers
    Documentación oficial para exponer servidores locales y probar webhooks.
    👉 https://ngrok.com/docs

  12. Node.js – Express Framework
    Framework utilizado en el ejemplo de webhook para WhatsApp.
    👉 https://expressjs.com/

  •  

Lo más leído

  • All Posts
  • Branding
  • Claud
  • Community management
  • Development
  • Empleos
  • Finanzas
  • General
  • Google
  • IA
  • Inclusión
  • Innovación
  • Leadership
  • Liderazgo
  • Management
  • Marca
  • Marketing
  • Motivación
  • Negocios
  • Redes Sociales
  • SEO
  • Sin categoría
  • Tecnología
  • Tienda
  • Web
  • WordPress
    •   Back
    • ChatGPT
    • Grok
    • Meta
    • Gemini
    • DeepSeek
    • Claud
    • Claude
  • All Posts
  • Branding
  • Claud
  • Community management
  • Development
  • Empleos
  • Finanzas
  • General
  • Google
  • IA
  • Inclusión
  • Innovación
  • Leadership
  • Liderazgo
  • Management
  • Marca
  • Marketing
  • Motivación
  • Negocios
  • Redes Sociales
  • SEO
  • Sin categoría
  • Tecnología
  • Tienda
  • Web
  • WordPress
    •   Back
    • ChatGPT
    • Grok
    • Meta
    • Gemini
    • DeepSeek
    • Claud
    • Claude

Categorías