Ir al contenido principal
OpenAI

30 de julio de 2025

Las tres lecciones de Intercom para construir una ventaja competitiva basada en IA

Gracias a la experimentación temprana, la medición rigurosa y una arquitectura que se adapta a cada modelo, Intercom ha desarrollado una plataforma de IA escalable capaz de incorporar características nuevas en cuestión de días.

Plano de detalle de unos hilos de cobre con brillos, con el logotipo blanco de Intercom superpuesto en el centro de la imagen.
Cargando…

Cuando se lanzó GPT‑4 en 2022, Intercom(se abre en una ventana nueva) no se limitó a seguir los titulares que aparecían en prensa y se puso manos a la obra de inmediato. En cuestión de horas, la empresa de software de atención al cliente empezó a experimentar, y solo cuatro meses después lanzó Fin, el agente de IA que ahora resuelve millones de consultas cada mes.

Este inicio rápido no fue fruto del azar. Con el salto de los LLM, Intercom vio claro que la IA cambiaría por completo la experiencia del cliente. La dirección de la empresa respondió de inmediato y formó un equipo multidisciplinar, cancelando proyectos sin relación con la IA y destinando 100 millones de dólares para reorganizar el negocio en torno a esta tecnología.

Esa decisión provocó cambios en toda la empresa: la reestructuración de los equipos de producto, una nueva estrategia de soporte centrada en la inteligencia artificial y una plataforma diseñada para que Fin gestione grandes volúmenes de consultas o casos difíciles de clientes.

A continuación se ponen de relieve las tres lecciones que se pueden extraer de la experiencia de Intercom y que cualquier equipo puede empezar a aplicar ya, sin importar en qué etapa se encuentre.

«Ser una empresa centrada en IA implica construir con ella desde el principio, no adaptarla después».
Paul Adams, director de Producto, Intercom

Primera lección: Experimenta cuanto antes y con frecuencia para entender cómo funcionan los modelos

Intercom prueba los modelos cuanto antes y con la máxima frecuencia posible para aprender al máximo de su trabajo.

Desde el inicio, el equipo empezó a trabajar con modelos generativos, y esa experiencia práctica les ayudó a entender los límites y a detectar oportunidades. A comienzos de 2023, cuando se lanzó GPT‑4, el equipo ya estaba listo: en solo cuatro meses lanzaron Fin y no han dejado de avanzar desde entonces.

«Con GPT‑3.5 logramos mantener diálogos naturales y con cierto encanto, pero no era lo bastante estable como para confiarle la atención al cliente», explica Jordan Neill, vicepresidente sénior de Ingeniería. «Gracias al trabajo previo, cuando apareció GPT‑4 supimos que era el momento de lanzar Fin».

Esa misma experiencia permitió a Intercom desarrollar Fin Tasks, un sistema que automatiza flujos de tareas complejos, como los reembolsos y el soporte técnico. Aunque inicialmente el equipo había planeado usar una arquitectura basada en recuperación, las evaluaciones mostraron que GPT‑4.1 podía encargarse por sí solo, con resultados fiables y menor latencia.

Actualmente, GPT‑4.1 se encarga de una parte cada vez mayor del uso de IA en Intercom, incluida la lógica principal de Fin Tasks. Asimismo, el equipo descubrió que al añadir indicaciones con cadenas de pensamiento a consultas sin relación con el razonamiento, se cerraban brechas de rendimiento sin necesidad de implementar sistemas de RAG completos.

Intercom lo tiene claro: entender bien tus modelos te permite adaptarte con rapidez a los avances tecnológicos.

Según las pruebas de Intercom, GPT‑4.1 fue el modelo más fiable para efectuar tareas y permitió reducir costes en un 20 % en comparación con GPT‑4o.

Segunda lección: Acelera el desarrollo con evaluaciones robustas

Para avanzar rápido, hay que medir qué funciona y por qué.

La capacidad de Intercom para adoptar con rapidez nuevos modelos, modalidades y arquitecturas se basa en el riguroso proceso de evaluación. Todos los nuevos modelos de OpenAI, ya sea para usarlos en Fin Voice (Realtime API) o en Fin Tasks (GPT‑4.1), pasan por pruebas sin conexión estructuradas y pruebas A/B en producción antes de implementarlos para verificar que siguen instrucciones correctamente, usan herramientas con precisión y mantienen la coherencia.

Entre otras cosas, el equipo los enfrenta a transcripciones de interacciones reales de soporte, comprobando si saben manejar tareas de varios pasos, como reembolsos, si mantienen el estilo de Fin y si son capaces de ejecutar llamadas a funciones sin fallos. Los resultados que se obtienen sirven de base para pruebas A/B en tiempo real que comparan las tasas de resolución y satisfacción del cliente entre modelos como GPT‑4 y GPT‑4.1.

Gracias a este método, Intercom pudo pasar de GPT‑4 a GPT‑4.1 en tan solo unos días. Una vez comprobadas las mejoras en la interpretación de instrucciones y el uso de funciones, se implementó GPT‑4.1 en Fin Tasks y se obtuvieron resultados positivos de inmediato, tanto en las métricas de rendimiento como en la satisfacción del cliente.

«Cuando se lanzó GPT‑4.1, tuvimos listos los resultados de las evaluaciones en 48 horas y un plan de despliegue listo poco después», afirma Jordan Neill, vicepresidente sénior de Ingeniería en Intercom. «Vimos de inmediato que GPT‑4.1 ofrecía una buena combinación de inteligencia y baja latencia que se adaptaba a las necesidades de nuestros clientes». 

En el caso de Fin Voice, ese mismo proceso de evaluación permitió a Intercom validar nuevas versiones del modelo de voz y mejorar la latencia, la precisión al ejecutar funciones y el cumplimiento de los guiones, elementos fundamentales para lograr un soporte telefónico con calidad humana. 

Intercom amplió las evaluaciones para incluir ese componente adicional que introduce la voz en las interacciones. Fin Voice se prueba de forma sistemática en aspectos como la personalidad, el tono, la gestión de interrupciones y el ruido de fondo para garantizar que el cliente obtiene una experiencia de calidad.

Tercera lección: Apuesta por la flexibilidad arquitectónica para lograr beneficios duraderos

Desde el inicio, Intercom diseñó una arquitectura adaptable, capaz de evolucionar al ritmo de los modelos en los que se apoya.

El sistema modular de Fin está preparado para operar con diversos formatos, como chat, correo electrónico y voz, cada uno con implicaciones técnicas distintas en cuanto a latencia y dificultad. Esta arquitectura permite a Intercom dirigir las consultas al modelo más adecuado y cambiar de modelo sin tener que rediseñar el sistema de base.

Esa flexibilidad es intencionada y está en constante evolución. La arquitectura de Fin va por su tercera gran iteración, y la siguiente ya está en marcha. Con el avance de los modelos, el equipo incorpora complejidad donde hace falta y reduce de donde puede, para equilibrar funcionalidad y eficiencia.

Esa capacidad de adaptación resultó decisiva para Fin Tasks. Al principio, el equipo pensó que se necesitaría una arquitectura personalizada basada en recuperación para dar soporte a Fin Tasks, lo que permite a Fin resolver consultas complejas de clientes y ejecutar procesos que implican varios pasos, como emitir reembolsos, hacer cambios en cuentas o resolver problemas técnicos. 

Pero en las pruebas, la capacidad de GPT‑4.1 para seguir instrucciones superó las expectativas, ofreciendo la misma fiabilidad con menor latencia y coste.

«Sinceramente, me sorprende que GPT‑4.1 no reciba más atención», comenta Pratik Bothra, ingeniero principal de Aprendizaje automático en Intercom. «La latencia y el coste fueron una auténtica sorpresa. Nos permitieron replantear nuestra arquitectura y simplificarla bastante».

Un diagrama de flujo titulado «Diagrama de motores de IA de Intercom» que ilustra una arquitectura modular basada en subagentes. Representa una consulta que pasa por seis fases: búsqueda vectorial, división personalizada, reordenamiento, refinado, generación y validación, todas gestionadas por LLM especializados. El diagrama destaca la recuperación, el reordenamiento y la validación en múltiples etapas para generar una respuesta final.

Fin AI Engine™

Crear experiencias de cliente conectadas mediante datos unificados y la automatización de flujos de trabajo

El equipo apenas acaba de empezar. Con modelos avanzados y una arquitectura modular e independiente del modelo, Intercom amplía el alcance más allá de la atención al cliente para optimizar flujos de trabajo en todo el negocio, logrando respuestas más ágiles y experiencias de mejor calidad para los consumidores.

  • Equipos de soporte: resolución de la mayoría de las consultas entrantes por chat, correo electrónico, voz, etc. con el agente de IA Fin.
  • Equipos de operaciones: automatización de flujos de trabajo complejos como reembolsos, cambios de cuenta y actualizaciones de suscripciones con Fin Tasks.
  • Equipos de producto: gracias al servidor MCP de Intercom, herramientas como ChatGPT tienen acceso a tickets, conversaciones y datos de usuario, lo que permite a los equipos identificar fallos, planificar el desarrollo, mejorar la comunicación y preparar las revisiones trimestrales. 

Intercom ha creado una plataforma de IA escalable manteniendo un riguroso sistema de evaluación, centrado en el rendimiento y con un diseño flexible, que redefine el soporte y ofrece una valiosa enseñanza a cualquier empresa que trabaje con inteligencia artificial.

¿Quieres saber más sobre ChatGPT para empresas?