Procesamiento inteligente de facturas

Cuando el dato es el negocio, la forma en la que se genera importa tanto como el análisis que viene después.

En Clickie, empresa especializada en el análisis y optimización de consumos de servicios públicos, esto es especialmente crítico. Su operación depende de transformar facturas —de electricidad, agua o gas— en información estructurada que permita comparar períodos, detectar desvíos y encontrar oportunidades de mejora.

La compañía opera desde Chile, con clientes en distintos países de latinoamérica como Perú y México. Ese contexto regional, sumado al crecimiento de su cartera, introdujo una variable clave: diversidad. Diversidad de formatos, de proveedores, de regulaciones.

Y con eso, un nuevo desafío: escalar el procesamiento de facturas sin perder calidad ni trazabilidad.

Cuando el dato depende de procesos que no escalan

La digitalización de facturas era un proceso completamente manual. Equipos especializados se encargaban de recolectar documentos desde múltiples fuentes —emails, portales de autogestión o automatizaciones—, descargarlos y cargar cada campo en el sistema.

Este enfoque aseguraba calidad, pero tenía un límite claro.

A medida que aumentaban los clientes y los mercados, también lo hacía la complejidad:

  • Más volumen de documentos

  • Más formatos y layouts distintos

  • Más reglas específicas por proveedor o país

El punto de fricción aparecía en la combinación de estos factores. El esfuerzo operativo crecía más rápido que el volumen procesado, haciendo difícil sostener el ritmo de expansión.

Cada nueva variante implicaba más configuración, más seguimiento y mayor costo.

El desafío no era automatizar un proceso puntual, sino construir una solución capaz de adaptarse a esa variabilidad sin requerir ajustes constantes.

Más que digitalización: un problema de procesamiento inteligente

Este tipo de desafío se enmarca dentro de una categoría más amplia: el procesamiento inteligente de documentos.

No se trata solo de leer información, sino de transformarla en datos estructurados, validados y listos para ser utilizados en operaciones críticas.

En este contexto, aparece un error común: pensar que la inteligencia artificial puede reemplazar completamente el criterio humano.

En la práctica, especialmente en documentos financieros, el valor está en otro lugar, en combinar:

  • Automatización en la lectura y extracción

  • Reglas de negocio que validan la información

  • Manejo explícito de excepciones

  • Circuitos de revisión y aprobación

La IA acelera el proceso, pero la gobernanza del dato sigue siendo responsabilidad del sistema y de las personas.

De OCR a modelos de lenguaje: una decisión de enfoque

¿Qué es un OCR?

OCR (Reconocimiento Óptico de Caracteres) es una tecnología que permite convertir texto dentro de imágenes o documentos escaneados en texto digital editable. En otras palabras: toma un pdf o una imagen (por ejemplo, una factura) y lo transforma en texto que un sistema puede leer, procesar y almacenar.

El punto de partida fue un enfoque tradicional: OCR con plantillas.

Una solución alineada con buenas prácticas cuando los formatos son estables, pero a medida que el negocio crecía, ese modelo empezó a mostrar sus límites. Mantener reglas y configuraciones por cada variante se convirtió en el principal cuello de botella, tanto en costo como en tiempo de implementación.

La decisión fue cambiar el enfoque, en lugar de parametrizar cada factura, se priorizó la capacidad de generalizar. Esto implicó adoptar modelos de lenguaje y visión para la extracción, complementados con validaciones de negocio y aprobación humana.

Para soportar este enfoque, se diseñó una arquitectura orientada a escala y trazabilidad:

  • Procesamiento asincrónico mediante colas, con concurrencia controlada según límites de uso de modelos

  • Gestión de estado de documentos con capacidad de reaccionar a eventos (como aprobaciones)

  • Backend desacoplado expuesto mediante API GraphQL

  • Autenticación segura para operación sobre los datos

Este diseño permite elasticidad, separación de responsabilidades y seguimiento completo del ciclo de vida de cada documento.

Como en toda decisión arquitectónica, hubo trade-offs. se priorizó time-to-market y capacidad de adaptación por sobre optimización específica por caso. esto implica costos asociados al uso de modelos y una mayor sofisticación operativa.

Pero habilita algo fundamental: escalar sin rediseñar el sistema ante cada nueva variante.

Un pipeline de procesamiento pensado para evolucionar

La solución implementada funciona como un pipeline donde cada etapa cumple un rol específico.

Los documentos ingresan al sistema, ya sea de forma manual o automática, y pasan por un proceso de orquestación que gestiona su procesamiento. a partir de ahí:

  • Se encola el documento para su procesamiento

  • El motor de extracción interpreta y estructura la información

  • Se registran estados, validaciones y posibles excepciones

  • El usuario interviene cuando es necesario para revisar y aprobar

Todo el flujo queda registrado, asegurando trazabilidad de punta a punta.

A nivel tecnológico, la solución se apoya en servicios serverless para ejecución elástica y basada en eventos, junto con un modelo de datos accesible mediante GraphQL. El núcleo del sistema (la orquestación, la lógica de validación y el flujo de estados) es completamente custom, adaptado al dominio de facturación.

El rol de la inteligencia artificial en el sistema

La inteligencia artificial resuelve un problema concreto: homogeneizar la lectura de facturas con layouts diversos hacia un modelo de datos único.

A través de modelos de lenguaje, como Gemini de Google, el sistema es capaz de interpretar documentos de distintos servicios, proveedores y países, acelerando el paso de documento a dato estructurado, sin embargo, hay límites claros en su uso.

La IA no define reglas de negocio, no toma decisiones finales ni reemplaza la responsabilidad sobre el dato. Su rol es preparar la información para que pueda ser validada y utilizada con mayor eficiencia.

Es un enfoque de automatización con supervisión, donde la tecnología amplifica la capacidad del equipo en lugar de reemplazarlo.

Un nuevo equilibrio entre escala y control

El procesamiento documental deja de depender exclusivamente del ingreso manual y pasa a apoyarse en un flujo automatizado, donde las personas intervienen principalmente en casos de excepción o validación.

Esto habilita:

  • Mayor capacidad de procesamiento sin crecimiento proporcional del equipo

  • Incorporación de nuevos formatos sin necesidad de crear reglas específicas

  • Un flujo único de revisión y aprobación

  • Trazabilidad completa y auditable del proceso

Lo que este tipo de soluciones nos enseña:

Más allá del caso puntual, hay aprendizajes que se repiten en este tipo de escenarios. Definir desde el inicio un esquema de human-in-the-loop, separar claramente las etapas del procesamiento (extracción, validación, persistencia) y gestionar explícitamente el uso de modelos son decisiones que impactan directamente en la sostenibilidad del sistema. También hay factores que no son técnicos, el éxito de este tipo de iniciativas depende en gran parte del alineamiento interno y del sponsoreo para impulsar cambios en la operación.

Para organizaciones con alto volumen documental, presencia en múltiples países y formatos heterogéneos, el camino suele ser similar: comenzar con un alcance acotado, definir métricas claras y tratar la IA como un acelerador gobernado, no como un atajo.

Cuando el volumen no lo justifica, o cuando no existe un circuito claro de validación, la complejidad de estas soluciones puede no compensar.

Escalar también es cambiar la forma de pensar el problema

No todos los problemas de automatización se resuelven agregando más reglas. En contextos donde la variabilidad es la norma, escalar implica diseñar sistemas que puedan adaptarse desde el inicio.

Este caso muestra que la combinación entre arquitectura, datos e inteligencia artificial no es solo una decisión tecnológica, es una forma distinta de construir procesos preparados para crecer.

¿Te interesa este enfoque y querés implementar algo similar en tu empresa o institución?

¡Hablemos! El café corre por nuestra cuenta 😉☕️