Email parser del CoA del API — del PDF del proveedor al batch record sin teclear.

El certificado de análisis (CoA) del API farma llega en PDF por email y casi siempre alguien lo reteclea al batch record electrónico (EBR), con el riesgo de transcripción que eso implica. iLEAN Connect captura el email en el segundo cero, extrae las especificaciones del PDF como tarea anclada y propone el volcado al EBR. QA firma — Connect no.

← Ver todas las capacidades de iLEAN Connect

Planta farma con responsable QA revisando un CoA en pantalla — iLEAN Connect ha extraído el PDF del email y lo ha pegado al batch record electrónico, esperando firma
El problema

El dato crítico vive en un PDF que cada proveedor formatea a su gusto.

Cada lote de API que entra a planta farma trae su CoA: identidad, pureza, contenido, perfil de impurezas, humedad, residuos de disolventes. Es el documento que dice si el lote puede entrar a producción y bajo qué especificación. Lo crítico de todo el proceso aguas arriba. Y, sin embargo:

  1. Llega por email. No por EDI, no por API, no por un portal del proveedor. Por correo, como adjunto.
  2. El PDF lo formatea cada proveedor a su gusto. Tabla de Excel exportada, texto corrido, un escaneado con sello, mismo dato en tres idiomas. No hay estándar entre proveedores.
  3. Alguien lo reteclea al EBR. Un técnico de almacén, un analista de control de calidad, alguien lo lee y lo escribe en otro sistema. Cada vez. Cada lote.

El riesgo no es la firma de QA — esa hace su trabajo. El riesgo es la transcripción: el dato leído mal porque la coma decimal estaba en otro sitio, la unidad confundida (ppm vs %), el resultado pegado en la fila del lote anterior. Y la fricción real es el tiempo de QA gastado tecleando, no revisando.

Cómo encaja con el sistema IRIS

iLEAN Connect — la masilla entre el buzón del proveedor y el EBR.

El CoA no es un dato de planta — es un dato que llega por fuera, y casi nunca llega a tiempo a quien decide. Conectar el email del proveedor con el EBR siempre fue posible, pero unir formatos heterogéneos costaba un dineral, así que casi nadie lo hizo. Eso es justo lo que la IA tiró al suelo. Connect es la pieza que rellena ese hueco — sin tirar ERP, sin tirar EBR.

Connect lee el CoA. El agente lo recontextualiza al esquema del EBR. QA revisa lado a lado con el PDF. QA firma — nunca al revés.

Cómo trabaja Connect aplicado al CoA del API farma:

  • Escucha hacia fuera. Connect monitoriza el buzón del proveedor de API en el segundo cero. No hace falta que nadie reenvíe nada ni convoque una reunión: el CoA entra al sistema en el mismo segundo en que el proveedor lo manda.
  • Extracción anclada. Identifica el adjunto como CoA (por remitente, asunto o contenido), aplica el extractor que toca por proveedor y deposita el resultado en un esquema normalizado: parámetro, valor, unidad, especificación, resultado, lote, fecha de análisis. La IA no genera datos libres; recontextualiza los que ya están en el PDF.
  • Multilingüe sin tocar el documento original. Si el CoA viene en alemán, hindi o chino, la extracción deposita el dato en el idioma del EBR — pero el PDF original se guarda intacto como evidencia, con su hash y su timestamp.
  • Propuesta a QA, no commit directo. El registro entra al EBR en estado «pendiente de revisión QA», con el PDF adjunto, el modelo de extracción usado y un diff visible: lo que el PDF dice y lo que se va a pegar. QA revisa, ajusta si hace falta y firma. La firma queda Annex 11 / 21 CFR Part 11 ready si el EBR ya lo está.

Connect transporta el dato, el agente lo estructura, la persona firma. Esa es la regla. Esto es exactamente lo que el sistema IRIS llama la pieza Connect: el oído de la planta hacia fuera.

Ver la arquitectura IRIS completa →

Antes y después

Retecleo del CoA vs. parser anclado con firma de QA.

AspectoRetecleo manual al EBRCon iLEAN Connect (parser CoA → EBR)
Tiempo del CoA al EBRMinutos por lote × número de proveedoresSegundos — el dato propuesto queda listo para QA
Riesgo de transcripciónComa decimal, unidad, fila del lote anteriorExtracción anclada al PDF, diff visible para QA
Formato del proveedorCada uno el suyo — el operario se adaptaExtractor por proveedor, se reaprende sin código
Idioma del CoATraducción mental del operarioExtracción multilingüe al idioma del EBR
Trazabilidad para auditorPDF en carpeta, EBR en sistema, sin linkPDF + hash + modelo + diff anclado al lote
Firma electrónica GMPQA firma tras retecleoQA firma tras revisión — el retecleo desaparece
Estimación de impacto

Estimación de impacto para tu planta — a validar con tus números.

El siguiente bloque es una estimación a validar con los datos concretos de tu planta. Lo planteamos para que el comité tenga un orden de magnitud; lo refinamos en el diagnóstico.

  • Planta API farma con 10–20 proveedores activos, CoA en PDF por email, EBR/MES ya implantado y validado GMP, varios miles de lotes/año.
  • Piloto Connect con 2–3 proveedores típicos (el Pareto de los CoA): primer valor esperable en pocas semanas — la extracción ya alimenta al EBR en estado «pendiente QA».
  • Payback orientativo entre 4 y 9 meses, según horas/QA gastadas en retecleo y coste asociado a investigar transcripciones erróneas detectadas en auditoría.
  • Palanca dura: reducción ≥ 30% del tiempo de QA gastado tecleando — convertido en tiempo de QA revisando, que es donde QA aporta valor. Una sola desviación evitada por mal volcado paga el piloto.

Y la duda razonable del director de calidad

«¿Y si la IA alucina al leer el CoA y pega un valor incorrecto?» — la alucinación es un problema de la generación libre, no de las tareas ancladas. En tareas donde la IA se limita a recontextualizar un dato de un PDF a un esquema normalizado, los mejores modelos bajaron el error por debajo del 1,5% [1]. Y aun así, lo crítico no se firma solo: Connect propone el volcado, QA firma. Los tres anillos de seguridad están ahí precisamente para esto.

[1] Paper OpenAI «Why Language Models Hallucinate», 2025 — sobre fiabilidad de la IA en tareas ancladas.

Preguntas frecuentes

Lo que se pregunta sobre el parser CoA del API farma

¿Qué es un CoA y por qué cuesta tanto pegarlo al EBR?

El CoA (certificate of analysis) es el documento que el proveedor del API envía por cada lote con los resultados de los ensayos críticos (identidad, pureza, contenido, impurezas, humedad). En farma cada lote de API que entra a planta debe quedar reflejado en el batch record electrónico (EBR) con sus especificaciones — y el CoA es la fuente. El problema es que cada proveedor tiene su propio formato de PDF (tabla, texto corrido, idioma distinto), así que casi siempre alguien lo reteclea o pega a mano, con el riesgo de transcripción que eso implica.

¿Cómo lee Connect un PDF de CoA que cambia de formato por proveedor?

Connect captura el email del proveedor del API en el segundo cero, identifica el adjunto como CoA (por remitente, asunto o por el propio contenido) y aplica el extractor que toca por proveedor. La extracción es de tipo anclado: la IA NO genera datos libres, recontextualiza los que ya están en el PDF a un esquema normalizado (parámetro, valor, unidad, especificación, resultado, lote). Si el formato cambia, se reaprende sin tocar código. Ahí es donde la IA moderna abarató lo que era inviable hace 10 años.

¿Esto vale para Anexo 11 / GMP y firma electrónica?

El parser por sí solo no firma — y ese es justo el diseño. Connect deposita los datos extraídos en el EBR/MES en un estado «pendiente de revisión QA», con el PDF original adjunto, el hash del documento, el timestamp de captura y el modelo de extracción usado. Quality Assurance revisa la propuesta lado a lado con el PDF y firma electrónicamente. La firma queda Annex 11 / 21 CFR Part 11 ready si el EBR ya lo está — Connect no rompe lo que ya tienes, lo alimenta más rápido.

¿Y si el CoA llega en alemán, hindi o chino?

Se traduce a nivel de extracción, no a nivel de documento. La IA de hoy hace excepcionalmente bien lo que el libro llama tareas ancladas — leer un dato en un idioma y depositarlo en el esquema EBR en el idioma del sistema, conservando unidad y especificación. El PDF original se guarda intacto como evidencia y el dato extraído queda con la nota del modelo usado. Si el CoA viene firmado digitalmente por el proveedor (CFDI, eIDAS, etc.), Connect lo verifica y lo registra en el dossier del lote.

¿Cuánto se tarda en pegar Connect entre el correo del proveedor y nuestro EBR?

La puesta en marcha de un primer CoA — un proveedor, un tipo de API, un EBR/MES concreto — suele dar primer valor en pocas semanas. La integración pesa más en el lado del EBR (rara vez el correo: el correo es estándar) que en el de la extracción. A partir del primer proveedor, añadir otros es coste marginal — el extractor se entrena con dos o tres muestras del nuevo formato y queda. Pedimos los datos de tu planta y pasamos un orden de magnitud en 48h.

Hablemos

Cuéntanos tu caso y te pasamos en 48h el ROI estimado de este proyecto de IA para tu planta API farma.

Trabajamos sobre los datos reales de tu planta, no sobre los nuestros. Diagnóstico sin compromiso.

Pedir ROI estimado en 48h Ver iLEAN Connect