Normadata vs. AFIP scrapers: contratos estables vs. scrapers que se rompen
Los scrapers de AFIP traen datos oficiales — cuando funcionan. Normadata valida estructura sin depender del HTML del organismo.
Los scrapers de AFIP — propios o de terceros — consultan el sitio oficial de Argentina y devuelven datos del contribuyente: nombre, condición frente al IVA, monotributo, actividades. Cuando funcionan son la fuente más cercana a la verdad. El problema: AFIP cambia el sitio, agrega CAPTCHAs, suspende sesiones, mete mantenimientos sorpresa. Normadata no consulta AFIP: valida estructura del CUIT con Mod-11 y reglas de prefijo. Cubre una capa distinta — la pregunta correcta es cuál cubre tu necesidad real.
Comparación rápida
| Aspecto | AFIP scraper | Normadata |
|---|---|---|
| Etapa del pipeline | Lookup de registro oficial | Validación de estructura del identificador |
| Qué hace principalmente | Devuelve nombre, condición IVA, monotributo, actividad del CUIT en AFIP | Confirma que el CUIT pasa Mod-11, prefijo válido, formato correcto |
| Modelo de pricing | Variable: gratis si lo hacés vos, pago si usás vendor | Acceso anticipado — sin pricing público |
| SDKs | Variable según vendor; DIY = vos | REST + JSON, sin SDK |
| Estilo de API | Scraping HTML / API no oficial / proxy de constancia | REST + JSON, contrato estable |
| Cobertura LATAM | Solo Argentina (AFIP) | Cobertura multi-país LATAM |
| Estabilidad | Frágil: depende del HTML/sesión de AFIP, CAPTCHAs, mantenimientos | Estable: el contrato no depende de un sitio externo |
| Persistencia de datos | Variable; algunos vendors cachean | No persiste PII |
| Datos del contribuyente real | Sí — viene de AFIP | No — solo confirma estructura del número |
| Buyer típico | Equipos AR que necesitan datos del contribuyente real | Equipos que necesitan validar formato sin depender de AFIP |
¿Cuándo usar cada uno?
- Necesitás el nombre real del contribuyente, no solo confirmar que el CUIT está bien armado.
- Tenés que verificar condición frente al IVA, monotributo o categoría fiscal.
- Necesitás la actividad económica registrada (códigos AFIP).
- Aceptás la fragilidad del scraping y vas a manejar reintentos, fallbacks y outages cuando AFIP cambia el sitio.
- Solo necesitás confirmar que el CUIT es estructuralmente válido (Mod-11, prefijo, longitud).
- No querés depender de la disponibilidad del sitio de AFIP en tu hot path.
- Necesitás validar tax IDs de varios países LATAM en un solo endpoint, no solo Argentina.
- Querés un contrato JSON estable que no se rompa cuando AFIP rediseña el HTML.
El problema con scrapear AFIP
El sitio de AFIP no tiene API pública estable. Los scrapers leen HTML, mantienen sesiones autenticadas, sortean CAPTCHAs y rate limits. Cuando AFIP cambia el frontend o introduce mantenimiento, todos los scrapers se rompen al mismo tiempo. Hay vendors que mantienen scrapers profesionalmente y absorben ese costo, pero la fragilidad del fundamento no desaparece — solo se traslada al vendor. Normadata no tiene este problema porque no toca AFIP: el algoritmo de Mod-11 es matemática pura.
Cuándo el scraper gana sin discusión
Si tu requerimiento es regulatorio o financiero — tenés que confirmar que un CUIT existe en AFIP, conocer la condición fiscal, validar la razón social registrada — Normadata no alcanza. El algoritmo de Mod-11 dice si el número está bien armado, no si pertenece a alguien real ni a quién. Para esa pregunta necesitás la fuente oficial, y la fuente oficial es AFIP. Aceptás la fragilidad porque no hay alternativa.
El patrón sano: pre-validar con Normadata, después scrapear
Cualquier llamada al scraper de AFIP que recibe un CUIT mal armado es tiempo perdido y un riesgo extra de bloqueo de sesión. Normadata filtra esos inputs en el frontend en < 50 ms — el scraper de AFIP solo se invoca cuando el CUIT pasó Mod-11. Resultado: menos llamadas a AFIP, menos pressure sobre tu sesión, mejor UX para el usuario que ingresa mal el número y recibe el error antes del submit.
Normadata no consulta AFIP. No devuelve nombre, razón social, condición IVA, monotributo ni actividad. Si necesitás esos datos, necesitás un AFIP scraper o el padrón. Normadata cubre la capa estructural — confirmar que el número está bien armado antes de gastar la consulta cara.
Preguntas frecuentes
¿Normadata puede reemplazar un AFIP scraper?
No para el caso de uso donde necesitás datos del contribuyente real. Sí para el caso donde solo necesitás confirmar que el CUIT está estructuralmente bien armado.
¿Cuándo conviene usar ambos?
Cuando querés filtrar formato malformado antes de gastar el scraper. Normadata pre-valida en el frontend; el scraper solo corre cuando el CUIT pasa Mod-11. Reduce llamadas a AFIP y presión de sesión.
¿Cuál es más barato?
Depende. Un scraper DIY es gratis en pricing pero caro en mantenimiento; un vendor de scraper cobra por consulta. Normadata todavía no tiene pricing público. La pregunta correcta es el costo total cuando AFIP cambia el HTML.
¿Dónde el AFIP scraper gana sobre Normadata?
En todo lo que requiere fuente oficial: nombre real, condición IVA, monotributo, actividad, razón social. Normadata no compite ahí.