Normadata vs. AFIP scrapers: contratos estáveis vs. scrapers que quebram
Os scrapers da AFIP trazem dados oficiais — quando funcionam. O Normadata valida estrutura sem depender do HTML do órgão.
Os scrapers da AFIP — próprios ou de terceiros — consultam o site oficial da Argentina e devolvem dados do contribuinte: nome, condição frente ao IVA, monotributo, atividades. Quando funcionam são a fonte mais próxima da verdade. O problema: a AFIP muda o site, adiciona CAPTCHAs, suspende sessões, mete manutenções surpresa. O Normadata não consulta AFIP: valida estrutura do CUIT com Mod-11 e regras de prefixo. Cobre uma camada distinta — a pergunta certa é qual cobre sua necessidade real.
Comparação rápida
| Aspecto | AFIP scraper | Normadata |
|---|---|---|
| Etapa do pipeline | Lookup de cadastro oficial | Validação de estrutura do identificador |
| O que faz principalmente | Devolve nome, condição IVA, monotributo, atividade do CUIT na AFIP | Confirma que o CUIT passa Mod-11, prefixo válido, formato correto |
| Modelo de pricing | Variável: grátis se DIY, pago se usar vendor | Acesso antecipado — sem pricing público |
| SDKs | Depende do vendor; DIY = você | REST + JSON, sem SDK |
| Estilo da API | Scraping HTML / API não oficial / proxy de constancia | REST + JSON, contrato estável |
| Cobertura LATAM | Só Argentina (AFIP) | Cobertura multi-país LATAM |
| Estabilidade | Frágil: depende do HTML/sessão da AFIP, CAPTCHAs, manutenções | Estável: o contrato não depende de um site externo |
| Persistência de dados | Variável; alguns vendors fazem cache | Não persiste PII |
| Dados do contribuinte real | Sim — vem da AFIP | Não — só confirma estrutura do número |
| Buyer típico | Times AR que precisam de dados do contribuinte real | Times que precisam validar formato sem depender da AFIP |
Quando usar cada um?
- Você precisa do nome real do contribuinte, não só a confirmação de que o CUIT está bem formado.
- Você precisa verificar condição frente ao IVA, monotributo ou categoria fiscal.
- Você precisa da atividade econômica registrada (códigos AFIP).
- Você aceita a fragilidade do scraping e vai lidar com retries, fallbacks e outages quando a AFIP muda o site.
- Você só precisa confirmar que o CUIT é estruturalmente válido (Mod-11, prefixo, tamanho).
- Você não quer depender da disponibilidade do site da AFIP no seu hot path.
- Você precisa validar tax IDs de vários países LATAM num único endpoint, não só Argentina.
- Você quer um contrato JSON estável que não quebra quando a AFIP redesenha o HTML.
O problema de scrapear a AFIP
O site da AFIP não tem API pública estável. Os scrapers leem HTML, mantêm sessões autenticadas, contornam CAPTCHAs e rate limits. Quando a AFIP muda o frontend ou faz manutenção, todos os scrapers quebram ao mesmo tempo. Alguns vendors mantêm scrapers profissionalmente e absorvem esse custo, mas a fragilidade do fundamento não desaparece — só se transfere para o vendor. O Normadata não tem esse problema porque não toca a AFIP: o algoritmo Mod-11 é matemática pura.
Quando o scraper ganha sem discussão
Se seu requisito é regulatório ou financeiro — você precisa confirmar que um CUIT existe na AFIP, conhecer a condição fiscal, validar a razão social registrada — o Normadata não basta. O algoritmo Mod-11 diz se o número está bem formado, não se pertence a alguém real nem a quem. Para essa pergunta você precisa da fonte oficial, e a fonte oficial é AFIP. Você aceita a fragilidade porque não há alternativa.
O padrão saudável: pré-validar com Normadata, depois scrapear
Toda chamada ao scraper da AFIP que recebe um CUIT mal formado é tempo perdido e risco extra de bloqueio de sessão. O Normadata filtra esses inputs no frontend em < 50 ms — o scraper da AFIP só é invocado quando o CUIT passou Mod-11. Resultado: menos chamadas à AFIP, menos pressão sobre sua sessão, melhor UX para o usuário que digita errado e recebe o erro antes do submit.
O Normadata não consulta AFIP. Não devolve nome, razão social, condição IVA, monotributo nem atividade. Se você precisa desses dados, precisa de um AFIP scraper ou do padrón. O Normadata cobre a camada estrutural — confirmar que o número está bem formado antes de gastar a consulta cara.
Perguntas frequentes
O Normadata pode substituir um AFIP scraper?
Não para o caso de uso onde você precisa de dados do contribuinte real. Sim para o caso onde você só precisa confirmar que o CUIT está estruturalmente bem formado.
Quando faz sentido usar ambos?
Quando você quer filtrar formato malformado antes de gastar o scraper. O Normadata pré-valida no frontend; o scraper só roda quando o CUIT passa Mod-11. Reduz chamadas à AFIP e pressão de sessão.
Qual é mais barato?
Depende. Um scraper DIY é grátis em pricing mas caro em manutenção; um vendor de scraper cobra por consulta. O Normadata ainda não tem pricing público. A pergunta certa é o custo total quando a AFIP muda o HTML.
Onde o AFIP scraper ganha do Normadata?
Em tudo que requer fonte oficial: nome real, condição IVA, monotributo, atividade, razão social. O Normadata não compete aí.