Normadata · Data Quality API

Normadata vs. AFIP scrapers: contratos estáveis vs. scrapers que quebram

Os scrapers da AFIP trazem dados oficiais — quando funcionam. O Normadata valida estrutura sem depender do HTML do órgão.

TL;DR

Os scrapers da AFIP — próprios ou de terceiros — consultam o site oficial da Argentina e devolvem dados do contribuinte: nome, condição frente ao IVA, monotributo, atividades. Quando funcionam são a fonte mais próxima da verdade. O problema: a AFIP muda o site, adiciona CAPTCHAs, suspende sessões, mete manutenções surpresa. O Normadata não consulta AFIP: valida estrutura do CUIT com Mod-11 e regras de prefixo. Cobre uma camada distinta — a pergunta certa é qual cobre sua necessidade real.

Comparação rápida

AspectoAFIP scraperNormadata
Etapa do pipelineLookup de cadastro oficialValidação de estrutura do identificador
O que faz principalmenteDevolve nome, condição IVA, monotributo, atividade do CUIT na AFIPConfirma que o CUIT passa Mod-11, prefixo válido, formato correto
Modelo de pricingVariável: grátis se DIY, pago se usar vendorAcesso antecipado — sem pricing público
SDKsDepende do vendor; DIY = vocêREST + JSON, sem SDK
Estilo da APIScraping HTML / API não oficial / proxy de constanciaREST + JSON, contrato estável
Cobertura LATAMSó Argentina (AFIP)Cobertura multi-país LATAM
EstabilidadeFrágil: depende do HTML/sessão da AFIP, CAPTCHAs, manutençõesEstável: o contrato não depende de um site externo
Persistência de dadosVariável; alguns vendors fazem cacheNão persiste PII
Dados do contribuinte realSim — vem da AFIPNão — só confirma estrutura do número
Buyer típicoTimes AR que precisam de dados do contribuinte realTimes que precisam validar formato sem depender da AFIP

Quando usar cada um?

Quando você precisa de um AFIP scraper
  • Você precisa do nome real do contribuinte, não só a confirmação de que o CUIT está bem formado.
  • Você precisa verificar condição frente ao IVA, monotributo ou categoria fiscal.
  • Você precisa da atividade econômica registrada (códigos AFIP).
  • Você aceita a fragilidade do scraping e vai lidar com retries, fallbacks e outages quando a AFIP muda o site.
Quando o Normadata é suficiente
  • Você só precisa confirmar que o CUIT é estruturalmente válido (Mod-11, prefixo, tamanho).
  • Você não quer depender da disponibilidade do site da AFIP no seu hot path.
  • Você precisa validar tax IDs de vários países LATAM num único endpoint, não só Argentina.
  • Você quer um contrato JSON estável que não quebra quando a AFIP redesenha o HTML.

O problema de scrapear a AFIP

O site da AFIP não tem API pública estável. Os scrapers leem HTML, mantêm sessões autenticadas, contornam CAPTCHAs e rate limits. Quando a AFIP muda o frontend ou faz manutenção, todos os scrapers quebram ao mesmo tempo. Alguns vendors mantêm scrapers profissionalmente e absorvem esse custo, mas a fragilidade do fundamento não desaparece — só se transfere para o vendor. O Normadata não tem esse problema porque não toca a AFIP: o algoritmo Mod-11 é matemática pura.

Quando o scraper ganha sem discussão

Se seu requisito é regulatório ou financeiro — você precisa confirmar que um CUIT existe na AFIP, conhecer a condição fiscal, validar a razão social registrada — o Normadata não basta. O algoritmo Mod-11 diz se o número está bem formado, não se pertence a alguém real nem a quem. Para essa pergunta você precisa da fonte oficial, e a fonte oficial é AFIP. Você aceita a fragilidade porque não há alternativa.

O padrão saudável: pré-validar com Normadata, depois scrapear

Toda chamada ao scraper da AFIP que recebe um CUIT mal formado é tempo perdido e risco extra de bloqueio de sessão. O Normadata filtra esses inputs no frontend em < 50 ms — o scraper da AFIP só é invocado quando o CUIT passou Mod-11. Resultado: menos chamadas à AFIP, menos pressão sobre sua sessão, melhor UX para o usuário que digita errado e recebe o erro antes do submit.

Limitações

O Normadata não consulta AFIP. Não devolve nome, razão social, condição IVA, monotributo nem atividade. Se você precisa desses dados, precisa de um AFIP scraper ou do padrón. O Normadata cobre a camada estrutural — confirmar que o número está bem formado antes de gastar a consulta cara.

Perguntas frequentes

O Normadata pode substituir um AFIP scraper?

Não para o caso de uso onde você precisa de dados do contribuinte real. Sim para o caso onde você só precisa confirmar que o CUIT está estruturalmente bem formado.

Quando faz sentido usar ambos?

Quando você quer filtrar formato malformado antes de gastar o scraper. O Normadata pré-valida no frontend; o scraper só roda quando o CUIT passa Mod-11. Reduz chamadas à AFIP e pressão de sessão.

Qual é mais barato?

Depende. Um scraper DIY é grátis em pricing mas caro em manutenção; um vendor de scraper cobra por consulta. O Normadata ainda não tem pricing público. A pergunta certa é o custo total quando a AFIP muda o HTML.

Onde o AFIP scraper ganha do Normadata?

Em tudo que requer fonte oficial: nome real, condição IVA, monotributo, atividade, razão social. O Normadata não compete aí.