Normadata · Data Quality API

Pré-validação vs consulta governamental

A pré-validação é o filtro barato. A consulta governamental é a fonte autoritativa. Rodam em sequência, não em competição.

TL;DR

A pré-validação (Normadata) roda em milissegundos, custa pouco, rejeita inputs obviamente inválidos — comprimento incorreto, classe de caracteres incorreta, dígito verificador incorreto. A consulta governamental fala com o registro oficial (AFIP, Receita Federal, SII, DIAN, SUNAT, etc.) e devolve existência + dados de entidade autoritativos. A pré-validação protege a camada governamental do desperdício e protege seu orçamento de latência. São sequenciais.

Comparação rápida

AspectoPré-validação (Normadata)Consulta governamental
EscopoForma + dígito verificador + normalizaçãoExistência + dados de entidade
Cobertura LATAMCobertura multi-país, uma única APIUm registro por país
Consulta governamentalNãoSim
Verificação de identidadeNãoNão (apenas dados de entidade)
Formato da respostaEnvelope Normadata estávelFormato por registro
Modelo de preçoPor chamada à APIVaria — cota, pago, ou definido pelo registro
Perfil de latênciaRápida e previsívelVariável, depende do registro
Posição no fluxoPrimeiro filtroPasso autoritativo

Quando usar cada um?

Quando usar o Normadata (pré-validação)
  • Bloquear input malformado na borda da sua API antes de gastar cota de consulta governamental.
  • Um único contrato em múltiplos países da LATAM em vez de uma integração por registro.
  • Latência previsível para os 80–95% dos casos que não precisam da fonte oficial.
  • Reservar sua cota de consulta governamental para inputs que de fato têm chance de existir.
Quando usar consulta governamental
  • Você precisa de existência autoritativa ("este CNPJ está realmente cadastrado hoje?").
  • Você precisa de dados de entidade — razão social, situação fiscal, endereço.
  • Um fluxo regulado exige.
  • Você consegue absorver a latência, cota e uptime do registro.

O que cada camada faz

Pré-validação (Normadata): uma verificação rápida e determinística sobre o próprio identificador. Forma, classe de caracteres, dígito verificador. Latência típica sub-30 ms. Sem dependência externa. Consulta governamental: uma consulta à fonte oficial. Devolve existência, nome da entidade, situação, às vezes endereço fiscal. O contrato pertence ao registro governamental, não a nós.

Onde não competem

A pré-validação não diz nada sobre se o ID existe. A consulta governamental não diz nada sobre se o input estava bem formado antes. Pré-validação = contrato estável controlado pelo vendor; consulta governamental = muda quando o registro muda. Pré-validação = uniforme em toda a LATAM; consulta governamental = por país por definição. São camadas diferentes do mesmo fluxo.

O padrão em produção: em série, não em paralelo

Passo 1: o Normadata pré-valida o identificador. Se forma, comprimento ou dígito verificador falhar, você retorna erro antes de tocar o registro oficial. Passo 2: somente se o input é estruturalmente válido, você faz a consulta governamental para confirmar existência e trazer dados de entidade. Resultado: menos cota consumida no registro, latência previsível na maioria dos requests e separação limpa de responsabilidades.

Exemplos de código

Duas camadas, nesta ordem
# Same input. Two layers, run in this order.

# 1) Pre-validation — Normadata (batch)
curl -X POST https://api.normadata.io/v1/validate/tax-ids \
  -H "X-API-Key: nd_..." \
  -d '{"items": [{"id": "1", "value": "20-12345678-9", "country": "AR"}]}'
# -> { "results": [{ "id": "1", "valid": true, "type": "cuit", "country": "AR", "normalized": "20123456789", "formatted": "20-12345678-9" }] }

# 2) Government lookup — AFIP (or a scraper)
# -> { "estado": "ACTIVO", "razonSocial": "...", "domicilio": {...} }
Limitações

O Normadata é a camada de pré-validação: forma, dígito verificador, normalização. Não consulta a Receita Federal, AFIP, SII, DIAN, SUNAT nem nenhum outro registro oficial. A consulta governamental é uma preocupação separada — use os serviços oficiais ou um scraper específico para cada registro. O Normadata ainda está em acesso antecipado e não expõe dados de entidade.

Perguntas frequentes

Por que pagar por duas camadas?

Porque pular a pré-validação te faz pagar custos de consulta governamental sobre input lixo. Pular a consulta governamental te faz confiar em dados de entidade não verificados. Cada camada faz um trabalho diferente.

O Normadata fala com AFIP / Receita?

Não. O Normadata é a camada de pré-validação. As consultas governamentais continuam sendo uma preocupação separada — use os serviços oficiais ou um scraper específico para cada registro.

Que porcentagem de requests costuma falhar na pré-validação?

Depende do seu funnel. Formulários públicos veem taxas significativas de input malformado (10-25%); dados de back-office ou pré-limpos veem bem menos. A pré-validação filtra antes que o custo da camada autoritativa dispare.