CP CursosPublicos

Metodologia

Última execução do pipeline: 2026-04-20.

1. Coleta

2. Normalização

3. Validação (QUALITY GATE)

Cada entidade passa por validação automática antes de virar página publicada:

Entidades reprovadas vão para data/rejected/ com motivo, sem página publicada.

4. Publicação progressiva (rollout)

Indexação controlada para preservar sinal de crescimento orgânico:

5. Reindexação e correção

Pipeline roda semanalmente via GitHub Actions (.github/workflows/refresh.yml). Páginas com queda prolongada em impressões no Search Console são movidas para content/review/ para reescrita humana. Páginas com dados corrompidos ou fonte revogada são despublicadas imediatamente.

6. Limites honestos

7. Estatísticas da última execução do pipeline

MétricaValor
Última execução2026-04-20
IES catalogadas15
Cursos de graduação validados65
Áreas do conhecimento11
Cursos com Conceito Enade registrado65 (100% do total)
Cursos com corte SISU 2025 registrado54
Cursos com CC (visita in loco)65

Em cada execução semanal (segundas, 03h BRT, GitHub Actions), o pipeline tenta atualizar o dataset a partir das fontes primárias. Registros que falham a validação são gravados em data/rejected/ com motivo — transparência interna para detectar regressões no dado do INEP ou MEC.

8. Auditoria e correções humanas

A validação descrita na seção 3 é automática. A auditoria editorial (originalidade vs top 10 Google, ausência de cheiro de IA, densidade de dados) é humana, periódica, e documentada publicamente em AUDIT_REPORT.md no repositório do projeto.

SLA de correção: se você identificou um número divergente da fonte oficial, escreva pelo contato com a URL da página e a fonte comprovada do valor correto. Correções entram em até 7 dias úteis. Páginas com erro factual grave são despublicadas imediatamente (404) até serem corrigidas.

9. Onde o dado está