Metodologia · IEE v0

Como o IEE é calculado

O IEE — Índice de Estresse de Escoamento — é um score semanal de 0 a 100 por corredor de exportação. Esta página documenta a definição formal, as escolhas de normalização, os pesos declarados e o plano de calibração pré-registrado.

Definição formal

IEE = Σ wₖ · Pₖ

Cada componente k (frete spot, fila no porto, janela de embarque e, no Arco Norte, hidrologia) é convertido em um percentil sazonal Pₖ de 0 a 100. O IEE do corredor é a média ponderada desses percentis, com pesos wₖ ≥ 0 e Σwₖ = 1. Componentes em que subir significa aliviar (dias até o calado de 11 m) entram com sinal invertido, de modo que percentil alto sempre significa mais estresse.

Normalização por percentil sazonal

O valor corrente de cada componente é comparado apenas com as mesmas semanas do calendário nas safras anteriores — janela de ±2 semanas em torno da semana corrente, com mínimo de 3 safras (15 observações). O percentil empírico usa midrank: P = 100·(n_abaixo + 0,5·n_iguais)/n. Isso remove a sazonalidade da safra: um frete alto em março só conta como estresse se for alto para um março.

Onde o histórico ainda é curto, o índice cai para um z robusto (mediana/MAD, com fator de consistência 1,4826) mapeado para 0–100 via Φ(z) — e o componente é rotulado "calibração em construção" até completar 3 safras.

Pesos v0 — declarados como julgamento

Os pesos abaixo NÃO são calibrados: são julgamento do Observatório sobre a importância relativa de cada sinal em cada corredor, declarados para escrutínio público. Eles permanecem fixos até que o plano de calibração abaixo produza algo comprovadamente melhor.

CorredorF · Fila no portoT · Custo da rotaS · Pressão de safraH · Risco de calado
Santos0,400,350,25
Paranaguá0,400,350,25
Arco Norte0,350,250,200,20

Σ = 1 por corredor. No Arco Norte, a hidrologia entra porque a janela de calado condiciona a logística de barcaças da calha.

Faixas de leitura

Fluido025
Atenção2550
Pressão5075
Crítico75100

Plano de calibração — pré-registrado

  1. 1Alvo: o IEE da semana t deve prever o tempo médio de espera no line-up em t+2.
  2. 2Restrições: pesos wₖ ≥ 0 com Σwₖ = 1 (sem short em componente).
  3. 3Critério de substituição: os pesos calibrados só substituem os v0 se reduzirem o MAE out-of-sample em validação walk-forward (treina no passado, testa no futuro, janela deslizante).
  4. 4Sem critério atingido, os pesos v0 declarados permanecem — transparência acima de sofisticação.

IEE+3 — faixa de cenários, não intervalo de confiança

A projeção de três semanas propaga a tendência recente dos percentis de cada componente (drift das últimas 4 semanas) e abre uma faixa min–max a partir da volatilidade observada. É uma leitura de cenários — "se o frete acelerar, se a fila ceder" — e não um intervalo de confiança estatístico. A banda responde à pergunta operacional: entre quais leituras o corredor deve transitar?

Componente S — pressão de safra (dado real)

S mede o excedente de campo da hinterlândia de Santos (SP, MG, GO, MS e MT — MT inteiro como aproximação do MT-sul, declarada): volume colhido de soja e milho (Conab, Progresso de Safra semanal × produção por UF do Acompanhamento da Safra) menos o já embarcado, normalizado pela capacidade semanal de embarque do porto. O resultado é lido em "semanas de capacidade" e convertido em percentil sazonal.

Enquanto o embarcado acumulado real da ANTAQ não entra (PASSO 2), o já embarcado usa um proxy declarado: capacidade semanal × semanas desde o início do escoamento × fator de utilização (0,7). O denominador de capacidade é ÚNICO para F e S: a média móvel de 12 meses do granel sólido vegetal embarcado em cada corredor, agregada da Estatística Aquaviária da ANTAQ (espelho parquet do IBI); na ausência do cache, vale o parâmetro declarado — nunca duas verdades.

Fonte: Conab — Progresso de Safra / Acompanhamento da Safra (licença CC Atribuição-SemDerivações 3.0; uso sem fins lucrativos com citação). Onde o histórico tem menos de 3 safras, o percentil cai para z robusto (mediana/MAD) rotulado "calibração em construção".

Componente T — custo rodoviário modelado (não é frete de mercado)

T é o CUSTO operacional de rodar a rota (R$/t), calculado pela engine própria do Observatório com a estrutura clássica das metodologias públicas de custeio rodoviário de carga (custos fixos rateados por km, variáveis por km, combustível, pedágio por eixo, capacidade do veículo — cf. referenciais ANTT/literatura de custeio do TRC). T NÃO é o frete negociado no mercado: a premissa do IEE é que, no pico da safra, o custo sobe (diesel, distância, perfil de veículo) e o frete acompanha — T captura a componente de custo desse aperto.

Todos os coeficientes (consumo, pneus, manutenção, custo fixo mensal, km/mês, pedágio por eixo, retorno vazio) são premissas IBI declaradas e versionadas em lib/iee-params.ts — nenhum deriva de série proprietária. Único insumo externo: preço do diesel S10 (ANP, Levantamento de Preços de Combustíveis, série semanal Brasil), citado no card com a data do dado. Decisão registrada: o diesel NÃO é deflacionado — aqui T é custo e o diesel é insumo legítimo dele.

Quando houver convênio de dados de frete praticado, T poderá ser cruzado e validado contra série de mercado — até lá, permanece rotulado como custo modelado.

Componente H — risco hidrológico do canal Tabocal (Arco Norte)

H combina dois sinais DIRETOS (alto = pior): 60% do IRC-Tabocal v3.6 — o score operacional de risco de calado do canal (0–100), com pesos calibrados contra 20 eventos rotulados (Spearman 0,62) e piso dominador quando o déficit de calado é severo — e 40% de urgência de calado: a contagem de dias até o CMR cair abaixo de 11 m, saturando em 90 dias.

A contagem de dias usa a recessão exponencial de Itacoatiara calibrada em 2016–2023 (RMSE ~2,6 m na cota, suficiente porque o objetivo é a DATA de cruzamento, não a cota ponto a ponto), convertida em calado pela curva CMR isotônica calibrada com 187 observações da Capitania dos Portos/AM (extrapolação Theil-Sen 0,80 m de CMR por m de cota). Nada disso é recalculado na vertical: tudo importa das libs hidrológicas do Monitor.

Os pesos internos 60/40 do H são julgamento v0 declarado (iee-params), na mesma régua dos demais pilares: ficam fixos até a calibração pré-registrada indicar algo comprovadamente melhor. Onde a série tem menos de 3 safras, vale o z robusto rotulado "calibração em construção".

Pré-registro v0 — compromissos públicos

Os parâmetros do IEE estão congelados em um pré-registro versionado (data/agro/pre-registro-iee-v0.json), com hash SHA-256 do snapshot canônico. Qualquer mudança de parâmetro exige novo pré-registro com diff e justificativa — a verificação de integridade roda junto do backtest e bloqueia publicação em caso de drift.

Integridade: sha256 6f029f26b0afd7a2… · congelado em 11/06/2026

Compromissos

  1. 1Os pesos do IEE (F/T/S/H por corredor) e os pesos internos do H são JULGAMENTO v0 declarado e permanecem FIXOS até calibração pré-registrada.
  2. 2Critério de substituição: pesos calibrados (wₖ ≥ 0, Σwₖ = 1) só substituem os v0 se reduzirem o MAE out-of-sample em validação walk-forward contra a métrica-alvo.
  3. 3Métrica-alvo: o IEE da semana t deve prever o tempo médio de espera no line-up em t+2, medido pela TEsperaAtracacao da Estatística Aquaviária ANTAQ (atracações com grão embarcado). Baseline v1 (Spearman/MAE) registrado no backtest final.
  4. 4Nenhum coeficiente é ajustado retroativamente para 'encaixar' episódio. Episódio não acusado é reportado e bloqueia publicação da leitura retroativa, nunca corrigido por ajuste de peso.
  5. 5Percentis são walk-forward (sem lookahead); séries com menos de 3 safras usam z robusto (mediana/MAD) e carregam o rótulo 'calibração em construção' na interface.
  6. 6Toda mudança de parâmetro gera novo pré-registro versionado (hash novo), com diff e justificativa públicas.

Episódios-âncora e vereditos

out-2024-seca-tabocal2024-09-25 a 2024-11-15percentil walk-forward médio ≥ 90 e P_H bruto máx ≥ 80verificável — testado no backtest
mar-2026-choque-diesel2026-03-14 em dianteP_T = 100 a partir do salto ANP (R$ 6,15 → 7,58/L)verificável — testado no backtest
pico-safra-20262026-02 a 2026-05P_S ≥ 95 no pico da colheita de soja (Santos e Paranaguá)verificável — testado no backtest
dez-2025-fila-santos2025-12fila 100+ navios deve elevar P_FVERIFICADO CONTRA EA NO V1: espera ≈ média de 2025 — não confirmado como excepcional; substituído (ver out-2023)
out-2023-espera-recorde2023-08 a 2023-11≥4 das 5 maiores esperas da série EA 2016–2026 caem na janela (critério factual, sem limiar arbitrário)verificável — testado no backtest
jan-2025-salto-frete2025-01fora do alvo: T é CUSTO modelado, não frete negociadofora de escopo declarado

Vereditos recomputados a cada execução de scripts/backtest/iee-final.ts — nunca editados à mão.

Lacunas conhecidas (declaradas, nunca silenciadas)

  • F de Santos: REAL (esperados-carga APS/DIOPE) — fundeados/atracados sem mercadoria pública ficam fora da fila v1 (documentado).
  • F do Arco Norte: PARCIAL — EMAP + CDP; Miritituba/Santarém sem line-up público.
  • F sem retroativo em todos os corredores: histórico nasce em 10/06/2026.
  • Proxy de embarque do S: capacidade × utilização declarada até o acumulado ANTAQ real.
  • Denominadores de capacidade: ANTAQ EA real (média 12m até 2026-02); cadência de atualização manual junto do refresh do espelho parquet (dadosAte exposto no JSON).
  • MT inteiro nas hinterlândias de Santos E Arco Norte (proxy declarado; split municipal na v1).
  • Coeficientes de custeio do T: premissas IBI v0, sem validação contra frete praticado (aguarda convênio).

O que bloqueia publicação

  • Episódio-âncora verificável não acusado no backtest.
  • Drift de parâmetros sem novo pré-registro (verificação por hash).
  • Dado ilustrativo ou indisponível exibido sem rótulo na interface.

Estado dos dados

Santos: F real (line-up APS/DIOPE), S real (Conab) e T modelado — corredor completo desde o PASSO 2. Paranaguá: F real (APPA), S real, T modelado. Arco Norte: F real PARCIAL (EMAP + CDP; Miritituba/Santarém sem line-up público — lacuna rotulada, nunca silenciada), S real (hinterlândia MT·PA·TO·MA·PI·RO, MT inteiro como proxy de MT-norte), T modelado e H modelado sobre dados reais (IRC-Tabocal + recessão/CMR). Pilares com histórico < 3 safras carregam "calibração em construção".