Metodologia
Esta página documenta integralmente como os indicadores são produzidos, para permitir avaliação crítica e reprodução independente. Todo o processamento é feito por um único script aberto (scripts/pipeline_v2.py).
1. Fontes de dados
- Óbitos 2022–2024 — SIM/DataSUS, CSVs nacionais do OpenDataSUS (
DO22OPEN–DO24OPEN). - Óbitos 2015–2021 — SIM/DataSUS, arquivos
.dbcpor UF/ano do FTP oficial (SIM/CID10/DORES), convertidos com a biblioteca abertadatasus-dbc. Total da série: mais de 13 milhões de óbitos não fetais. - População total — IBGE: Estimativas anuais (SIDRA t/6579), Censo 2022 (t/4709); 2023 por interpolação linear Censo↔Estimativas 2024.
- População por idade — Censo 2022 (SIDRA t/9514), agregada em 8 faixas etárias por município.
- Malha municipal e cadastro — IBGE (APIs de localidades e malhas).
- Descrições CID-10 — tabela oficial
CID10.DBFdo FTP do SIM.
2. Critérios de inclusão e derivações
- Óbitos fetais excluídos (
TIPOBITO=1), convenção de mortalidade geral; - Município de residência do falecido (
CODMUNRES); - Causa básica truncada à categoria CID-10 de 3 caracteres; capítulos (I–XXII) pelas faixas oficiais;
- Idade decodificada do campo composto
IDADE(dígito 4 = anos; 5 = 100+; 0–3 = menor de 1 ano; demais = ignorada). Faixas: <1, 1–4, 5–14, 15–29, 30–44, 45–59, 60–74, 75+; - Local do óbito (
LOCOCOR): 1 = hospital; 3 = domicílio; - Dados de 2024 preliminares, sujeitos a revisão pelo MS.
3. Granularidade por período
Para caber em infraestrutura gratuita sem sacrificar o essencial, a base publica detalhe demográfico completo a partir de 2022 (capítulo × sexo × faixa etária) e, para 2015–2021, totais e marginais (por capítulo, por sexo e por faixa — sem cruzamentos entre eles). Os marts de causa (3 caracteres) e as séries mensais por UF cobrem todos os anos.
4. Taxa padronizada por idade
Método direto: a taxa específica de cada faixa etária do município é ponderada pela estrutura etária de uma população padrão — aqui, a do Brasil no Censo 2022. Isso remove o efeito da composição etária e torna municípios comparáveis (um município envelhecido não aparece "pior" só por ser envelhecido).
- Óbitos com idade ignorada são redistribuídos pro-rata entre as faixas conhecidas do mesmo município/ano;
- Para anos ≠ 2022, a população por faixa é a estrutura do Censo 2022 escalada pelo total municipal do ano (aproximação documentada — censos municipais por idade não existem anualmente);
- Calculada para o total de causas (capítulo = TOTAL, sexo = total).
5. Intervalos de confiança (IC95%)
A taxa bruta acompanha IC95% pelo método gamma (Poisson exato): limite inferior = qgamma(0,025; d)/pop, superior = qgamma(0,975; d+1)/pop. Em municípios pequenos o intervalo é largo — o painel sinaliza população < 10 mil hab. com ⚠ para evitar leituras indevidas de taxas instáveis.
6. Excesso de mortalidade
Para cada UF (e Brasil), o esperado do mês m do ano a é a média de óbitos do mesmo mês civil em 2015–2019, multiplicada pela razão entre a população de a e a população média 2015–2019. Excesso = observado − esperado. É um método transparente e replicável; não modela tendência secular nem sazonalidade além do mês civil (limitação declarada).
7. Validação automática
- Totais anuais conferidos contra os volumes oficiais do SIM (ex.: 2015 = 1.264.175; 2022 ≈ 1,54M);
- Subtotais (linhas TOTAL) conciliáveis com qualquer recorte da API;
- Perfil por capítulo compatível com a literatura (circulatórias > neoplasias > respiratórias);
- Checagens executadas também em CI (GitHub Actions) a cada atualização.
8. Limitações conhecidas
- Qualidade de registro e cobertura do SIM variam regionalmente e melhoraram ao longo do tempo — parte das tendências longas reflete melhora de captação;
- Garbage codes (ex.: R99) não são redistribuídos entre causas;
- A taxa padronizada usa estrutura etária fixa (Censo 2022) escalada — aproximação para anos distantes de 2022;
- O baseline do excesso não modela tendência de longo prazo;
- 2024 preliminar; revisões do MS alteram os números do último ano.
9. Privacidade
Nenhum microdado individual é publicado: o banco recebe apenas agregados (município × período × categoria), eliminando risco de reidentificação.