Este repositório contém uma análise exploratória e visualizações que relacionam indicadores de comprometimento/empenho (VALOREMPENHO) ao Produto Interno Bruto (PIB) em nível de município. A análise foi implementada em um Jupyter Notebook (fvm_empenho_pib.ipynb) e utiliza o conjunto de dados dados.csv.
fvm_empenho_pib.ipynb— Notebook Jupyter com o processo de leitura dos dados, tratamento (limpeza/transformação), análises e visualizações.dados.csv— Conjunto de dados usado pelo notebook. Delimitador: ponto-e-vírgula (;).requirements.txt— Dependências Python necessárias para reproduzir a análise..gitignore— Arquivos/padrões ignorados pelo git.
- O arquivo lido inicialmente tem 187 linhas e 4 colunas (shape: 187 x 4).
- Não foram encontrados valores nulos nas colunas analisadas.
- Foram identificadas entradas duplicadas pelo campo
CODIGOe, no notebook, essas duplicatas foram descartadas. Após a remoção de duplicatas porCODIGO, o dataset final utilizado possui 172 registros (municípios únicos conforme esse critério). - Unidade: os valores de
PIBe deVALOREMPENHOestão expressos em reais (R$).
-
CODIGO
- Tipo: inteiro
- Descrição: código identificador do município. Observação: há duplicatas no arquivo original; no notebook essas duplicatas foram removidas por
CODIGO(mantendo um registro por código). - Exemplo:
106,113,118
-
MUNICIPIO
- Tipo: texto (string)
- Descrição: nome do município.
- Exemplo:
SANTANA DO LIVRAMENTO,SANTO ANGELO
-
PIB
- Tipo: numérico (float)
- Unidade: Reais (R$)
- Descrição: Produto Interno Bruto do município (valor monetário).
- Exemplo:
12240.76(R$ 12.240,76)
-
VALOREMPENHO
- Tipo: numérico (float)
- Unidade: Reais (R$)
- Descrição: valor de empenho do município (montante comprometido do orçamento).
- Exemplo:
1088666.10(R$ 1.088.666,10)
O notebook realiza a leitura do CSV, limpeza básica e uma série de análises visuais. Abaixo está o sumário detalhado das células e das análises/figuras presentes:
-
Introdução e contextualização
- Texto explicativo sobre o que representam PIB e valor de empenho e por que analisar a relação entre ambos.
-
Importação de bibliotecas
- pandas, seaborn, statistics, matplotlib.pyplot (configuração básica de visualização).
-
Leitura do arquivo
dataset = pd.read_csv('dados.csv', sep=';')- Exibição das primeiras linhas (
dataset.head()). - Verificação do shape original (187 linhas x 4 colunas).
-
Verificações iniciais
dataset.info()— confirma tipos de dados.dataset.isnull().sum()— nenhum valor nulo identificado.dataset.duplicated('CODIGO').sum()— identificação de duplicatas porCODIGO.
-
Tratamento de duplicatas
- Remoção de duplicatas por
CODIGOcomdataset = dataset.drop_duplicates('CODIGO'). - Após tratamento, o dataset final utilizado no notebook contém 172 registros únicos.
- Remoção de duplicatas por
-
Estatísticas descritivas
dataset.describe()— resumo estatístico das colunas numéricas:- Contagem (count), média (mean), desvio padrão (std), min/max e quartis para
PIBeVALOREMPENHO. - Exemplos observados: média do PIB ~ R$ 19.888,32; média do VALOREMPENHO ~ R$ 132.368,57; valores mínimos (PIB ~ R$ 8.236,63; VALOREMPENHO ~ R$ 172,13) e máximos (PIB ~ R$ 223.848,22; VALOREMPENHO ~ R$ 1.442.759,82).
- Contagem (count), média (mean), desvio padrão (std), min/max e quartis para
-
Análises visuais e figuras
- Dispersão entre PIB e Valor de Empenho por Município
- Gráfico de dispersão mostrando a relação entre PIB (eixo X) e VALOREMPENHO (eixo Y). Pode incluir observação de tendência geral e identificação de outliers.
- Distribuição do PIB dos Municípios
- Histograma / KDE exibindo a distribuição dos valores de PIB entre os municípios.
- Boxplot do PIB dos Municípios
- Boxplot para avaliar assimetria e outliers do PIB.
- Relação dos 10 Municípios com Menor PIB e dos 10 Municípios com Maior PIB
- Listagem/tabela e gráficos (barras) mostrando top 10 e bottom 10 municípios por PIB.
- Distribuição do Valor de Empenho dos Municípios
- Histograma / KDE para VALOREMPENHO.
- Boxplot do Valor de Empenho dos Municípios
- Boxplot para VALOREMPENHO evidenciando dispersão e possíveis outliers.
- Relação dos 10 Municípios com Menor Valor de Empenho e dos 10 Municípios com Maior Valor de Empenho
- Listagem/tabela e gráficos (barras) mostrando top 10 e bottom 10 por VALOREMPENHO.
- Comparação entre os 10 Municípios com Menor Valor de Empenho e PIB e os 10 Municípios com Maior Valor de Empenho e PIB
- Visualização comparativa (ex.: grupos de barras ou múltiplos painéis) contrastando os 10 municípios com menores valores frente aos 10 com maiores, em termos de ambos os indicadores.
- Dispersão entre PIB e Valor de Empenho por Município
-
Conclusões e observações finais
- Interpretações sobre correlação/associação entre PIB e VALOREMPENHO, identificação de municípios fora da tendência (potenciais outliers) e recomendações para investigações futuras.
-
Clone o repositório:
git clone https://github.com/cllmenate/pib-commitment-value-cities-data-visualization-python-notebook.gitcd pib-commitment-value-cities-data-visualization-python-notebook
-
Crie e ative um ambiente virtual (recomendado):
python -m venv venvsource venv/bin/activate# macOS / Linuxvenv\Scripts\activate# Windows
-
Instale as dependências:
pip install -r requirements.txt
-
Abra o Jupyter Notebook:
jupyter notebook fvm_empenho_pib.ipynb- Execute as células em ordem. O notebook realiza leitura de
dados.csve produz as análises/figuras listadas.
- Adicionar exportação automática de figuras e de rankings em CSV/HTML.
- Criar um dicionário de dados mais completo (fonte, periodicidade, unidades) em
DATA_DICTIONARY.md. - Se for do interesse, transformar as visualizações em um dashboard interativo (Plotly Dash ou Streamlit).
Atualmente, o repositório não contém um arquivo LICENSE.
Para dúvidas ou contribuições, abra uma issue no repositório ou contacte o mantenedor.