📁 Ingestão de Dados Parametrizável

Este repositório contém um script Python minimalista e reutilizável, projetado para realizar a ingestão de dados de diferentes tipos de arquivos para um destino de forma parametrizável. A arquitetura foca na separação de configurações e na facilidade de automação, permitindo que o mesmo código seja usado para carregar diferentes conjuntos de dados em diferentes tabelas.

🚀 Tecnologias e Bibliotecas Utilizadas

O projeto utiliza o ecossistema Python, aproveitando bibliotecas essenciais para a Engenharia de Dados e automação de scripts.

Tecnologia/Biblioteca	Propósito no Projeto
Python	Linguagem principal para o desenvolvimento do script de ingestão.
`argparse` (Biblioteca Padrão)	Usado para criar uma Interface de Linha de Comando (CLI), permitindo que o usuário passe o caminho do arquivo e o nome da tabela como argumentos externos. Essencial para a parametrização.
`pandas`	Biblioteca fundamental para a manipulação e análise de dados. É a ferramenta ideal para ler os arquivos e prepará-los para a ingestão.
`os` (Biblioteca Padrão)	Usado para interagir com o sistema operacional, útil para manipulação de caminhos e verificação de arquivos.

🏗️ Arquitetura e Fluxo de Trabalho

A arquitetura deste script é baseada no princípio de Injeção de Dependência via Parâmetros, que facilita a automação e o deploy.

1. Parametrização para Reutilização

O ponto central da arquitetura é o módulo argparse. Em vez de fixar caminhos e nomes de tabela dentro do código (hardcoding), o script os recebe como parâmetros na linha de comando.

Vantagem: O mesmo arquivo Python (ingestao_data.py) pode ser usado para carregar dados em diferentes tabelas a partir de diferentes arquivos realizando poucas modificação no código-fonte. Isso o torna ideal para workflows orquestrados (como Airflow ou Prefect).

2. Fluxo de Execução (Simulado)

Inicialização: O script é executado, e o argparse coleta os valores fornecidos pelo usuário para --file_path e --table_name.
Execução da Função: A função ingestao_data() é chamada com os parâmetros coletados.
Processamento de Dados e Ingestão: Na prática, a função leria o arquivo com pandas e estabeleceria a conexão com o banco de dados (ex: PostgreSQL via sqlalchemy) para realizar o upload dos dados na tabela especificada.
Tratamento de Erros: O bloco try...except garante que falhas comuns, como a não localização do arquivo de origem (FileNotFoundError), sejam capturadas e tratadas.

Autor

⚙️ Como Utilizar

Para executar este script e iniciar a ingestão, você deve fornecer os dois parâmetros obrigatórios após o nome do arquivo.

Pré-requisitos

Certifique-se de ter as bibliotecas necessárias instaladas:

pandas

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
Script		Script
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

📁 Ingestão de Dados Parametrizável

🚀 Tecnologias e Bibliotecas Utilizadas

🏗️ Arquitetura e Fluxo de Trabalho

1. Parametrização para Reutilização

2. Fluxo de Execução (Simulado)

Autor

⚙️ Como Utilizar

Pré-requisitos

About

Uh oh!

Releases

Packages

Languages

License

JoseVF5/Ingest_Data

Folders and files

Latest commit

History

Repository files navigation

📁 Ingestão de Dados Parametrizável

🚀 Tecnologias e Bibliotecas Utilizadas

🏗️ Arquitetura e Fluxo de Trabalho

1. Parametrização para Reutilização

2. Fluxo de Execução (Simulado)

Autor

⚙️ Como Utilizar

Pré-requisitos

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages