Skip to content

Dados do projeto CORDATA -Catálogo de Reúso de Dados Abertos

License

Notifications You must be signed in to change notification settings

cewebbr/cordata

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

202 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

CORDATA

O CORDATA - Catálogo Online de Reúso de Dados Abertos é um site que lista casos de uso de dados abertos. Você pode acessá-lo aqui: https://cordata.ceweb.br. Nesta página disponibilizamos os dados brutos coletados e os dados disponibilizados no site do projeto, além de códigos utilizados durante a catalogação ativa e algumas análises realizadas sobre os casos catalogados.

CORDATA - Catálogo Online de Reutilización de Datos Abiertos es un sitio web que enumera casos de uso de datos abiertos. Puedes acceder a él aquí: https://cordata.ceweb.br. En esta página ponemos a disposición los datos brutos recopilados y los datos disponibles en el sitio web del proyecto, así como los códigos utilizados durante la catalogación activa y algunos análisis realizados en los casos catalogados.

Estrutura do projeto:

.
├── README.md               <- Este documento
├── LICENSE                 <- Licença dos dados e códigos do projeto
├── requirements.txt        <- Principais pacotes de python necessários
├── codigo                  <- Web app interno de catalogação e gestão dos dados (CMS) 
├── dados                   <- Metadados sobre casos de uso 
|   ├── brutos              <- Metadados brutos, originais, vindos do formulário
|   ├── curados             <- Metadados originados do form manualmente corrigidos
|   └── limpos              <- Metadados limpos, corrigidos, padronizados
├── imagens                 <- Imagens representativas dos casos de uso
├── analises                <- Códigos de análise e limpeza dos dados (notebooks de python)
├── scripts                 <- Rotinas auxiliares
└── docs                    <- Documentos e registros

Sobre os metadados dos reúsos

Alguns metadados sobre reúsos foram informados pelo público em geral através do formulário do CORDATA. Nesses casos, os metadados são armazenados na sua forma bruta e posteriormente passam por uma curadoria do Ceweb.br. Os dados brutos, tais quais preenchidos no formulário do CORDATA, estão disponíveis na pasta dados/brutos. Os dados curados são versões dos dados brutos manualmente corrigidas, ainda no formato CSV. Ver dados/curados.

Outros metadados são registrados diretamente pela equipe do Ceweb.br. Nesses casos, o registro é feito através do Content Management System (CMS) disponibilizado em codigo, que resulta diretamente no formato final (JSON). Nesses casos, não há versões brutas ou curadas.

A versão limpa e enriquecida dos metadados coletados através do formulário, combinada com os registrados diretamente pela equipe do Ceweb.br, está em dados/limpos. São esses os dados que aparecem no site do CORDATA.

O código que faz a limpeza dos dados coletados através do formulário encontra-se disponível na pasta analises.

Contato

Para mais informações sobre o projeto, falar com Henrique S. Xavier (https://github.com/hsxavier).

About

Dados do projeto CORDATA -Catálogo de Reúso de Dados Abertos

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published