Central de Dados

Central de Dados

Este site ainda está em desenvolvimento; os recursos aqui contidos podem ser usados, mas poderão ser alterados ou corrigidos a qualquer momento.

A Central de Dados é um repositório aberto de datasets Open Data em Portugal. Os dados aqui publicados são provenientes de diversas fontes e estão sob a curadoria do Transparência Hackday e da Open Knowledge Portugal. O nosso objetivo é catalogar, afinar, complementar e publicar conjuntos de informação pública, para que possam ser reutilizados em visualizações, webapps, consultas e outros fins.

É possível seguir as novidades no Twitter!

A Central de Dados é uma ferramenta aberta e pública, e todo o código para ela criado está disponível segundo uma licença de software livre.

Perguntas & Respostas

Qual é a fiabilidade da informação que disponibilizam?

Nós esforçamo-nos para conseguir a melhor organização e consistência dos dados que obtemos. No entanto, podem ocorrer erros e inconsistências nos dados da fonte ou no seu processamento. Assim, não podemos oferecer qualquer garantia de fiabilidade (ou sequer da utilidade) dos dados aqui contidos, e recomendamos vivamente a consulta das fontes originais em qualquer contexto que exija um mínimo de rigor.

Em que formato estão disponíveis os dados?

Os datasets que disponibilizamos são publicados em CSV e JSON, seguindo a norma Tabular Data Package. A versão JSON é automaticamente gerada a partir do CSV, salvo menção em contrário na descrição da data package.

Os ficheiros nestes formatos podem ser abertos em qualquer editor de texto, mas o CSV será mais facilmente legível num editor de folhas de cálculo como o LibreOffice Calc, Google Spreadsheets ou Microsoft Excel. O formato JSON é mais indicado para bibliotecas de visualização (como o D3.js).

O que são data packages?

O formato data package foi desenvolvido pela Open Knowledge e representa uma excelente solução para o desafio de publicação de datasets em bruto. O site Frictionless Data explica extensivamente o porquê e os pormenores do formato data package.

Qual é o software que sustenta este site?

100% software livre e aberto!

O motor deste site chama-se Datacentral e foi desenvolvido especificamente para construir a Central de Dados. É um conjunto de scripts Python que operam sobre data packages alojadas em repositórios Git para construir um site HTML estático, que pode ser colocado em qualquer webserver e atualizado com cron jobs simples. O código-fonte deste site é software livre e está disponível segundo os termos copyleft da GNU General Public License.

Todo o código Python, HTML e CSS foi escrito usando os editores Gedit e Vim em portáteis a correr Debian GNU/Linux. O servidor que aloja o site corre o webserver Apache. O logo e elementos gráficos foram desenhados com papel, Gimp e Inkscape.

Mas já existe o dados.gov.pt e o Pordata, porquê mais um site?

O dados.gov.pt é um recurso fantástico ao qual recorremos frequentemente. A Central de Dados não procura ser uma alternativa, mas sim um complemento ao dados.gov.pt, contribuindo para um ecossistema de informação pública disponível livremente em formatos abertos.

O Pordata é um recurso interessante mas, infelizmente, não é aberto.