Perguntas & Respostas
Qual é a fiabilidade da informação que disponibilizam?
Nós esforçamo-nos para conseguir a melhor organização e consistência dos dados que obtemos. No entanto, podem ocorrer erros e inconsistências nos dados da fonte ou no seu processamento. Assim, não podemos oferecer qualquer garantia de fiabilidade (ou sequer da utilidade) dos dados aqui contidos, e recomendamos vivamente a consulta das fontes originais em qualquer contexto que exija um mínimo de rigor.
Em que formato estão disponíveis os dados?
Os datasets que disponibilizamos são publicados em CSV e JSON, seguindo a norma Tabular Data Package. A versão JSON é automaticamente gerada a partir do CSV, salvo menção em contrário na descrição da data package.
Os ficheiros nestes formatos podem ser abertos em qualquer editor de texto, mas o CSV será mais facilmente legível num editor de folhas de cálculo como o LibreOffice Calc, Google Spreadsheets ou Microsoft Excel. O formato JSON é mais indicado para bibliotecas de visualização (como o D3.js).
O que são data packages?
O formato data package foi desenvolvido pela Open Knowledge e representa uma excelente solução para o desafio de publicação de datasets em bruto. O site Frictionless Data explica extensivamente o porquê e os pormenores do formato data package.
Qual é o software que sustenta este site?
100% software livre e aberto!
O motor deste site chama-se Datacentral e foi desenvolvido especificamente para construir a Central de Dados. É um conjunto de scripts Python que operam sobre data packages alojadas em repositórios Git para construir um site HTML estático, que pode ser colocado em qualquer webserver e atualizado com cron jobs simples. O código-fonte deste site é software livre e está disponível segundo os termos copyleft da GNU General Public License.
Todo o código Python, HTML e CSS foi escrito usando os editores Gedit e Vim em portáteis a correr Debian GNU/Linux. O servidor que aloja o site corre o webserver Apache. O logo e elementos gráficos foram desenhados com papel, Gimp e Inkscape.
Mas já existe o dados.gov.pt e o Pordata, porquê mais um site?
O dados.gov.pt é um recurso fantástico ao qual recorremos frequentemente. A Central de Dados não procura ser uma alternativa, mas sim um complemento ao dados.gov.pt, contribuindo para um ecossistema de informação pública disponível livremente em formatos abertos.
O Pordata é um recurso interessante mas, infelizmente, não é aberto.
Como posso contribuir?
Há muitas formas de contribuir e ajudar a tornar a Central de Dados um recurso melhor!
Para quem gosta de dados e de fazer coisas bonitas com eles, convidámos todos os interessados a criar visualizações, análises e outras aplicações criativas. Pedimos a gentil inclusão da Central de Dados como fonte de dados, e temos todo o gosto em ajudar a divulgar os vários exemplos do que é possível fazer com dados.
Para quem gosta de usar Python para falar com os computadores, aceitamos todo o tipo de contributos no código do site! O software que faz mexer a Central é o Datacentral e o seu repositório vive no GitHub. Aceitamos pull requests e quaisquer sugestões e bugs no issue tracker.
Para quem puder dar uma mão a limpar CSV's e corrigir metadados, as várias fontes de dados precisam de quem as mantenha! Temos vários datasets, alguns deles ainda a precisar de algum trabalho, que podem ser "adotados" por quem quiser ajudar ao esforço de manter os dados fiéis e atuais.
É só contactar-nos e tratamos de explicar todo o processo -- é simples e divertido.
