A International Love Data Week é assinalada de 13 a 17 de fevereiro.
A Love Data Week procura motivar a utilização dos dados para fazer mudanças importantes. Mudanças de políticas, culturais, ambientais, sociais...
Podemos mover montanhas com os dados certos para tomar decisões. Este ano, daremos destaque a boas práticas relativas a gestão e disponibilização de dados de investigação.
A Love Data Week é uma iniciativa promovida pelo ICPSR - Inter-university Consortium for Political and Social Research
O tema deste ano é “Dados: Agentes de Mudança”.
O que é a Love Data Week?
Love Data Week is an international celebration of data, taking place every year during the week of Valentine's day. Universities, nonprofit organizations, government agencies, corporations and individuals are encouraged to host and participate in data-related events and activities.
Dia 17 de fevereiro de 2023 | Repositórios de Dados
Os Repositórios de Dados armazenam e garantem a preservação a longo prazo dos dados resultantes de projetos de investigação científica, que suportam e validam as conclusões apresentadas nas publicações.
A escolha de um repositório para depositar dados de investigação deve levar em conta questões como: a finalidade do depósito, o tipo de dados e a área científica, o tipo de acesso que será atribuído e, principalmente, a fiabilidade do repositório.
Em geral, se o depósito é feito com a finalidade de cumprir requisitos de um financiador ou instituição de investigação, é comum que a própria entidade indique em qual repositório o depósito deve ser feito. Como muitas instituições ainda não possuem repositórios de dados próprios, é comum que sejam indicados repositórios generalistas, como o Zenodo, que pode conhecer melhor aqui.
Existem diversos repositórios temáticos que abrigam dados provenientes de áreas científicas específicas e, por essa razão, são fontes de recurso já bastante conhecidas dos investigadores. Estes repositórios têm a importante vantagem de aumentar a visibilidade da investigação. O re3data é um diretório de repositórios de dados onde podem ser encontrados repositórios confiáveis.
O CoreTrustSeal certifica repositórios confiáveis usando um conjunto de requisitos bastante exigente e, por esta razão, esta certificação não deve ser o único critério de seleção pois, um repositório, não certificado com este selo, pode igualmente cumprir com os requisitos necessários de confiabilidade e credibilidade, tais como, licenciamento, integridade e autenticidade dos dados, termos de uso, entre outros. Pode ler um pouco mais sobre isso aqui.
Quer ler mais sobre esse assunto?
Dia 16 de fevereiro de 2023 | Como preparar dados de investigação para depositar em repositórios
Os conjuntos de dados (datasets) depositados têm uma descrição, o que permite conhecer a sua existência e tipologia de dados, independentemente de estarem abertos ou fechados.
Os dados podem ser bastante variados na tipologia, formatos e dimensão… Essa multiplicidade requer alguma atenção para garantir a longevidade, a interoperabilidade e a (re)utilização destes dados.
Fazer um Plano de Gestão de Dados, no início da investigação, pode evitar problemas no momento de depósito, se houver o cuidado de definir: que conjuntos de dados serão disponibilizados para reuso, qual será o tipo de licença aplicado, etc.
Em muitos casos os dados não se bastam, ou seja, no momento do depósito, para que possam ser corretamente reutilizados, os dados podem precisar estar acompanhados de elementos que expliquem como foram recolhidos ou gerados, como foram utilizados, como estão organizados, como devem ser lidos… Enfim, um conjunto robusto de metadados e documentação como, por exemplo, um ficheiro readme.
Uma questão importante a considerar, antes do depósito dos dados, é a autoria e/ou propriedade dos dados: todos os envolvidos no processo de criação ou recolha devem estar cientes e de acordo com a disponibilização e somente os detentores ou responsáveis pelos dados é que devem proceder ao depósito. Dados sensíveis, se devidamente anonimizados, podem ser depositados e tornados públicos.
Quer ler mais sobre esse assunto?
Depositar os dados de investigação em repositório de dados beneficia tanto o investigador quanto toda a comunidade científica. As razões para o fazer são diversas, mas estas 10 vão desde o desejo de contribuir para uma ciência mais inclusiva, transparente e aberta até ao cumprimento de requisitos de financiadores.
Os dados de investigação fundamentam e validam os resultados de uma investigação, mas também podem ser reutilizados noutras investigações, total ou parcialmente, no mesmo ou em outro contexto (noutros países ou noutras áreas científicas, por exemplo). Por esta razão, a sua disponibilização tão aberta quanto possível, tão fechada quanto necessária é muito importante, especialmente na promoção de uma cultura científica mais aberta e colaborativa.
Dia 14 de fevereiro de 2023 | Gestão de Dados de Investigação
O processo conhecido como “Gestão de Dados de Investigação” (GDI) corresponde ao planeamento e tratamento dos dados recolhidos, obtidos, gerados e analisados no decorrer da investigação com a finalidade de, posteriormente, os partilhar de forma tão aberta quanto possível, tão fechada quanto necessária, e preservá-los.
A GDI deve começar antes mesmo da investigação, com o Plano de Gestão de Dados, e decorre ao longo do processo de investigação através de atividades como: escolha de formatos adequados (preferencialmente não proprietários) para a salvaguarda dos ficheiros de dados, nomeação clara e unívoca destes ficheiros para que os mesmos possam ser facilmente identificados; acompanhamento e identificação das diferentes versões; armazenamento em local apropriado, realização de backups e controle do acesso aos dados; transformação, quando necessária (anonimização, digitalização, tradução…).
Se feita corretamente e desde o início, a GDI pode economizar muito tempo e prevenir aborrecimentos no final do projeto, como, por exemplo, no momento de preparar os dados para uma publicação.
É preciso ter em mente que os dados assumem muitas formas (medições, números, imagens, textos, vídeos, áudios…) e, por esta razão, é necessário que sejam seguidos alguns critérios relativamente a como guardá-los, tanto no que diz respeito a escolha dos formatos, quanto à nomeação dos ficheiros e ao local onde serão armazenados.
Os dados são fundamentais para a validação dos resultados de uma investigação e têm grande potencial de reuso e citação por terceiros, por esta razão é muito importante que se tenha atenção aos Princípios FAIR, ou seja, que se procure tornar os dados o mais localizáveis, acessíveis, interoperáveis e reutilizáveis possível. Pode saber mais sobre isso aqui.
A GDI deve ser feita, maioritariamente, pelos responsáveis pela obtenção primária dos dados, ou seja, os próprios investigadores e deve ser realizada de acordo com as diretrizes dos financiadores e/ou das respetivas instituições de investigação.
Em Portugal, há um grupo de investigadores, cientistas e gestores de dados, bibliotecários e outros interessados que se reúnem para discutir questões sobre a GDI: o Fórum GDI, do qual também pode fazer parte.
Quer ler mais sobre esse assunto?
Dia 13 de fevereiro de 2023 | Planos de Gestão de Dados
Antecipar a forma como os dados de uma investigação serão recolhidos, geridos, tratados e preservados pode ser feito por meio de um Plano de Gestão de Dados (PGD). Esta prática, que é o ponto de partida para a boa gestão dos dados de investigação, também tem impacto na visibilidade final da investigação: dados tão abertos quanto possível, tão fechados quanto necessário, contribuem para a avaliação e a validação do estudo.
Um PGD é um documento formal que descreve todo o processo de recolha, tratamento, análise, curadoria, armazenamento e preservação dos dados de uma investigação, com o objetivo de fomentar o planeamento e servir de referência durante a execução de atividades de gestão de dados. Por essa razão, têm o poder de antecipar as necessidades e requisitos ao longo de um projeto de investigação e devem descrever políticas e métodos que são aplicados aos dados durante as múltiplas etapas do ciclo de vida dos dados.
Os PGDs são atualmente recomendados por muitas agências de financiamento, como a Fundação para Ciência e Tecnologia, porém a tendência é que, em breve, passem a ser elementos obrigatórios nos projetos de investigação, como é o caso do programa Horizonte Europa.
No programa europeu, é requerido que no momento da candidatura seja entregue um PGD mais resumido e, posteriormente, os projetos selecionados para financiamento são obrigados a fornecer um PGD detalhado no prazo de 6 meses a partir da data de assinatura da concessão.
Como forma de responder à necessidade de uma ferramenta para a criação de PGDs em consonância com os requisitos de cada financiador, o OpenAIRE e a EUDAT, infraestrutura europeia para a gestão de dados, desenvolveram o Argos.
O Argos cria PGDs legíveis por máquina e configuráveis de acordo com o modelo de diversas agências de financiamento, duas das razões pelas quais, recentemente, após um estudo conduzido pela FCCN, passou a ser recomendado pela Fundação para a Ciência e a Tecnologia para os planos dos projetos que financia.
No próximo dia 16 (quarta-feira) o GT “Formação e competências para Gestão e Dados FAIR” do Fórum GDI apresenta o Data Talk: “Planos de Gestão de Dados Acionáveis por Máquina (maDMP)” a partir das 14h30 via zoom. Inscrições aqui.
Quer ler mais sobre esse assunto?
Comentários
Enviar um comentário