Glossário de curadoria de dados de pesquisa

Aqui está um glossário para termos e recursos frequentemente citados para a curadoria de dados de pesquisa. 

As informações aqui apresentadas foram obtidas da UC MERCED LIBRARY [1]

Arquivo:  Um arquivo de dados é um conjunto de materiais legíveis por máquina que são armazenados, preservados e possivelmente redistribuídos para indivíduos interessados ​​em usar os materiais. Colocar ou armazenar em um arquivo. ( ICPSR: Glossário de Termos de Ciências Sociais )

Arquivo README:  Um arquivo leia-me fornece informações sobre um arquivo de dados e destina-se a ajudar a garantir que os dados possam ser interpretados corretamente, por você mesmo posteriormente ou por outras pessoas ao compartilhar ou publicar dados. ( Cornell University Research Data Management Service Group ; Mais informações e exemplos de arquivos README podem ser encontrados aqui .)

Backup:  Uma cópia do(s) seu(s) arquivo(s) que pode servir para restaurá-los se sua cópia primária (ou computador, ou servidor) for destruída, corrompida ou roubada. Nota: backup e preservação/arquivamento não são a mesma coisa – só porque você tem uma cópia não significa que ela estará acessível a longo prazo. A boa prática é

  • faça backup de seus arquivos mais importantes regularmente (diariamente ou semanalmente, dependendo da frequência com que eles mudam),
  • mantenha pelo menos duas cópias de segurança,
  • preferencialmente em diferentes tipos de mídia (por exemplo, CD/DVD e disco rígido portátil ou servidor institucional), e
  • para armazenar as cópias de backup em um local diferente (ou seja, prédio ou até mesmo cidade) das versões ativas para proteger novamente contra incêndio, inundação ou roubo. ( Gestão de Dados da Universidade de Cambridge )

Born-Digital:  Materiais que eram digitais/eletrônicos em sua forma original em vez de digitalizados ou reinseridos a partir de uma versão em papel, por exemplo, a maioria dos documentos do Microsoft Word são materiais ‘nascidos digitais’, a menos que tenham sido transcritos de uma versão manuscrita. ( Glossário de Gerenciamento de Dados da Universidade de Bristol )

Com perdas: Este termo é usado em referência à compactação de arquivos, principalmente com imagens. Se um formato tiver compactação ‘com perdas’, isso significa que quando os arquivos são criados e toda vez que são salvos novamente, eles perdem informações. Por exemplo, JPEG tem compactação com perdas; embora sejam bons para reduzir com eficiência o tamanho de uma imagem, ela ficará granulada e desfocada à medida que você a altera e salva novamente. ( Wikipedia )

Creative Commons:  Um método de licenciamento de informações que incentiva a reutilização. Por exemplo, ‘Por atribuição, não comercial’ é uma licença Creative Commons comum – quando você marca seu arquivo, imagem ou informação com isso, significa que qualquer pessoa pode usar suas informações da maneira que quiser, desde que atribua para você e não o use para fins comerciais. ( Creative Commons )

Dicionário de dados : Um dicionário de dados é um compêndio descritivo de todos os elementos de dados que estão sendo usados ​​para um projeto. Mais informações sobre Dicionários de Dados podem ser encontradas aqui .

Formato de arquivo não proprietário:  Nos casos mais simples, um formato não proprietário é um formato que não possui restrições quanto ao seu uso e sobre o qual ninguém (por exemplo, uma empresa) reivindica restrições substanciais de DPI. Os especialistas em preservação recomendam o uso de formatos não proprietários a longo prazo, principalmente porque uma empresa privada de software pode fechar ou parar de produzir uma versão compatível do software em cujo formato seus dados foram salvos, e ninguém terá o direito ou conhecimento de fornecê-lo mais. ( Grupo de Serviço de Gerenciamento de Dados de Pesquisa da Universidade de Cornell )

Identificadores Persistentes:  Uma referência única e duradoura que permite o acesso contínuo a um objeto digital. Exemplos de sistemas de identificadores persistentes incluem identificadores de objetos digitais (DOIs), identificadores e chaves de recursos de arquivamento (ARKs). Os identificadores persistentes suportam a interoperabilidade e a citação confiável de conteúdo digital. ( Grupo de Serviço de Gerenciamento de Dados de Pesquisa da Universidade de Cornell )

Metadados:  Um termo que se refere a dados estruturados sobre dados. Metadados são um conceito antigo (por exemplo, catálogos e índices de fichas), mas os metadados geralmente são essenciais para que o conteúdo digital seja útil e significativo. Os metadados podem capturar informações gerais ou específicas sobre o conteúdo digital que podem definir características administrativas, técnicas ou estruturais do conteúdo digital. ( ICPSR: Glossário de Termos de Ciências Sociais )

Padrões:  Métodos ou modelos de prática aceitos; estes podem ser padrões formalmente aprovados ou de fato. No contexto de gerenciamento de dados, os padrões normalmente se aplicam a dados ou formatos de arquivo e a metadados. ( Grupo de Serviço de Gerenciamento de Dados de Pesquisa da Universidade de Cornell )

Preservação de Dados:  Garantir que os dados permaneçam intactos, acessíveis e compreensíveis ao longo do tempo. Isso requer a preservação da integridade dos próprios arquivos digitais e pode ser consideravelmente mais complicado. As operações de preservação podem incluir a preservação do software necessário para interagir com os dados ou emular sistemas mais antigos, migrar dados para novos formatos e novas mídias e garantir que haja metadados suficientes para entender, interpretar, gerenciar e preservar os dados. ( Grupo de Serviço de Gerenciamento de Dados de Pesquisa da Universidade de Cornell )

Sem perdas:  Este termo é usado em referência à compactação de arquivos, principalmente com imagens. Se um formato tiver compactação ‘sem perdas’, isso significa que o arquivo não perderá informações quando criado ou salvo novamente. Por exemplo, arquivos PNG usam compactação sem perdas. ( Wikipedia )

Consulte também a matéria Curadoria de Dados de Pesquisa.

== REFERÊNCIA ==

[1] UC MERCED LIBRARY. Research Data Curation Glossary. Disponível em: https://library.ucmerced.edu/research-data-curation-glossaryAcesso em: 10 março 2022.