Uso de cookies

En las páginas web de la Universidad Carlos III de Madrid utilizamos cookies propias y de terceros para mejorar nuestros servicios mediante el análisis de sus hábitos de navegación. Al continuar con la navegación, entendemos que se acepta nuestra política de cookies. "Normas de uso"

Requisitos del acceso abierto para los datos de investigación

¿Qué son los datos de investigación?

  • Son datos que adquieren significado en el contexto del ciclo de vida de una investigación.
  • Pueden ser de diferente naturaleza: numéricos o datos cuantitativos, textuales o datos cualitativos, muestras biológicas, colecciones de objetos físicos, programas de software o código, algoritmos, modelos, datos geográficos, fotos, imágenes, cortes de películas, vídeos, registros sonoros, etc.
  • Para su comprensión deben estar bien documentados e incluir metadatos. Los tipos de documentos asociados que puedan aportar significado a los datos son: libros de código, cuestionarios, descripciones metodológicas, informes, papers, etc.
  • Dataset es un conjunto de datos.

Características de los datos de investigación:

  • Agrupación: son datos tratados como una unidad, un conjunto o una colección.
  • Contenido: constituyen un conjunto de valores que representan actividades como mediciones u observaciones.
  • Parentesco: los datos tienen una misma estructura y están relacionados entre sí por factores de tiempo, lugar, instrumento, objeto u observación, tema, etc. 
  • Propósito: la finalidad de estos datos será la de contribuir a cierta actividad científica para proveer evidencia, sugerir una hipótesis, refutar o confirmar una hipótesis, etc.

Obligaciones en el contexto nacional y europeo

  • Datos de investigación (datasets) y los metadatos necesarios para validar los resultados presentados en publicaciones científicas.
  • Otros datos y sus metadatos incluidos en el Plan de Gestión de datos (PGD) / Data Management Plan (DMP).

Beneficios de la gestión de los datos de investigación

  • La gestión de datos de investigación (Research Data Management - RDM) es un concepto que abarca las tareas de organización, estructuración, almacenamiento y custodia de los datos utilizados durante un proyecto de investigación.
  • Hay que tener presente cuál es el ciclo de vida de los datos y cuál el del proyecto de investigación asociado. Cada etapa requiere consideraciones, actividades y prácticas distintas con objeto de preservar y permitir el acceso y uso a los datos una vez completado el proyecto. 

Una gestión de datos adecuada proporciona:

  • Un aumento del impacto de la investigación optimizando la visibilidad de los datos producidos. 
  • Una mejora de la accesibilidad a los datos, asegurando la calidad e integridad de los mismos durante su ciclo de vida.
  • Una mayor transparencia para la validación de los resultados de la investigación reflejados en las publicaciones.
  • Una reutilización de los datos sin necesidad de reproducir la investigación.
  • Un retorno de la inversión pública cumpliendo con los requerimientos de los organismos financiadores de la investigación. 

Localizar datos de investigación en acceso abierto y repositorios de datos

A la hora de iniciar la búsqueda de datos ya depositados por otros investigadores es conveniente reflexionar sobre:

  • El tipo y formato de datos que se necesitan.
  • Si están afectados por algún tipo de consideración ética, confidencialidad o privacidad.
  • Identificar el repositorio donde pueden estar alojados.

¿Dónde buscar conjuntos de datos o datasets?

  • B2Find de EUDAT: servicio de descubrimiento de colecciones de datos de investigación de los centros de datos EUDAT (European Research Data Infrastructure).
  • DataCite: permite realizar búsquedas de datasets que tengan asignados DOI.
  • DataSearch de Elsevier: buscador de datos de investigación de diferentes dominios y tipos.
  • Dryad: repositorio que contiene datasets asociados a publicaciones de ciencias y medicina.
  • e-cienciaDatos: repositorio de datos de investigación del Consorcio Madroño.
  • Figshare: repositorio internacional en el que se pueden recuperar datos por categorías temáticas.
  • Google Dataset Search: permite la búsqueda en varios repositorios de datos.
  • OpenAire: buscador de la Unión Europea de publicaciones y datos científicos.
  • re3data: registra repositorios de datos de investigación, posibilitando realizar la búsqueda por países, disciplinas o tipología de los datos.
  • Zenodo: repositorio de datos de investigación de la Unión Europea.

Recomendaciones al trabajar con datos

  • Planificar y habilitar espacio de almacenamiento.
  • Diseñar un  plan de protección y seguridad de los datos almacenados: antivirus, control de acceso y seguridad en red, copias de seguridad en distintos soportes, etc.
  • Establecer un sistema de trabajo en colaboración: flujo de trabajo, procedimientos, herramientas de trabajo colaborativo.
  • Configurar la estructura de ficheros: nomenclatura de carpetas y ficheros (asignar nombres significativos y breves, sin espacios, tildes ni caracteres especiales). Identificar la versión del fichero en el propio nombre facilitará la gestión de versiones.
  • Determinar el formato de los ficheros: se deberán utilizar siempre que sea posible formatos abiertos para garantizar la accesibilidad y preservación.
  • Documentar los datos para hacerlos comprensibles y fáciles de usar.
  • Decidir qué datos estarán públicamente accesibles. Hay que tener en cuenta el marco legal que afecta a los datos de investigación, fundamentalmente los aspectos relativos a la propiedad intelectual, la confidencialidad, privacidad y protección de datos de carácter personal.
  • En caso de tratar información sensible protegida por la Ley de Protección de datos de carácter personal, debe anonimizar los datasets. Para ello existen herramientas, como Amnesia.

Una buena documentación contendrá:

  • El contexto de la colección de datos: historia del proyecto, propósito y objetivos.
  • La descripción de la metodología: proceso de acopio de datos, instrumentos usados, ámbito temporal y geográfico, hardware y software.
  • La estructura de los ficheros que componen la colección y la relación entre ellos.
  • Los procedimientos de validación, comprobación, limpieza, etc. llevados a cabo.
  • Los cambios realizados en las sucesivas versiones de los ficheros.
  • En relación con los propios datos, especificar si hay variables y sus valores, explicación de códigos, esquemas, acrónimos, terminología y otras anotaciones necesarias.
  • La información sobre acceso, uso y confidencialidad.

Al depositar los datos finales en un repositorio de datos de investigación, se recomienda adjuntar un documento readme.txt para que los datos puedan ser interpretados y reutilizables. Se puede utilizar la plantilla para documento readme.txt del repositorio e-cienciaDatos del Consorcio Madroño.

Buscador de biblioteca