Uso de cookies

En las páginas web de la Universidad Carlos III de Madrid utilizamos cookies propias y de terceros para mejorar nuestros servicios mediante el análisis de sus hábitos de navegación. Al continuar con la navegación, entendemos que se acepta nuestra política de cookies. "Normas de uso"

Datos de investigación

Ciclo de vida de los datos de investigación

Los datos producidos durante el ciclo de vida de un proyecto de investigación constituyen un valioso recurso, en cuya producción se ha realizado una costosa inversión de tiempo y dinero. Una óptima gestión garantizará que dichos datos se registrarán, almacenarán y serán accesibles para su reutilización.

Los datos abiertos son aquellos que pueden ser utilizados, reutilizados y redistribuidos por cualquier persona, con la condición de citar la autoría y en su caso, compartir los nuevos datos en los mismos términos que los originales.  (OKF. The Open Definition.)

La Biblioteca ofrece un servicio de asesoramiento para las cuestiones relacionadas con la gestión de datos.

¿Qué son los datos de investigación?

  • Son datos que adquieren significado en el contexto del ciclo de vida de una investigación.
  • Pueden ser de diferente naturaleza: numéricos o datos cuantitativos, textuales o datos cualitativos, muestras biológicas, colecciones de objetos físicos, programas de software o código, algoritmos, modelos, datos geográficos, etc.
  • Para su comprensión deben estar bien documentados e incluir metadatos. Los tipos de documentos asociados que puedan aportar significado a los datos son: libros de código, cuestionarios, descripciones metodológicas, informes, papers, etc.

Características de los datos de investigación:

  • Agrupación: son datos tratados como una unidad, un conjunto o una colección.
  • Contenido: constituyen un conjunto de valores que representan actividades como mediciones u observaciones.
  • Parentesco: los datos tienen una misma estructura y están relacionados entre sí por factores de tiempo, lugar, instrumento, objeto u observación, tema, etc. 
  • Propósito: la finalidad de estos datos será la de contribuir a cierta actividad científica para proveer evidencia, sugerir una hipótesis, refutar o confirmar una hipótesis, etc.

Descubrir / crear datos

A la hora de iniciar la búsqueda de datos ya depositados por otros investigadores es conveniente reflexionar sobre:

  • El tipo y formato de datos que se necesitan.
  • Si están afectados por algún tipo de consideración ética, confidencialidad o privacidad.
  • Identificar el repositorio donde pueden estar alojados.

¿Dónde buscar datasets?

  • re3data: registra repositorios de datos de investigación, posibilitando realizar la búsqueda por países, disciplinas o tipología de los datos.
  • DataCite: permite realizar búsquedas de dataset que tengan asignados DOI.
  • B2Find de EUDAT: servicio de descubrimiento de colecciones de datos de investigación de los centros de datos EUDAT (European Research Data Infrastructure).
  • DataSearch de Elsevier: buscador de datos de investigación de diferentes dominios y tipos.
  • Data Citation Index (Web of Science): proporciona un único punto de acceso a datos de investigación de calidad de repositorios de múltiples disciplinas.
     

Repositorios multidisciplinares:

  • Figshare: repositorio internacional en el que se pueden recuperar datos por categorías temáticas.
  • Dryad: repositorio que contiene dataset asociados a publicaciones de ciencias y medicina.
  • Zenodo: repositorio de datos de investigación de la Unión Europea.
  • OpenAire: buscador de la UE de publicaciones y datos científicos.

Beneficios de la gestión de los datos de investigación

  • La gestión de datos de investigación (Research Data Management - RDM) es un concepto que abarca las tareas de organización, estructuración, almacenamiento y custodia de los datos utilizados durante un proyecto de investigación.
  • Hay que tener presente cuál es el ciclo de vida de los datos y cuál el del proyecto de investigación asociado. Cada etapa requiere consideraciones, actividades y prácticas distintas con objeto de preservar y permitir el acceso y uso a los datos una vez completado el proyecto. 

Una gestión de datos adecuada proporciona:

  • Un aumento del impacto de la investigación optimizando la visibilidad de los datos producidos. 
  • Una mejora de la accesibilidad a los datos, asegurando la calidad e integridad de los mismos durante su ciclo de vida.
  • Una mayor transparencia para la validación de los resultados de la investigación reflejados en las publicaciones.
  • Una reutilización de los datos sin necesidad de reproducir la investigación.
  • Un retorno de la inversión pública cumpliendo con los requerimientos de los organismos financiadores de la investigación. 

Datos y Horizonte 2020

La Comisión Europea estableció en 2014 un programa piloto en el ámbito de Horizonte 2020 con el fin de ofrecer en acceso abierto los datos de investigación financiados con fondos europeos. Con este piloto se pretende mejorar y maximizar el acceso y la reutilización de los datos de investigación generados por los proyectos de Horizonte 2020.

En el artículo 29.3 del modelo de acuerdo de subvención se establecen las obligaciones para la gestión de los datos. Los proyectos participantes en el Piloto de Datos de Investigación en Abierto han de entregar un Plan de Gestión de Datos durante los 6 primeros meses de vida del proyecto.

Proyectos afectados: el programa piloto inicial se limitaba a unas determinadas áreas temáticas. En 2017 el piloto se amplia a todas las áreas temáticas de Horizonte 2020 (V. FAQ de la Comisión Europea).

Excepciones: se podrá optar por no participar en el piloto por razones de derechos de propiedad intelectual, de protección de datos personales, por seguridad nacional o por otros motivos que figuran en el anexo L del "Horizon 2020. Work Program 2016-2017". Los proyectos que se acojan a estas excepciones no tienen la obligación de presentar un Plan de Gestión de Datos, aunque sí se recomienda.

Qué depositar: los datos de investigación necesarios para validar los resultados presentados en una publicación científica y otros datos según lo especificado en el respectivo Plan de Gestión de Datos.

Dónde:

  • en e-cienciaDatos, repositorio de datos del Consorcio Madroño de Bibliotecas de las Universidades de la Comunidad de Madrid. Al depositar aquí los datos, se obtendrá un DOI.
  • en e-Archivo, repositorio institucional de la Universidad Carlos III de Madrid.
  • en Zenodo, el repositorio de datos de la Unión Europea.

Cuándo:

  • los datos que validen resultados de una publicación lo antes posible;
  • los otros datos susceptibles de ser compartidos que figuren en el Plan de Gestión de Datos, una vez finalizado el proyecto.

Open Research Data in Horizon 2020

Plan de Gestión de Datos

  • Un Plan de Gestión de Datos - PGD (Data Management PlanDMP) es un documento formal que debe presentarse al inicio de la investigación, en el cuál se esboza la gestión que se aplicará durante el ciclo de vida de los datos, desde su creación hasta la finalización del proyecto de investigación.
  • El PGD describe en detalle aspectos sobre la recolección o creación, organización, documentación, compartición y preservación de los datos.

 

 

10 pasos para elaborar un Plan de Gestión de Datos

 

 

 

  • Horizonte 2020, como hemos mencionado en el apartado anterior, requiere la elaboración de un PGD. Su objetivo consiste en favorecer la claridad y transparencia en el proceso de investigación y garantizar el retorno de la inversión pública en la financiación de la investigación.

Más información en Pagoda, portal del Consorcio Madroño para la elaboración de PGD.

PGDonline: herramienta para elaborar PGD.

Procesar y organizar los datos de investigación

Esta fase abarca las siguientes tareas:

  • Crear / recolectar los datos.
  • Planificar y habilitar espacio de almacenamiento.
  • Diseñar un  plan de protección y seguridad de los datos almacenados: antivirus, control de acceso y seguridad en red, copias de seguridad en distintos soportes, etc.
  • Establecer un sistema de trabajo en colaboración: flujo de trabajo, procedimientos, herramientas de trabajo colaborativo.
  • Configurar la estructura de ficheros: nomenclatura de carpetas y ficheros, control y nombre de versiones.
  • Determinar el formato de los ficheros: se deberán utilizar siempre que sea posible formatos abiertos para garantizar la accesibilidad y preservación.
  • Documentar los datos para hacerlos comprensibles y fáciles de usar.

    Una buena documentación contendrá:
    - el contexto de la colección de datos: historia del proyecto, propósito y objetivos;
    - la descripción de la metodología: proceso de acopio de datos, instrumentos usados, ámbito temporal y geográfico, hardware y software;
    - la estructura de los ficheros que componen la colección y la relación entre ellos;
    - los procedimientos de validación, comprobación, limpieza, etc. llevados a cabo;
    - los cambios realizados en las sucesivas versiones de los ficheros;
    - en relación con los propios datos, especificar si hay variables y sus valores, explicación de códigos, esquemas, acrónimos, terminología y otras anotaciones necesarias;
    - la información sobre acceso, uso y confidencialidad.

Compartir y difundir los datos

Se recomienda realizar las tareas siguientes:

  • Seleccionar los datos para su depósito: limpiar y procesar los datos en bruto. 
  • Anonimizar los datos de carácter personal.
  • Asegurar la integridad de los datos creando una versión maestra del conjunto de los datos definitivo. 
  • Actualizar la documentación anexa a los datos.
  • Decidir qué datos estarán públicamente accesibles. Hay que tener en cuenta el marco legal que afecta a los datos de investigación, fundamentalmente los aspectos relativos a la propiedad intelectual, la confidencialidad, privacidad y protección de datos de carácter personal.
  • Depositar los datasets en un repositorio junto a la documentación necesaria que contenga la suficiente información para su reutilización. 
  • Aportar los metadatos necesarios para la creación del registro en el repositorio: autor, título, palabras clave, resumen del contenido y cualquier otro metadato que enriquezca la descripción del recurso y posibilite su recuperación.
  • Publicar los descubrimientos, análisis, conclusiones, etc. en una publicación científica. Se deberá enlazar al DOI de los datos depositados en el repositorio.

Reutilizar y citar

Los datos de investigación pueden ser reutilizados en nuevas investigaciones, en actividades académicas y para otros fines de la sociedad en general.

Es importante citar correctamente los datos de investigación.

Cita tus datos de investigación

 

 

 

Buscador de biblioteca

    Si quiere realizar una consulta:

    e-archivo@listserv.uc3m.es

    91 624 9076/982

      InvestigaM: