Plan de Gestión de Datos de Investigación
Un Plan de Gestión de Datos (PGD) es un documento formal que describe cómo se manejarán los datos a lo largo de un proyecto. Este plan aborda todas las etapas del ciclo de vida de los datos, desde su creación y recolección hasta su almacenamiento, acceso, preservación y, en última instancia, su posible reutilización o eliminado.
En un entorno universitario, un Plan de Gestión de Datos de Investigación (PGDI) es una herramienta esencial para asegurar la integridad, la calidad y la transparencia de la investigación. Actúa como una hoja de ruta que guía a los investigadores en la gestión de sus datos de manera responsable y eficiente, facilitando las posteriores auditorías.
¿Por qué es importante un PGDI?
- Requisito de financiación: las convocatorias de financiación (como la Horizonte Europa de la Comisión Europea, o agencias nacionales y nacionales) suelen requerir la inclusión de un PGDI en las propuestas de proyecto. Cumplir con este requisito suele ser clave para obtener una valoración positiva.
- Calidad de la investigación: un PGDI ayuda a planificar la recolección de datos, la estructura de los datos, la documentación y el control de versiones. Esto reduce errores, fomenta la colaboración, facilita la auditoría y hace que los resultados sean más fiables.
- Fomento de la Ciencia Abierta (Open Science): la gestión planificada de datos es un pilar fundamental de la Ciencia Abierta. Un PGDI suele garantizar que los datos sean “FAIR” (siglas en inglés de Findable, Accessible, Interoperable y Reusable), permitiendo su uso por parte de otros investigadores y el público en general.
- Preservación a largo plazo: el PGDI aborda la cuestión de qué datos deben conservarse, durante cuánto tiempo y cómo Esto evita la pérdida de información valiosa garantizando el grado de confidencialidad que proceda en su acceso y asegura que los resultados de la investigación puedan ser validados en el futuro.
- Cumplimiento legal y ético: el plan debe contemplar el cumplimiento de la legislación vigente en protección de datos personales (GDPR en la Unión Europea), propiedad intelectual y confidencialidad.
¿Cómo redactar un PGDI para mi proyecto?
En la Universidad de Cádiz la Comisión de Investigación ha aprobado un documento marco de referencia para elaborar un Plan de Gestión de Datos de Investigación.
Adicionalmente, el Área de Biblioteca, Archivo y Publicaciones tiene una detallada Guía de Datos de investigación.
Y, por supuesto, para cualquier otra duda estamos encantados de atenderos en conocimiento.abierto@uca.es
Algunos consejos (que se detallan en el documento marco de referencia):
- En el paso 2 es importante describir detalladamente los datos de tu investigación: qué tipo de datos son (textos, imágenes, cifras, etc.), de dónde provienen, qué cantidad de datos esperas manejar, en qué formatos se almacenarán (recomendamos formatos abiertos) y la organización de archivos.
- En el paso 3 se recomienda establecer reglas para el manejo diario de los datos: desde cómo se nombran los archivos de forma consistente (por ejemplo los datos de la encuesta del 22 de octubre podría ser encuesta_20251022_v1.0.xlsx) hasta qué programas se usarán y cómo se controlarán las diferentes versiones de los datos (se guardará en una carpeta “tratamiento”los programas usado para procesar los datos con el software estadístico R Commander.
- En el paso 5 es necesario detallar los métodos que se usarán para asegurar que sean precisos, consistentes y fiables. Por ejemplo, uso de rangos de datos, validación a través de dobles entradas en los formularios de las encuestas, revisión de valores atípicos, o auditorías periódicas para detectar errores.
- En el paso 6 se debe incluir primero, cómo y dónde se guardarán los datos durante la investigación (por ejemplo, en un servidor en la nube con copias de seguridad) y segundo cómo se archivarán los datos valiosos después de que el proyecto termine (normalmente depositándolos en un repositorio institucional o temático para su preservación y acceso futuro).
- En el paso 10 hay que dar su lugar en el proyecto, tanto en tiempo como en dinero, a la gestión de datos. Los costos pueden incluir licencias de software, equipo técnico como discos duros, servicios de almacenamiento en la nube y, muy importante, el personal necesario para realizar estas tareas (con horas de trabajo estimadas para actividades como la documentación, la limpieza, el control de calidad, el almacenamiento y la preparación de los datos para su publicación por ejemplo).