miércoles, 19 de octubre de 2022

¿Qué es la gestión de datos de investigación? Te explicamos en 5 pasos esenciales


Cuando nos planteamos iniciar un proyecto de investigación que involucra el análisis de datos numéricos, necesariamente pensamos en las tareas que esto conlleva, por ejemplo cómo realizar la recolección de datos, en qué momento comenzar con el análisis, cómo compartir los datos, entre otras. A pesar de su aparente dificultad, ahora existen metodologías que pueden ayudar a gestionar los proyectos de investigación que conllevan el manejo de datos y con base en esto, en este artículo hablaremos sobre la Gestión de Datos de Investigación (GDI), conocida en inglés como Research Data Management (RDM).

La GDI involucra la organización y mantenimiento activo de los datos durante todo el desarrollo de la investigación, enfocándose en la confiabilidad y replicabilidad de los productos finales. Se podría decir que la GDI es una forma de implementar las mejores prácticas en gestión de datos en todo el ciclo de vida de un proyecto de investigación. Ya seas un investigador junior, un estudiante o un académico, te puedes beneficiar de la gestión de datos en cualquier etapa de tu proyecto. Los beneficios incluyen mayor transparencia de los resultados, la optimización del tiempo y los recursos disponibles, la reutilización de los datos en otros proyectos, y el impacto y visibilidad del proyecto final. Sin más preámbulo, empezamos.

Pasos para la gestión de datos de investigación

1 – Planificar

El primer paso consiste en preparar un buen plan para la investigación. Podemos decir que un buen plan para la gestión de datos debe considerar:
  • Una sección sobre la recolección de datos: ¿Qué tipo de datos recolectarás, crearás o adquirirás?
  • La documentación y los metadatos: ¿Qué documentación se necesita para la descripción de los datos?
  • El almacenamiento: ¿Dónde se localizarán los datos durante y posterior a la investigación?
  • La ética y temas legales: Si tu proyecto incluye datos sensibles, ¿cómo aseguras que se respeta la privacidad de los participantes en la investigación?
2 – Adquirir:

Una vez que tienes tu plan de investigación ya puedes iniciar con el proceso de adquirir los datos necesarios a través de la experimentación, simulación, medición u observación; todo dependiendo de la disciplina en la que te encuentres. También es buen momento para preparar los metadatos y el material complementario para capturar la información de manera consistente durante el proyecto. Para el almacenamiento, ten en cuenta los requerimientos de espacio específicos de tu proyecto, así como el tiempo que permanecerán almacenados. De la misma manera, se debe pensar en cómo y dónde se almacenarán las copias de respaldo de los datos y los niveles de acceso que se brindará al equipo de investigación y/o al resto de los colaboradores.

3 – Procesar y analizar:

Con los datos almacenados y a la mano, es hora de realizar el procesamiento, lo que implica que los datos deben ser
  • Validados
  • Limpiados
  • Recodificados
  • De ser necesario, anonimizados
Estos aspectos son esenciales para asegurar la calidad de tus resultados. Una vez realizado el procesamiento, es hora de analizar los datos para producir los hallazgos de la investigación y presentarlos ya sea como una publicación, artículo, reporte, tesis, etc. El análisis, en caso de haber sido elaborado en un lenguaje de programación estadístico (o un lenguaje de programación en general), también puede ser alojado en un portal de control de versiones como Github.

4 – Preservar y compartir:

Este paso es esencial para la apertura de información y la transparencia de los resultados. Inmediatamente después de realizar el análisis, es muy importante guardar los datos en un formato abierto, crear un diccionario de datos y actualizar los metadatos para su publicación.  Después de tener en cuenta cuestiones de privacidad de los datos, permisos para compartir la información y los derechos de propiedad intelectual, es momento de publicar los datos en un servidor público o un repositorio como Harvard Dataverse. Como se mencionó anteriormente, si tienes código en un lenguaje de programación, también puedes compartirlo por Github o incluirlo en los repositorios junto con los datos.

5 – Reusar:

Después de haber seguido los pasos anteriores podemos decir que el proyecto de investigación cuenta ya con una GDI implementada, documentado y abierto al público que puede ser utilizado por ti o por otros investigadores en análisis secundarios, o en proyectos de investigación completamente nuevos.

La apertura y la transparencia en las investigaciones que conllevan datos ha cobrado tanta relevancia que existen ya importantes iniciativas al respecto. Muchas de ellas están enfocadas en corroborar y replicar los resultados de investigaciones ya publicadas, tales como el Institute for Replication o el Berkeley Initiative for Transparency in the Social Sciences.

Fuente: BID

No hay comentarios.:

Publicar un comentario