Cómo escribir manuscritos reproducibles

Abstract

En esta charla se introducen las ventajas de desarrollar flujos de trabajo reproducibles, y se explica cómo escribir manuscritos, tesis, informes o proyectos de investigación reproducibles utilizando diversas herramientas en torno al lenguaje de programación R. La reproducibilidad no es una cualidad binaria sino un gradiente: existe una reproducibilidad básica, al alcance de casi todos pero aún poco frecuente, que consiste simplemente en compartir los datos y el código asociados a la publicación. En la charla se repasan las mejores pautas para compartir datos y código. Asimismo, se destaca el enorme potencial de Rmarkdown (documentos dinámicos que integran texto y código) para escribir manuscritos o tesis plenamente reproducibles, integrando además bibliografía, tablas y figuras con múltiples posibilidades de formato. También se incide en la necesidad, frecuentemente obviada, de controlar los flujos de trabajo (utilizando un script maestro o ‘makefile’, o herramientas avanzadas como ‘drake’ o ‘targets’) así como las dependencias de software de nuestro análisis (utilizando herramientas como, por ejemplo, ‘checkpoint’, ‘automagic’, ‘renv’, o ‘Docker’). Por último, se dan algunas pautas sobre organización de proyectos, presentando herramientas como ‘rrtools’ o ‘workflowr’ que facilitan el desarrollo de ‘compendios de investigación’ estandarizados aprovechando gran parte de la maquinaria disponible para el desarrollo de paquetes de R.

Date
8 October 2020
Francisco Rodríguez-Sánchez
Francisco Rodríguez-Sánchez
Researcher

Computational Ecologist & Data Scientist.

Related