À la découverte de RStudio Package Manager

Gérer les packages en production peut vite être un casse-tête : il faut jongler entre les versions, les packages internes, les mises à jour CRAN, Bioconductor, les sources GitHub…. Découvrons RStudio Package Manager, l’un des outils disponibles qui vous aide à gérer cela.

ThinkR - Rstudio package Manager

What is love RSPM (Baby don’t hurt me, no more 🎶)

RStudio Package Manager (ou RSPM en abrégé) est une solution conçue pour vous aider à gérer l’installation des packages dans votre organisation. Que vous ayez besoin de mettre à disposition de votre équipe l’ensemble du CRAN par le biais d’un proxy, d’une partie du CRAN, de packages GitHub, de packages internes, etc, vous pouvez utiliser RSPM comme point central pour gérer cela.

Il peut également être utile si vous disposez d’une connexion réseau gérée via un proxy, car RPSM peut être configuré pour fonctionner avec un proxy.

Installer RStudio Package Manager

Vous pouvez tester RSPM pendant 45 jours en téléchargeant sur RStudio Package Manager. L’installation est possible sur Red Hat, CentOS, SUSE et Ubuntu (Voir ici pour les specs précises).

Une fois RSPM installé et lancé, le port par défaut est 4242, vous pouvez y accéder avec http://<adress-of-server>:4242/

 

Dans les entrailles de RSPM

RSPM est composé de sources et de repos.

Repos

Un repo est une collection de package disponibles, qui sont rassemblés à partir d’une ou plusieurs sources (voir ci-dessous pour ce que sont les sources). En gros, cela permet de créer une structure RAN. (voir Dockeriser et déployer son propre R Archive repo pour plus d’infos sur la structure d’un repo).

Par example, sur ma machine, si j’ouvre http://192.168.0.10:4242/thinkr/latest/src/contrib/PACKAGES, j’aurais :

Je peux également avoir d’autres repos, avec d’autres packages :

La source de chaque package est disponible sur http://<server>/<repo>/latest/src/contrib/<my-package> — l’adresse étant disponible sur la page de chaque package :

Les archives sont sur http://<server>/<repo>/latest/src/contrib/archive/package/<package>_<version>.tar.gz.

Sources

Comme nous l’avons déjà dit, un repo est construit sur une ou plusieurs sources. En quelques mots, une source est « l’endroit où aller chercher les packages « . C’est ce qui est utilisé par un repo pour définir quels packages sont disponibles au téléchargement. Il y a 3 types de sources :

  • L’ensemble du CRAN, pointant vers le service CRAN de RStudio.
  • Liste choisi dans les packages du CRAN ; c’est-à-dire une sélection
  • Sources locales : packages internes

 

Lire la suite sur RTASK


À propos de l'auteur

Colin Fay

Colin Fay

Data scientist & R Hacker


Commentaires


À lire également