Il faut qu’on parle de deep learning

S’il est une expression mangée à toutes les sauces en 2016, c’est bien celle de « machine learning ». Amené à bouleverser le monde de l’assurance, de la santé, du marketing, de l’industrie alimentaire (etc., etc.), l’apprentissage automatique (dans la langue de Molière) fait partie des « buzzwords » des années 2010. Et dans cette grande famille, un petit frère vient pointer le bout de son nez : le deep learning. Mais concrètement, de quoi parle-t-on ? 

Not cool bro, clean your data!

Utiliser la grammaire dplyr pour triturer ses données

{dplyr} est un package du tidyverse (ancien hadleyverse, et que l’on connait sous le nom d’ordocosme) dédié à faciliter la manipulation, l’exploration et les calculs sur des données. Devenu incontournable en peu de temps, il a l’avantage de présenter un environnement unifié de fonctions dédiées : la grammaire de la manipulation des données (toute ressemblance avec une grammaire des graphiques du même auteur serait purement fortuite…).

Bienvenue dans le Tidyverse !

Dans le petit monde de la data science, il existe quelques superhéros, connus des statisticiens les plus aguerris comme des nouveaux arrivants tapant leurs premières lignes de code. Parmi ces superhéros, le plus famous d’entre eux reste Hadley Wickham, Chief Scientist chez RStudio, rockstaR et (co)auteur de nombreux packages indispensables à un usage débutant comme confirmé de R.