2016-08-04 / Colin Fay / Actualités, Ressources

Il faut qu’on parle de deep learning

S’il est une expression mangée à toutes les sauces en 2016, c’est bien celle de « machine learning ». Amené à bouleverser le monde de l’assurance, de la santé, du marketing, de l’industrie alimentaire (etc., etc.), l’apprentissage automatique (dans la langue de Molière) fait partie des « buzzwords » des années 2010. Et dans cette grande famille, un petit frère vient pointer le bout de ...

2016-07-21 / Colin Fay / Actualités, Ressources

Utiliser la grammaire dplyr pour triturer ses données

{dplyr} est un package du tidyverse (ancien hadleyverse, et que l’on connait sous le nom d’ordocosme) dédié à faciliter la manipulation, l’exploration et les calculs sur des données. Devenu incontournable en peu de temps, il a l’avantage de présenter un environnement unifié de fonctions dédiées : la grammaire de la manipulation des données (toute ressemblance avec une grammaire des graphiques du même ...

2016-07-07 / Colin Fay / Actualités, Ressources

Bienvenue dans le Tidyverse !

Dans le petit monde de la data science, il existe quelques superhéros, connus des statisticiens les plus aguerris comme des nouveaux arrivants tapant leurs premières lignes de code. Parmi ces superhéros, le plus famous d’entre eux reste Hadley Wickham, Chief Scientist chez RStudio, rockstaR et (co)auteur de nombreux packages indispensables à un usage débutant comme confirmé de R. ...

2016-06-13 / Colin Fay / Actualités, Ressources

Petit guide de Google Analytics à l’attention des amoureux de R

  Puissant outil développé par le géant américain, Google Analytics reste le dashboard indispensable pour garder un œil sur le comportement les internautes qui visitent votre site (oui, vous, derrière votre écran). Pages d’entrée, de sortie, durée de lecture, sources… toutes les données de navigation de vos visiteurs sont à portée de clic. ...

2016-05-31 / Colin Fay / Actualités, Ressources

Avec R, des données bien ordonnées

Dans le petit monde de la data science, on entend souvent que 80 % du travail du data analyst est consacré au nettoyage et à l’ordonnancement des données brutes, autrement appelées raw data dans la langue de Shakespeare. Et c’est un peu vrai — car il ne faut pas se le cacher, la plupart des datasets rencontrés dans la nature ...

2016-05-19 / Colin Fay / Actualités, Ressources

R et le reporting — la guerre des gangs

On ne vous le répétera jamais assez, mais chez ThinkR, nous vivons R. Nous parlons R, mangeons R, respirons R. Cette passion, nous aimons la partager : avouons-le, produire un ggplot parfait issu d’une analyse statistique alambiquée, c’est le nirvana, et on a toute de suite envie de le montrer au monde entier. Ça tombe bien, notre logiciel préféré a ...

2016-05-08 / Colin Fay / Actualités, Ressources

R et le big data, une histoire d’amour ?

  Au fond, le big data, tout le monde en parle, mais personne ne sait vraiment de quoi il en retourne. Et c’est bien normal, le terme est utilisé à toutes les sauces : gestion des ressources humaines, innovations dans les transports, médecin du futur, potion magique du marketing… la liste pourrait facilement s’allonger de dizaines de secteurs à qui l’on ...

2016-02-15 / Vincent Guyader / Actualités, Ressources

Aide-mémoire de l’interface Rstudio en français

Pour exploiter au mieux les capacités de Rstudio ...

2016-01-09 / Vincent Guyader / Actualités, Ressources

Aide-mémoire manipulation de données avec dplyr & tidyr

Manipuler ses données comme un pro avec dplyr ...

2015-12-11 / Vincent Guyader / Actualités, Ressources

FAQ – Utilisateurs de SAS se formant à R

Ci-dessous quelques questions classiques et prévisibles régulièrement entendues de la part d’ utilisateurs de SAS se formant à R : En R je trouve dommage qu’il n’y ait pas de macro-langage comme sous SAS ! Effectivement, en R il n’y a pas de macro langage identique à celui de SAS. Pour une simple raison : le macro-langage de SAS est ...