2017-03-08 / Colin Fay / Actualités, Ressources

Text mining & n-gramme avec R

Wow, vous êtes encore en train de nous perdre avec un truc compliqué ! Mais non, lecteurs, rassurez-vous : malgré un nom tiré par les cheveux, les n-gramme sont faciles à comprendre… et simples à mettre en place avec R ! Démonstration en bonne et due forme. Alors, c’est quoi un n-gramme Tout simplement, un n-gramme est “une sous-séquence de ...

2017-02-27 / Colin Fay / Actualités, Ressources

Premiers pas en Machine Learning avec R. Volume 1 : la régression linéaire simple

À moins d’être resté enfermé dans un frigo ces cinq dernières années, vous avez forcément entendu parler de machine learning. Et pour cause : les algorithmes “d’apprentissage automatique” (pour les amoureux de la langue de Molière) ont progressivement envahi tous les secteurs : finance, marketing, web… La liste est longue ! Zoom sur le machine learning avec R. ...

2017-02-20 / Colin Fay / Actualités, Ressources

À la découverte de Shiny

Shiny, shiny, vous avez-dit “Shiny” ? Késako ? Rassurez-vous, vous êtes au bon endroit : même si cela sonne comme le nom d’un shampooing pour cheveux brillants, Shiny est à l’heure actuelle un must-know du “R World”. Focus sur ce package incontournable. ...

2017-02-07 / Colin Fay / Actualités, Ressources

tm ou tidytext ? Introduction au text-mining avec R

Des chiffres, des chiffres, toujours des chiffres ? Eh non, pas que ! La science des données passe également par l’analyse de contenus textuels : une spécialisation appelée « fouille de texte » (si vous êtes d’humeur franco-française), mais plus connue sous le nom de « text-mining ». ...

2016-12-02 / Colin Fay / Actualités, Ressources

R, l’Open Source, les RUG et les meetups

L’histoire de notre logiciel favori est fortement ancrée dans celle du logiciel libre et de l’open source. Il s’agit d’ailleurs d’un argument qui en fait l’une de ses forces, et qui compte parmi les motivations d’adoption par de nombreux data lovers. Une philosophie du partage et du collectif qui a traversé les décennies, pour aujourd’hui se poursuivre dans les nombreux ...

2016-11-22 / Colin Fay / Actualités, Ressources

R & les expressions régulières

Incontournables de la manipulation de données, les expressions régulières peuvent sembler ésotériques aux non-initiés, qui n’y verrons qu’une succession de points et de tirets indéchiffrables. Pourtant, une fois maitrisées, les expressions régulières deviendront un véritable super-pouvoir pour le data-wrangling. Car oui, il faut l’avouer, l’apprentissage est ardu… mais le jeu en vaut la chandelle ! ...

2016-11-09 / Colin Fay / Actualités

Guide de survie ggplot2 à destination des datajournalistes (et des autres aussi)

Lors de son intervention récente à useR! 2016, Andrew Flowers de FiveThirtyEight, plateforme de datajournalisme, chantait les louanges de ggplot2, un package incontournable dans son quotidien. Vous vous en doutiez, nous partageons à 200% son amour pour ce puissant package du tidyverse — ou de l’ordocosme, pour les français. C’est pourquoi nous avons décidé aujourd’hui de vous offrir un guide de ...

2016-10-17 / Colin Fay / Actualités, Ressources

Dans les profondeurs du réseau de neurones artificiels

Paradigme majeur du deep learning, le réseau artificiel de neurones peut paraitre incompréhensible de prime abord. Pourtant, et parce que le machine learning sera bientôt partout (c’est le gartner hype cycle qui le dit), les Artificial Neural Networks (ANN) font partie des technologies clés à saisir pour rester câblé sur les innovations de demain. Décryptage à destination des non-spécialistes. ...

2016-10-03 / Colin Fay / Actualités, Ressources

Les dix commandements d’une base de données réussie

Lecteur assidu de nos pages, vous savez déjà à quel point il est important d’avoir des données bien ordonnées pour des traitements statistiques efficaces. Et parce qu’on ne les rencontre pas toujours (qui a dit « jamais » ?) dans la nature, voici quelques conseils pour construire vos bases de données correctement, pour travailler avec justesse et éviter à vos collègues une ...

2016-09-27 / Colin Fay / Actualités, Ressources

Un code qui ronronne avec purrr

Si vous suivez régulièrement les nouveautés de l’univeRs, un package du tidyverse est certainement remonté à vos oreilles ces derniers mois : purrr. « Encore un, pas facile de tenir la cadence ? » vous dites-vous ? Laissez-vous guider, nous sommes là pour vous présenter ce package ronronnant !  ...