Comment extraire un motif d’une chaîne de caractères avec une expression régulière ou regex
Analyser des données demande de savoir manipuler aussi du texte. Ce que nous appelons texte en tant qu’humain est interprété par R comme une chaîne de caractères. Le type de donnée correspondant dans R est appelé: character. class(« abcdR ») ## [1] « character » Il est parfois nécessaire d’extraire des motifs particuliers de chaînes de caractères. Pour ce faire on peut utiliser des expressions régulières ou regex en anglais. Pour cela nous allons utiliser {stringr}, un package du tidyverse. library(stringr) Considérons un vecteur de noms de fichiers csv. noms_fichiers <- c(« pop_FRA_2019.csv », « pop_ITA_2020.csv », « pop_ESP_2019.csv ») Comment extraire le code iso3 (FRA, ITA…) ? str_extract(string = noms_fichiers, pattern = « [A-Z]{3} ») ##Read More →