{"id":5198,"date":"2024-10-01T11:22:44","date_gmt":"2024-10-01T10:22:44","guid":{"rendered":"https:\/\/thinkr.fr\/abcdr\/ajuster_un_modele_de_regression_logistique_avec_glm\/"},"modified":"2024-10-01T11:22:44","modified_gmt":"2024-10-01T10:22:44","slug":"ajuster_un_modele_de_regression_logistique_avec_glm","status":"publish","type":"post","link":"https:\/\/thinkr.fr\/abcdr\/ajuster_un_modele_de_regression_logistique_avec_glm\/","title":{"rendered":"Ajuster un mod\u00e8le de r\u00e9gression logistique avec glm"},"content":{"rendered":"<h1>Ajuster un mod\u00e8le de r\u00e9gression logistique avec glm en R<\/h1>\n<p>La r\u00e9gression logistique est une m\u00e9thode statistique utilis\u00e9e pour mod\u00e9liser la relation entre une variable d\u00e9pendante binaire et une ou plusieurs variables ind\u00e9pendantes. Dans cet article, nous allons voir comment ajuster un mod\u00e8le de r\u00e9gression logistique en utilisant la fonction <code>glm()<\/code> de R.<\/p>\n<h2>Qu&rsquo;est-ce que la r\u00e9gression logistique ?<\/h2>\n<p>La r\u00e9gression logistique est utilis\u00e9e lorsque la variable cible est binaire, c&rsquo;est-\u00e0-dire qu&rsquo;elle prend deux valeurs, souvent cod\u00e9es comme 0 et 1. Par exemple, nous pourrions vouloir pr\u00e9dire si un client va acheter un produit (1) ou non (0) en fonction de certaines caract\u00e9ristiques.<\/p>\n<h2>Exemple concret<\/h2>\n<p>Imaginons que nous avons un jeu de donn\u00e9es sur des clients d&rsquo;une boutique en ligne, et nous voulons pr\u00e9dire si un client va acheter un produit en fonction de son \u00e2ge et de son revenu. Voici comment nous pourrions proc\u00e9der.<\/p>\n<h3>\u00c9tape 1 : Cr\u00e9er un jeu de donn\u00e9es<\/h3>\n<p>Commen\u00e7ons par cr\u00e9er un petit jeu de donn\u00e9es :<\/p>\n<pre><code class=\"language-r\"># Cr\u00e9ation d'un jeu de donn\u00e9es\nset.seed(123)  # Pour la reproductibilit\u00e9\ndata &lt;- data.frame(\n  age = c(22, 25, 47, 52, 46, 23, 34, 45, 31, 29),\n  income = c(30000, 40000, 60000, 80000, 70000, 32000, 50000, 90000, 45000, 38000),\n  purchase = c(1, 1, 0, 0, 1, 0, 1, 1, 0, 0)  # 0 = non, 1 = oui\n)<\/code><\/pre>\n<h3>\u00c9tape 2 : Ajuster le mod\u00e8le de r\u00e9gression logistique<\/h3>\n<p>Nous allons maintenant utiliser la fonction <code>glm()<\/code> pour ajuster notre mod\u00e8le. La syntaxe de <code>glm()<\/code> est la suivante :<\/p>\n<pre><code>mod &lt;- glm(formule, famille, donn\u00e9es)<\/code><\/pre>\n<p>Dans notre cas, la formule sera <code>purchase ~ age + income<\/code>, la famille sera <code>binomial<\/code> pour indiquer que nous faisons une r\u00e9gression logistique, et nous utiliserons notre jeu de donn\u00e9es <code>data<\/code>.<\/p>\n<pre><code class=\"language-r\"># Ajustement du mod\u00e8le de r\u00e9gression logistique\nmod &lt;- glm(purchase ~ age + income, family = binomial, data = data)<\/code><\/pre>\n<h3>\u00c9tape 3 : R\u00e9sum\u00e9 du mod\u00e8le<\/h3>\n<p>Pour voir les r\u00e9sultats de notre ajustement, nous pouvons utiliser la fonction <code>summary()<\/code> :<\/p>\n<pre><code class=\"language-r\"># R\u00e9sum\u00e9 du mod\u00e8le\nsummary(mod)<\/code><\/pre>\n<p>Cette commande affichera les coefficients du mod\u00e8le, les erreurs standards, les valeurs z et les p-values pour chaque variable. Les coefficients nous indiquent l&rsquo;effet de chaque variable ind\u00e9pendante sur la probabilit\u00e9 d&rsquo;achat.<\/p>\n<h3>\u00c9tape 4 : Pr\u00e9dictions<\/h3>\n<p>Une fois le mod\u00e8le ajust\u00e9, nous pouvons l&rsquo;utiliser pour faire des pr\u00e9dictions. Par exemple, pour pr\u00e9dire la probabilit\u00e9 qu&rsquo;un client de 30 ans avec un revenu de 50000 ach\u00e8te un produit, nous pouvons utiliser la fonction <code>predict()<\/code> :<\/p>\n<pre><code class=\"language-r\"># Pr\u00e9diction pour un nouveau client\nnouveau_client &lt;- data.frame(age = 30, income = 50000)\nprobabilit\u00e9_achat &lt;- predict(mod, nouveau_client, type = \"response\")\nprint(probabilit\u00e9_achat)<\/code><\/pre>\n<p>Cette commande nous donnera la probabilit\u00e9 que ce client ach\u00e8te le produit.<\/p>\n<h2>Conclusion<\/h2>\n<p>La r\u00e9gression logistique est un outil puissant pour mod\u00e9liser des r\u00e9sultats binaires. Avec la fonction <code>glm()<\/code> de R, il est facile d&rsquo;ajuster un mod\u00e8le et d&rsquo;interpr\u00e9ter les r\u00e9sultats.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ajuster un mod\u00e8le de r\u00e9gression logistique avec glm en R La r\u00e9gression logistique est une m\u00e9thode statistique utilis\u00e9e pour mod\u00e9liser la relation entre une variable d\u00e9pendante binaire et une ou plusieurs variables ind\u00e9pendantes. Dans cet article, nous allons voir comment ajuster un mod\u00e8le de r\u00e9gression logistique en utilisant la fonction glm() de R. Qu&rsquo;est-ce que la r\u00e9gression logistique ? La r\u00e9gression logistique est utilis\u00e9e lorsque la variable cible est binaire, c&rsquo;est-\u00e0-dire qu&rsquo;elle prend deux valeurs, souvent cod\u00e9es comme 0 et 1. Par exemple, nous pourrions vouloir pr\u00e9dire si un client va acheter un produit (1) ou non (0) en fonction de certaines caract\u00e9ristiques. Exemple concret<a class=\"more-link\" href=\"https:\/\/thinkr.fr\/abcdr\/ajuster_un_modele_de_regression_logistique_avec_glm\/\">Read More &rarr;<\/a><\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"content-type":"","rop_custom_images_group":[],"rop_custom_messages_group":[],"rop_publish_now":"initial","rop_publish_now_accounts":{"twitter_399453572_399453572":""},"rop_publish_now_history":[],"rop_publish_now_status":"pending","_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_post_was_ever_published":false},"categories":[14],"tags":[66,67],"class_list":{"0":"entry","1":"post","2":"publish","3":"author-vincent","4":"post-5198","6":"format-standard","7":"category-modelisation","8":"post_tag-glm","9":"post_tag-logistique"},"acf":[],"jetpack_featured_media_url":"","jetpack_shortlink":"https:\/\/wp.me\/p9O7Sx-1lQ","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/thinkr.fr\/abcdr\/wp-json\/wp\/v2\/posts\/5198","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/thinkr.fr\/abcdr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/thinkr.fr\/abcdr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/thinkr.fr\/abcdr\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/thinkr.fr\/abcdr\/wp-json\/wp\/v2\/comments?post=5198"}],"version-history":[{"count":0,"href":"https:\/\/thinkr.fr\/abcdr\/wp-json\/wp\/v2\/posts\/5198\/revisions"}],"wp:attachment":[{"href":"https:\/\/thinkr.fr\/abcdr\/wp-json\/wp\/v2\/media?parent=5198"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/thinkr.fr\/abcdr\/wp-json\/wp\/v2\/categories?post=5198"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/thinkr.fr\/abcdr\/wp-json\/wp\/v2\/tags?post=5198"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}