Objective The data {rsample} Grouped and stratified train/test split and resamples {doMC} Set up parallel processing Logistic Regression with formula pre-processor Reproducing “non-tidymodels” specs in tidymodels GLM (unweighted) GLM (weighted) GAM (with splines) (weighted) XGBoost (weighted) lightgbm (unweighted) lightgbm weighted (not implemented in tidymodels) Use workflow_set to fit all logitics models specification on all resamples Add hyperparameter tuning to the workflow_set Logistic Regression with recipe pre-processor Tweedie regression Estimate tweedie “p” parameter Reproducing “non-tidymodels” specs in tidymodels GLM weighted GAM (with splines) weighted XGBoost weighted TODO: Poisson regression Reproducing “non-tidymodels” specs in tidymodels GLM weighted GAM (with splines) weighted xgboost weighted TODO: Gamma regression resources Objective I want to implement a tweedie regression similar to what one would face in the insurance industry using the {tidymodels} ecosystem.

Continue reading

Question: Est-ce que le taux de participation est corrélée avec le fait d’avoir une élection “serrée” dans une circonscription? Réponse : pas vraiment. Nouvelle hypothèse: peut-être qu’On devrait mettre le nombre de victoires du parti dominant dans les 10 dernières élections en X. données proviennent d’ici: https://www.dgeq.org/donnees.html on utilise https://www.dgeq.org/circonscriptions.csv pour le taux de participation et candidats.csv pour le nombre de votes des candidats. Le même graphique mais interactif pour pouvoir identifier les circonscriptions (mettez votre curseur vis à vis un point pour identifier la circonscription).

Continue reading

Ça parle beaucoup d’impôt sur le patimoine (ou avoir net) ces temps-ci au Québec! Dans un post précédent, j’ai validé la proportion des gens qui seraient touchés par la taxe sur la richesse proposée. Rappelons les paramètres: Impôt sur les grandes fortunes : Le premier million d’actifs net est exempté d’impôt Entre 1 million et 9,9 millions: 0,1% de l’actif net Entre 10 millions et 99 millions: 1% de l’actif net Plus de 100 millions: 1,5% de l’actif net La question que je me pose aujourd’hui:

Continue reading

Ça parle beaucoup d’impôt sur le patimoine (ou avoir net) ces temps-ci au Québec Un échange intéressant entre Pierre-Yves McSween (@PYMcsween) et Olivier Jacques (@OliJacques89) sur twitter m’a fait réaliser que l’impôt foncier ressemble vaguement à un impôt sur le patrimoine. Quand je dis que je suis un économiste non pratiquant, c’est un bon exemple de mon manque de culture. :) Regardez le comparatif global. (rapport de la commission qui devrait être mis à jour, mais c'est une base de référence).

Continue reading

Aujourd’hui, on vous annonce deux nouveaux outils fiscaux qui ne s’appliqueront qu’aux gens ayant plus d’un million de dollars d’actifs nets: un impôt sur les grandes fortunes et un impôt sur les grandes successions. #qc2022 — Gabriel Nadeau-Dubois (@GNadeauDubois) September 6, 2022 Résultat des courses: 95% des Québécois ne paieront rien de plus. Le 5% le plus riche devra payer un peu plus. Ce n’est pas un impôt sur les riches, c’est un impôt sur les ultra-riches.

Continue reading

Données annuelles aggrégées Évolution du don moyen ## [1] "/home/simon/git/snippets/content/post/2022-09-05-regardons-donc-les-dons/output/evolution_des_dons.png" Données annuelles par circonscriptions Rétention et attraction Rétention: Quel est le pourcentage de donateurs qui de 2021 qui ont aussi donné en 2022 ? Attraction: Quel est le pourcentage des donateurs de 2022 qui n’avaient pas donné en 2021 ? ## # A tibble: 5 × 7 ## entite_politique pct_retention pct_nouveau total_donneurs_… don_2021_seul ## <chr> <dbl> <dbl> <int> <int> ## 1 Québec solidaire 0.

Continue reading

elections-quebec-2022

WORK IN PROGRESS, CODE DÉGUEUX, J’AI MÊME PAS ATTEIT MON OBJECTIF ENCORE Ok j’ai envie de sortir les données par bureau de scrutin et regarder le lift de quelques variables sur le pourcentage de vote de chaque parti. On va vouloir -résultats par section de vote aux élections générales de 2018. (https://www.dgeq.org/archives.html) les package cancensus (données du recensement) et tongfen de Jens Von Bergman https://www.dgeq.org/sections_vote_2018_shapefile.zip # supposé être ISO 8859‑1 https://www.

Continue reading

Author's picture

Simon Coulombe

gosseux de données | pelleteux de cloud

data scientist in the insurance industry

Québec, Canada