La SAAQ publie les rapports d’accidents remplis par les policiers en format de données ouvertes. J’ai utilisé les données de 2011 à 2017pour identifier les endroits les plus accidentogènes pour les piétons et les vélos. Avec un peu de chance ce post permettra à un planificateurs de corriger un des endroits les plus dangereux. Les données comportent environ 700 000 accidents déclarés aux policiers, dont 32 642 impliquant un piéton ou un cycliste.

Continue reading

La neuvième enquête origine-destination de la région de Québec s’est déroulée du 6 septembre au 12 décembre 2017. Elle a été réalisée par un partenariat regroupant le Ministère, le Réseau de transport de la Capitale (RTC), la Société de transport de Lévis, la Ville de Québec, la Ville de Lévis, ainsi que la Communauté métropolitaine de Québec. Le ministre calcule que 40 % des déplacements interrives se font d’est en est, contre 60 % d’ouest en ouest.

Continue reading

UPDATE 2020: addr.country, n’existe plus dans les buildings de osm data. aussi il faut faire st_collection_extract(type=“POLYGON”) car mes intersections ont commencé à retourner des geometry collection This morning I heard an annoucement from the provincial government telling me that preparing for floods is my responsibility, that I should check if my house is in a floodable area and that I should visit quebec.ca/inondations for more information. We currently have multiple major flooding events in the city of Gatineau.

Continue reading

Dessine moi un tramway

J’ai créé une application qui vise à prédire la part modale du tramway proposé de la ville de Québec. Pouvez-vous dessiner un meilleur tramway que le maire? En 2014, l’application “Mes trajets” a recensé 16 000 trajets en auto effectués par les habitants de la région de Québec et Lévis. Je compare ces trajets d’auto au tracé de tramway afin de voir lesquels pourraient utiliser le tramway. J’ai dû faire des hypothèses fortes pour simplifier.

Continue reading

UPDATE 2020: skimr v2 now produces nice html in rmarkdown, so skimr::kable() has been deprecated. https://www.r-bloggers.com/reintroducing-skimr-v2-a-year-in-the-life-of-an-open-source-r-project/ Introduction Ratemaking models in insurance routinely use Poisson regression to model the frequency of auto insurance claims. They usually are GLMs but some insurers are moving towards GBMs, such as xgboost. xgboosthas multiple hyperparameters that can be tuned to obtain a better predictive power. There are multiple ways to tune these hyperparameters. In order of efficiency are the grid search, the random search and the bayesian optimization search.

Continue reading

Context The Summer of 2018 was ridiculously hot and we decided that we wanted to buy a central air conditioning unit. Would spending more to get an air-air heat pump instead make economic and environmental sense? a quick note: shopping for heat pumps sucks. Every salesman claims to have the best reliability and service, and there is no independent source that will help you sort it out. A quick introduction to heat pumps The air-to-air heat pump is an amazing device.

Continue reading

Intro L’actualité, has recently published 2018 annual list of stocks recommended by experts. I usually welcome these lists with a sigh, but this time I thought I’d compare the past results of portfolios built using their past suggestions to the returns an investor would have received by following a “couch potato” investing. The couch potato portfolio is built using 33% Canadian index stocks, 33% American stocks and 33% international stocks.

Continue reading

Author's picture

Simon Coulombe

gosseux de données | pelleteux de cloud

data scientist in the insurance industry

Québec, Canada