Formation (avec
Manuela Royer) à R pour les actuaires, à Niort, organisée par
Caritat.

Prise en main de « R » et Statistiques de base
1.1. Introduction
1.2. Prise en mains de « R »
Calculs simples. Calculs avec des vecteurs. Gestion des données manquantes. Nature des objets. Forme des objets
1.3. Application à une base de données en assurance automobile
Présentation des données. Charger les données sous ‘R’. Traitement des
dates. Explication des variables : fichier client, fichier prime,
fichier sinistre
1.4. Statistiques descriptives
Variables qualitatives. Variables quantitatives. Utilisation des différents types de graphiques
1.5. Statistiques inférentielles
Problématiques. Rappels sur les tests : comparaison d'une moyenne à une
moyenne théorique, comparaison de moyennes entre échan-tillons
indépendants, analyse de variance, test d'indépendance du Chi-2, test
de corrélation. Applications.
Analyse multivariée sous « R »
2.1. Rappels de géométrie euclidienne
Nuage de points. Inertie. Nuage centré. Récapitulatif
2.2. Analyse en composantes principales
Principe, données, exemple. Interprétation : espace des individus,
espace des variables, récapitulatif. Mise en pratique : application sur
le fichier prime, récapitulatif des commandes
2.3. Analyse factorielle des correspondances
Principe, données, test d’indépendance du Chi-2. Nuages, profils colonnes, métrique du Chi-2, centrage du nuage. Interprétation.
2.4. Analyse des correspondances multiples
Principe, données brutes, tableaux disjonctifs. Cas particulier de deux
variables. AFC du tableau disjonctif complet Z, généralisation à l’ACM.
Application sur le fichier client. Application sur les données « banque
» d’ade4.
Méthodes de régression
3.1. Le modèle linéaire
Format data frame. Fonction lm. Syntaxe model. Analyse de la régression
3.2. Les modèles GLM – Generalized Linear Model
Le principe des GLM : lois exponentielles et fonctions de lien. Comparaison des modèles. Analyse des régressions
3.3. Les modèles GAM – Generalized Additive Model
Principes des modèles GAM, le package gam. L’utilisation des splines en
régression. Extension vers les modèles non paramétriques de régression
3.4. Mise en oeuvre des modèles
Modèle binaire 0/1. Données de comptage. Données positives
3.5. Les modèles dynamiques. Introduction aux séries temporelles
Les modèles ARIMA, le package forecast. Estimation des modèles ARIMA. Prévision à l’aide d’un modèle ARIMA
Provisionnement, Modèles non linéaires et Tables prospectives
4.1. La problématique du provisionnement et Chain ladder
Les triangles de provisionnement. Les link ratio et la méthode chain ladder. Incertitude sur les paramètres, la méthode de Mack
4.2. Les modèles factoriels
Utilisation des GLM en provisionnement. Mise en oeuvre de la régression log-Poisson
4.3. Bootstrap et provisionnement
Simulation des résidus du modèle GLM. Bootstrap ou simulations non
paramétriques. Méthodes de Monte Carlo ou simulations paramétriques
4.4. Le modèle de Lee & Carter sur les tables de mortalité
Principe des tables prospectives. Package gnm et modèles non linéaires. Les programmes de LifeMetrics. Le package demography