Formation (avec Manuela Royer) à R pour les actuaires, à Niort, organisée par Caritat.

Prise en main de « R » et Statistiques de base

1.1. Introduction
1.2. Prise en mains de « R »
Calculs simples. Calculs avec des vecteurs. Gestion des données manquantes. Nature des objets. Forme des objets
1.3. Application à une base de données en assurance automobile
Présentation des données. Charger les données sous ‘R’. Traitement des dates. Explication des variables : fichier client, fichier prime, fichier sinistre
1.4. Statistiques descriptives
Variables qualitatives. Variables quantitatives. Utilisation des différents types de graphiques
1.5. Statistiques inférentielles
Problématiques. Rappels sur les tests : comparaison d'une moyenne à une moyenne théorique, comparaison de moyennes entre échan-tillons indépendants, analyse de variance, test d'indépendance du Chi-2, test de corrélation. Applications.

Analyse multivariée sous « R »

2.1. Rappels de géométrie euclidienne
Nuage de points. Inertie. Nuage centré. Récapitulatif
2.2. Analyse en composantes principales
Principe, données, exemple. Interprétation : espace des individus, espace des variables, récapitulatif. Mise en pratique : application sur le fichier prime, récapitulatif des commandes
2.3. Analyse factorielle des correspondances
Principe, données, test d’indépendance du Chi-2. Nuages, profils colonnes, métrique du Chi-2, centrage du nuage. Interprétation.
2.4. Analyse des correspondances multiples
Principe, données brutes, tableaux disjonctifs. Cas particulier de deux variables. AFC du tableau disjonctif complet Z, généralisation à l’ACM. Application sur le fichier client. Application sur les données « banque » d’ade4.

Méthodes de régression

3.1. Le modèle linéaire
Format data frame. Fonction lm. Syntaxe model. Analyse de la régression
3.2. Les modèles GLM – Generalized Linear Model
Le principe des GLM : lois exponentielles et fonctions de lien. Comparaison des modèles. Analyse des régressions
3.3. Les modèles GAM – Generalized Additive Model
Principes des modèles GAM, le package gam. L’utilisation des splines en régression. Extension vers les modèles non paramétriques de régression
3.4. Mise en oeuvre des modèles
Modèle binaire 0/1. Données de comptage. Données positives
3.5. Les modèles dynamiques. Introduction aux séries temporelles
Les modèles ARIMA, le package forecast. Estimation des modèles ARIMA. Prévision à l’aide d’un modèle ARIMA

Provisionnement, Modèles non linéaires et Tables prospectives
4.1. La problématique du provisionnement et Chain ladder
Les triangles de provisionnement. Les link ratio et la méthode chain ladder. Incertitude sur les paramètres, la méthode de Mack
4.2. Les modèles factoriels
Utilisation des GLM en provisionnement. Mise en oeuvre de la régression log-Poisson
4.3. Bootstrap et provisionnement
Simulation des résidus du modèle GLM. Bootstrap ou simulations non paramétriques. Méthodes de Monte Carlo ou simulations paramétriques
4.4. Le modèle de Lee & Carter sur les tables de mortalité
Principe des tables prospectives. Package gnm et modèles non linéaires. Les programmes de LifeMetrics. Le package demography