Statistique de l'assurance STT6705V, partie 4b
By arthur charpentier on Thursday, September 23 2010, 20:11 - actuariat 10/11 STT6705V - Permalink
Avant toute autre chose, pour revoir le dernier cours, il suffit
d'aller ici
et là.
Bon, sinon, comme promis, les bases de données pour les projets sont en ligne ici. Le principe est simple. Il y a 28 bases de données, toutes semblables (mais bien sûr différentes), par les numéros ci-dessous. Comme toujours, premier arrivé, premier servi, donc les bases vont être attribuées au fur et à mesure
> k=1
> nom=paste("http://perso.univ-rennes1.fr/arthur.charpentier/6705V/UdM-baseC-",
+ k,".txt",sep="")
> baseC=read.table(nom,header=TRUE)
pour la base de contrats (et pour le groupe qui aurait choisi la base 1) et pour la base des sinistres,
> nom=paste("http://perso.univ-rennes1.fr/arthur.charpentier/6705V/UdM-baseS-",
+ k,".txt",sep="")
> baseS=read.table(nom,header=TRUE)
Ensuite, c'est parti, il s'agit de me proposer différents modèles de tarification, et de calculer les primes pures avec les différents modèles, pour une personne parmi les listes des personnes ayant les caractéristiques suivantes,
> client=data.frame(
+ exposition=rep(1,9),
+ zone=c("A","A","A","C","D","E","F","F","F"),
+ puissance=c(6,7,11,6,7,11,6,7,11),
+ agevehicule=c(0,1,5,10,5,1,0,6,10),
+ ageconducteur=c(25,18,55,55,55,40,21,20,18),
+ bonus=c(80,100,50,60,55,50,100,125,100),
+ marque=c(1,2,12,12,12,1,1,1,2),
+ carburant=c("D","E","E","D","D","E","E","D","D"),
+ densite=rep(3000,9),
+ client=rep(baseC$region[1],9))
(si certains modalités ne sont pas présentes dans la base, il faut choisir quelqu'un d'autre.... sur les neuf, il doit bien en avoir un(e) qui pourrait être présent(e) dans votre base de données). En cas de problème, vous avez mon adresse électronique.... Et je reviendrais ultérieurement sur la forme de ce que j'attends.
Bon, sinon, comme promis, les bases de données pour les projets sont en ligne ici. Le principe est simple. Il y a 28 bases de données, toutes semblables (mais bien sûr différentes), par les numéros ci-dessous. Comme toujours, premier arrivé, premier servi, donc les bases vont être attribuées au fur et à mesure
- étape 1: choisir une base
- étape 2: récupérer les données
> k=1
> nom=paste("http://perso.univ-rennes1.fr/arthur.charpentier/6705V/UdM-baseC-",
+ k,".txt",sep="")
> baseC=read.table(nom,header=TRUE)
pour la base de contrats (et pour le groupe qui aurait choisi la base 1) et pour la base des sinistres,
> nom=paste("http://perso.univ-rennes1.fr/arthur.charpentier/6705V/UdM-baseS-",
+ k,".txt",sep="")
> baseS=read.table(nom,header=TRUE)
Ensuite, c'est parti, il s'agit de me proposer différents modèles de tarification, et de calculer les primes pures avec les différents modèles, pour une personne parmi les listes des personnes ayant les caractéristiques suivantes,
> client=data.frame(
+ exposition=rep(1,9),
+ zone=c("A","A","A","C","D","E","F","F","F"),
+ puissance=c(6,7,11,6,7,11,6,7,11),
+ agevehicule=c(0,1,5,10,5,1,0,6,10),
+ ageconducteur=c(25,18,55,55,55,40,21,20,18),
+ bonus=c(80,100,50,60,55,50,100,125,100),
+ marque=c(1,2,12,12,12,1,1,1,2),
+ carburant=c("D","E","E","D","D","E","E","D","D"),
+ densite=rep(3000,9),
+ client=rep(baseC$region[1],9))
(si certains modalités ne sont pas présentes dans la base, il faut choisir quelqu'un d'autre.... sur les neuf, il doit bien en avoir un(e) qui pourrait être présent(e) dans votre base de données). En cas de problème, vous avez mon adresse électronique.... Et je reviendrais ultérieurement sur la forme de ce que j'attends.







Comments
Comment fait on pour avoir la base en txt ou csv afin de pouvoir travailler même si on est pas sur internet?
REPONSE: très bonne question.... tu vas sur les liens, par exemple pour la dernière base, tu vas sur
http://perso.univ-rennes1.fr/arthur.charpentier/6705V/UdM-baseC-28.txt
puis une fois la base ouverte, tu fais "enregistrer sous" ou "save as",

pareil, tu vas ensuite surhttp://perso.univ-rennes1.fr/arthur.charpentier/6705V/UdM-baseS-28.txt
et tu enregistres,
tu as la base sauvé sur ton disque. Tu peux la mettre sur ton disque, par exemple sur "D:\bases de données". Le plus simple pour lire est ensuite de faire
> setwd("D:\\bases de données")
après tu as juste besoin de faire
> k=28
> nom=paste("UdM-baseC-", k,".txt",sep="")
> baseC=read.table(nom,header=TRUE)
pour la base de contrats (et pour le groupe qui aurait choisi la base 1) et pour la base des sinistres,
> nom=paste("UdM-baseS-", k,".txt",sep="")
> baseS=read.table(nom,header=TRUE)