
Pour faire simple, la base de prénoms inclue un sexe. Mais si on regarde le rapport du nombre de garçon sur le nombre de filles, à la naissance, on a le graphique ci-dessous,
dat=read.table("nat2004.csv",sep=";",header=TRUE)
naissancesm=rep(NA,105)
for (i in 1900:2004) {
naissancesm[i-1899]=sum(dat[dat$annais==i&dat$sexe==1,"nombre"],
na.rm=TRUE)
}
naissancesf=rep(NA,105)
for (i in 1900:2004) {
naissancesf[i-1899]=sum(dat[dat$annais==i&dat$sexe==2,"nombre"],
na.rm=TRUE)
}
plot(1900:2004,naissancesm/naissancesf,col="red")

La tendance du début est très surprenante. Par exemple, si on
reprend les chiffres donnés par Pierre Simon Laplace sur les naissances
à Paris entre 1750 et 1800 (mentionné hier, ici)
on est déjà sur ratio de l'ordre de 1.05 (que l'on retrouve sur la fin
de notre graphique, mais pas le début).
> 393386/377555
[1] 1.041930
> 251527/241945
[1] 1.039604


b=read.table("http://freakonometrics.blog.free.fr/public/data/sex-ratio.txt")
X=b$V1
Y=b$V2/(100-b$V2)
lines(X,Y,col="blue")
Attention donc à la variable de sexe dans la base surtout avant guerre
(en espérant que ce soit le seul soucis). Et je renvoie au blog de Baptiste qui publie toujours des choses très amusantes sur les prénoms, ici (je n'ai plus trop eu le temps de travailler dessus depuis les 5 billets en ligne là).






