Freakonometrics

To content | To menu | To search

Tuesday, February 14 2012

Saint Valentin: photos, jeux et matching

Il y a deux ans, pour mon billet spécial Saint Valentin, j'avais parlé des sites de rencontres. En fait, les sites de rencontres permettent d'aborder des vraies sujets intéressants, comme des problèmes de théorie des jeux... Par exemple, on peut se demander s'il est optimal de trafiquer sa photo, afin d'augmenter la probabilité d'avoir un rendez-vous (et faire un jeu séquentiel)

Car la photo est importante... enfin, c'est ce qu'on peut lire sur certains sites. On peut ainsi apprendre que les femmes regardent moins longtemps les photos (même si la photo du profil demeure le centre de l'attention): les femmes ne s'y attardent en moyenne que 3 secondes (ci-dessous à gauche), contre 5 pour les hommes (ci-dessous à droite).
Je pensais étudier un problème de théorie des jeux, mais http://ricochet.com/ notait que "statistically, the most popular women on the site aren't the ones with the highest attractiveness ratings.  They're the ones with the most disparate". La conclusion était alors sans appel "if you're a little chubby, play it up. If you have a big nose, play it up. If you have a weird snaggletooth, play it up: statistically, the guys who don't like it can only help you, and the ones who do like it will be all the more excited". Moralité il est optimal de ne pas changer sa photo... Sinon pour aller plus loin sur les "choix optimaux" de partenaires proposés par les sites , Alfred a mis en ligne deux séries de notes de cours sur les problèmes d'optimal matching, avec les notes de Columbia, et celles de l'ENSAE. Donc de billet révolutionnaire cette année, pas mal de lecture avec les notes d'Alfred, et on fera mieux l'an prochain...

Tuesday, February 22 2011

What could be a generalist academic journal in economics ?

In France, researchers in economics are evaluated based on their publications in economics journals. In 2008, there was a list (that can be found here) where journals appear in some categories, namely

  • macroeconomics (macro), Journal of Economic Growth, Journal of International Economics, Journal of Monetary Economics, Journal of Money, Credit and Banking
  • human resources (HR), Industrial and Labor Relations Review, Journal of Human Resources, Personnel Psychology
  • law (law), International Review of Law and Economics, Journal of Law and Economics, Journal of Law, Economics, and Organization, Journal of Legal Studies
  • production and operation management (operation), International Journal of Production Economics, Journal of Operations Management, Production and Operations Management
  • marketing (marketing), Journal of Consumer Research, Journal of Marketing, Journal of Marketing Research, Marketing Science
  • industrial organization (industrial), International Journal of Industrial Organization, Journal of Economics and Management Strategy, Journal of Industrial Economics,RAND Journal of Economics
  • public economics (public), Journal of Public Economics, Public Choice, Social Choice and Welfare
  • operations research (OR), European Journal of Operational Research, Mathematical Programming, Mathematics of Operations Research, Operations Research
  • health economics (health), American Journal of Public Health, Health Economics, Journal of Health Economics, Social Science and Medicine
  • information systems (IS), European Journal of Information Systems, Information Systems Research, Journal of MIS, MIS Quarterly
  • development and transition economics (developement), Economic Development and Cultural Change, Economics of Transition, Journal of Comparative Economics, Journal of Development Economics, World Bank Economic Review,World Development
  • urban, spatial and regional economics (urban), Economic Geography, Journal of Economic Geography, Journal of Urban Economics
  • strategy and management (strategy), Academy of Management Journal, Academy of Management Review, Organization Science, Strategic Management Journal
  • economic theory, econometrics, games and decision (theory), Econometric Theory, Economic Theory, Games and Economic Behavior, Journal of Econometrics, Journal of Economic Theory, Journal of Mathematical Economics
  • labor economics (labor), Demography, Journal of Human Resources, Journal of Labor Economics
  • innovation and entrepreneurship (innovation), Entrepreneurship: Theory and Practice, Journal of Business Venturing, Journal of Product Innovation Management
  • history of economic thought (hist), Economic History Review, Economics and Philosphy, European Journal of the History of Economic Thought, History of Political Economy,Journal of Economic History
  • finance and insurance (finance), Journal of Finance, Journal of Financial and Quantitative Analysis, Journal of Financial Economics, Review of Financial Studies
  • agriculture, environmental and energy (agr), American Journal of Agricultural Economics, Ecological Economics, Journal of Environmental and Economic Management
  • accouting and auditing (acc), Accounting Review, Accounting, Organization and Society, Journal of Accounting and Economics, Journal of Accounting Research, Review of Accounting Studies
I just focus here on (so called) top journals in each category. It is possible to look (as done here) at projections of journals on the two first principal components, built on words that appear in titles of the articles. I use here the same methodology as the one I used earlier (e.g. I skip common words like and or with). I tried to use keywords, but in my dataset, some (actually, a lot of them) journals do not give that information... so I did not use it.
Here, we obtain the following

(categories are plotted here as supplementary observations). Here is a zoom,

So, on the upper right, we have marketing and industrial economics journals, while health is below. If we look at words projected on those two axis,

In the lower part, we find health, social or development. In the upper part is dynamics, systems or problem. So far, so good...
But recall that there is also a so called general category in the list,
  • general (general), Administrative Science Quarterly, American Economic Review, Econometrica, Journal of Economic Literature, Journal of Political Economy, Management Science, Quarterly Journal of Economics, Review of Economic Studies, Economic Journal, European Economic Review, International Economic Review, Journal of Economic Perspectives
So, I was wondering where those journals appear in the principal component analysis. We might expect them to be at the origin (since we rescale our counts, in order to focus on frequency of words in titles, not length of titles, or number of articles per year). But actually when we look at words per category, with general as a supplementary variable, we observe the following

(the axis obtained on categories as observations are rather closed to the one we had on journals as observations, but it looks like - here - the second axis has been inverted). Words are closed also from the one we got before,

So it looks like general journals deal with time and dynamics, as well as problems... But obviously, those general journals do not care about health or human resources. Now, if we run an automatic hierarchical classification, general is quite far away from the other journals,

Some cluster are quite intuitive (macro economics and finance, or theory and operation research), and general belongs to none of them.
So in some sense, general journals cannot be connected to any categories. Except perhaps if we look closer: some journals belong to some categories, like Management Science and Journal of Economic Perspective.

So finally, it looks like two journals should be removed from that list, and then, general journals would be in the middle, i.e. they would be truly transversal, or generalist.


Monday, November 8 2010

70% des salariés français touchent moins de 1 500 € par mois ?

Hier, @ me demandait de commenter l'information comme quoi "70% des salariés français touchaient moins de 1 500 € par mois". Tout d'abord, rappelons que selon l'INSEE, en 2008, le salaire médian net en France est de l'ordre de 1655 € par mois pour un temps plein (cf ici par exemple). Comme c'est la médiane (je renvoie ici pour une bonne blague du nouvel obs sur la médiane, comme quoi il ne faut pas toujours croire ce qu'on lit), c'est que 50% des français touchent ce salaire, ou plutôt toucheraient ce salaire s'il travaillaient à temps plein.... Le hic est que généralement l'insee normalise les données, et ne parle que de taux plein...

Mais heureusement l'insee met aussi a disposition des bases, en particulier la base dads2007, ici, avec un fichier de 25Mo (zippé) , contenant près de 2 millions d'observations, dont le temps travaillé en 2007 et le salaire (ou plutôt une tranche de salaire). Le code est plutôt simple (même si j'ai travaillé sur la première moitié de la base, suite à des soucis d'importation sur mon petit portable),
> library(foreign)
> base=read.dbf("D:\\r-data\\salaries07.dbf")
> TRANCHE=c(0,100,300,600,1000,1300,2000,3000,
+ 4000,5000,7000,9000,11000,12500,14000,16000,
+ 18000,20000,24000,30000,1000000000)
> salinf=TRANCHE[1:20]
> salsup=TRANCHE[2:21]
Bref, on peut récupérer des salaires médians, par temps plein (afin de voir si nos données sont représentatives), en notant qu'un temps plein c'est 1820 heures dans l'année (cf ici)
> Xinf=salinf[base$TRNNETO+1]/base$NBHEUR_TOT*1820/12
> Xsup=salsup[base$TRNNETO+1]/base$NBHEUR_TOT*1820/12
> quantile(Xinf,.5,na.rm=TRUE)
50%
1484.745
> quantile(Xsup,.5,na.rm=TRUE)
50%
1685.185
Comme nous ne sommes pas trop loin des 1655 indiqués, j'aurais tendance à faire confiance à nos chiffres (en se plaçant proches de la borne supérieure d'ailleurs).
Mais si on travaille sur le revenu, et pas le revenu pour un temps plein, les chiffres sont un peu différents,
> Xinf=salinf[base$TRNNETO+1]/12
> Xsup=salsup[base$TRNNETO+1]/12
> quantile(Xinf,.5,na.rm=TRUE)
50%
1333.333
> quantile(Xsup,.5,na.rm=TRUE)
50%
1500
Pour revenir à nos moutons, si on s'intéresse à la proportion des français qui touchent moins de 1500 € par mois, j'obtiens
> mean(Xinf<=1500)
[1] 0.6118895
> mean(Xsup<=1500)
[1] 0.5236287
C'est à dire qu'à la louche, je pense que 55% des français touchent moins de 1500 € par mois. A condition que les chiffres soient en net. Si la citation parlait du brut, ça correspond en gros à du 1200 € par mois, et on a alors les proportions suivantes,
> mean(Xinf<=1500*.8)
[1] 0.4215607
> mean(Xsup<=1500*.8)
[1] 0.3143752
D'ailleurs un petite remarque sur ces histoires de revenu et de temps de travail. Si le temps travaillé par mois et le salaire horaire étaient des variables indépendantes, j'aurais pu faire des calculs rapides à partir de la distribution du temps de travail. Malheureusement, ces deux données ne sont pas indépendantes. Pour s'en convaincre, calculons le produit des espérances (salaire moyen horaire par temps moyen travaillé par mois) et l'espérance du produit (revenu moyen)
> Xinf=salinf[base$TRNNETO+1]/base$NBHEUR_TOT*1820/12
> Xsup=salsup[base$TRNNETO+1]/base$NBHEUR_TOT*1820/12
> mean(Xinf[Xinf<1000000000000],na.rm=TRUE)*
+ mean(base$NBHEUR_TOT/1820)
[1] 1609.669
> mean(salinf[base$TRNNETO+1])
[1] 16832.14
qui ne sont manifestement pas égaux. On a même un dépendance positive entre le salaire horaire et le temps de travail mensuel.
On retrouve ici le fait que les personnes qui effectuent les travaux avec les salaires horaires les plus bas sont aussi celles qui travaillent le moins. D'un point de vue technique, pour étudier les inégalités temps de travail/revenu horaire, c'est un peu compliqué à cause du produit. C'est pour ça qu'avec Stéphane Mussard on avait introduit la décomposition  des mesures d'inégalités pour des inégalités multiplicatives, ici.
Mais on sort du cadre du papier, et ma réponse serait que non, je doute que la personne soit de bonne foi (la seule source que j'ai trouvé sur internet donnant ces chiffres était ici).

Saturday, September 18 2010

"le prix de l'or bat de nouveaux records" et alors ?

Histoire de changer un peu, un rapide billet d'économie... bien que l'économie monétaire ne soit pas mon domaine de prédilection, loin de là. Mes compétences en la matière (comme sur beaucoup de notions en économie) se limitent à la lecture (mais aussi une intense relecture) d'Obélix et Compagnie...

je dois avouer que je suis surpris par les commentaires de certains journalistes économiques, qui nous expliquent que "l'or a atteint des niveaux historiques" (ici, même si ça date un peu) ou que "le prix de l'or bat de nouveaux records" (ce matin cette fois, ). On peut aussi lire ici ou . On peut s'en convaincre en jetant un œil aux graphiques ici, , ou encore. Sans vouloir être méchant, si je transpose ca a une discussion que je pourrais avoir avec mes enfants, ça donnerait: "On a mis 150 euros sur un compte A le jour de votre naissance... c'est incroyable, mais tous les 15 jours, on bat des records: vous êtes de plus en plus riche !

En fait, effectivement, le prix de l'or atteint des records... mais qu'est-ce que je peux faire de ce "prix historique" quand on sait qu'à coté, tout augmente (comme dirait ma grand mère)... On pourrait normaliser par rapport a autre chose, par exemple un indice boursier (car on parle d'investissement), ou comme le font plutôt les économistes, avec quelque chose en rapport avec la masse monétaire. Non ?
Faisons les calculs: les séries du prix de l'or se trouvent ici par exemple (avec des séries journalières pour les années les plus récentes), et pour les données permettant d'actualiser, on pourra aller ici. Pour faire simple, je me suis contenté des données mensuelles en ligne ici, et pour la masse monétaire, M3 serait pas mal (je renvoie ici pour les détails), mais la Réserve Fédérale américaine ne le publie plus depuis 2006. J'aurais bien aimé aller ici, mais c'est payant. Finalement je suis allé , en extrapolant M3 sur les années récentes (de 2006 à 2010) en utilisant le taux de croissance observé sur M2. Les données ne sont pas corrigées des variations saisonnières.
>  OR = read.table("http://perso.univ-rennes1.fr/
arthur.charpentier/prix-or-mensuel.csv",
+ sep=";",header=TRUE)
>  tOR=as.vector(t(OR[,2:13]))
>  VOR=tOR[1:511]
car j'avais mis des 0 pour les mois non observés de 2010 (on les supprime tout simplement). Sinon on retrouve la courbe qui indique qu'effectivement, on a atteint des records...
>    TOR=ts(VOR, frequency = 12, start = c(1968, 1))
>    plot(TOR,col="red")

So what ? Regardons un peu notre masse monétaire qui permettra de ramener le prix de l'or dans le passé au prix réel de l'argent,
>    M = read.table("http://perso.univ-rennes1.fr/
arthur.charpentier/M1M2M3.txt")
>    M2=as.numeric(as.character(rev(M$V4)))
>    M3=as.numeric(as.character(rev(M$V5)))
>    M2b=M2[560:length(M2)]/M2[559]
>    M3[560:length(M3)]=M3[559]*M2b
>    TM3=ts(M3,frequency=12,start=c(1959,1))
>    plot(TM3,col="blue")

Bon, j'ai fait une approximation rapide, mais c'est vraiment histoire de voir ce qui se passe si on normalise le prix de l'or. Ceux qui veulent aller plus loin peuvent améliorer le code. Et en corrigeant pour travailler à quantité d'argent équivalent, on obtient des choses un peu différentes (j'aime les euphémismes)
>    TM3b=ts(M3[(12*9+1):length(M3)],
+    frequency = 12, start = c(1968, 1))
>    TORb=TOR/TM3b
>    plot(TORb,col="purple")
>    abline(h=TORb[length(TORb)],lty=2)

On a certes une hausse relativement importante depuis un peu moins de 10 ans du prix de l'or, mais le niveau n'est en rien comparable avec la crise qui s'est observé en 1980 (évoqué ici, , ou encore). Fort heureusement, on ne nous tient pas le même discours sur le PIB, nous expliquant qu'il ne cesse de battre, mois après mois, de nouveaux records ! On notera que ce graphique se rapproche d'autres, en ligne, ici ou ...
Pour ceux qui ne sont pas convaincu que l'or puisse être relié à une grandeur monétaire, on peut voir l'or comme une alternative à un placement en bourse, et comparer à un indice boursier (par exemple le SP500 pour rester aux États Unis),
>    SP=read.table("http://ichart.finance.yahoo.com/
table.csv?s=%5EGSPC&a=00&b=1&c=1968&d=08
&e=18&f=2010&g=m&ignore=.csv",
+       sep=",",header=TRUE)
>    tSP=rev(SP$Close)
>    TSP=ts(tSP, frequency = 12, start = c(1968, 1))
>    plot(TSP,col="red")

>    TORc=TOR/TSP
>    plot(TORc,col="purple")
>    abline(h=TORc[length(TORc)],lty=2)

Bref, quelle que soit la quantité retenue pour normaliser, on se rend compte que les niveaux atteints ces derniers mois sont très loin de ceux observés en 1980, voire dans les années 80. Pas de quoi en faire la une de la presse....

Wednesday, August 4 2010

Propriétaire ou locataire ?

Il existe une mythologie aujourd'hui bien ancrée, consistant à penser qu'il faut être propriétaire de son logement. C'est d'ailleurs le message que l'État (c'est à dire nous tous) véhicule sur différentes affiches, comme celle à droite. Tout le monde a déjà entendu l'adage prétendant que "payer un loyer, c'est jeter de l'argent par les fenêtres"....mais personnellement, j'ai l'impression que rembourser un crédit, c'est aussi '"jeter de l'argent par les fenêtres". Dans le premier cas, c'est le propriétaire qui est derrière la fenêtre, alors que dans le second cas c'est une banque (mais aussi un notaire, et l'état qui récupère beaucoup d'impôt).
Visiblement, l'État semble avoir pris le parti qu'enrichir les propriétaires, c'est mal, alors qu'enrichir son banquier c'est bien...  Peut être est-ce mieux dans l'intérêt collectif (car c'est le but ultime de l'État me semble-t-il) d'être tous propriétaires ? Mais qu'en est-il de l'intérêt individuel ? Ai-je vraiment intérêt à préférer être propriétaire plutôt que locataire ?
On peut essayer de faire un petit modèle simple, voire simpliste... Considérons quelqu'un possédant un apport personnel de 100 000 € (je mets des sommes rondes pour simplifier le modèle), et souhaitant loger dans une maison qui vaut 300 000 €. Il a deux possibilités,

  • devenir propriétaire du bien
  • être locataire du bien (on suppose que le choix est possible pour le même bien)
Dans le premier cas, on va supposer que qu'il est possible d'avoir un crédit sur 20 ans pour un taux de 5,5%. On va supposer qu'il y a 10% de frais d'acquisition, entre l'agent immobilier et le notaire. On oubliera les charges annuelles en tant que propriétaire, et les éventuels crédit d'impôt sur les intérêts.
Dans le second cas, il paye un loyer de 1 000 € par mois, éventuellement revalorisé (+2% par an par exemple), mais il a la possibilité d'épargner (en plus de capitaliser ce qui constituait l'apport initial s'il achetait).
En fait, dans les deux cas, il épargne. On peut partir du fait qu'il a 2 000 € à allouer au logement (ce montant peut également être revalorisé). Dans le second cas, il peut épargner 1 000 € par mois, et dans le premier, la différence entre les mensualités qu'il doit à la banque et les 2 000 €. On suppose que les taux de placement sont à 4,5%. 
Au bout de 15 ans, la maison vaut 500 000 €. Notons que la revalorisation à 2% est plus faible que la croissance de la valeur du bien (passer de 300 à 500 en 20 ans correspond à une valorisation annuelle de 2,5%). Le propriétaire a-t-il vraiment fait une bonne affaire ?
> capital=100000
> revenu =2000
> loyer  =1000
> i1     =.055
> i2     =.045
> i3     =.02
> T      =20
> maison1=300000
> maison2=500000
> mensualite=(maison1*1.1-capital)/sum((1+i1)^(-(1:(T*12))/12))
> mensualite
[1] 1564.789
> (1+i3)^T
[1] 1.485947
> locataire    = capital*(1+i2)^T+sum((1+i3)^((1:(T*12))/12)*(revenu-loyer)*(1+i2)^((1:(T*12))/12))
> proprietaire = maison2+sum((revenu-mensualite)*(1+i3)^((1:(T*12))/12)*(1+i1)^((1:(T*12))/12))
> locataire
[1] 728274.5
> proprietaire
[1] 738245.5
> (proprietaire-locataire)/proprietaire
[1] 0.01350635
Autrement dit pour être propriétaire, les mensualités sont de 1 564 € par mois (constantes), alors que le locataire aurait eu un loyer de 1 000 € initialement, revalorisé de 2%  par an, soit 1 485 € par mois sur la fin. Bref, au final, le locataire, qui a mis 1 000 € par mois (revalorisés là aussi à 2%) se retrouve à la tête de 728 milliers € alors que le propriétaire a vu son bien se valoriser (et atteindre 500 milliers €), mais il a également pu épargner un peu. Bref, il se retrouve à la tête d'un patrimoine de 738 milliers €. Ce qui est comparable.... Moralité, on jette autant d'argent par les fenêtres dans les deux cas, mais du point de vue de la personne qui loge dans l'appartement, ça se vaut...
Mais au delà des montants, on peut surtout étudier l'impact des différents paramètres....
Le graphique ci-dessous montre l'impact du capital initial: s'il est trop faible, être locataire est beaucoup plus intéressant,

(les ordonnées positives signifie que la richesse en tant que propriétaire excède celle que l'on aurait en tant que locataire). Autrement dit, avec un faible capital initial, il sera coûteux de devenir propriétaire. Ici, il faut disposer d'au moins 1/3 du prix de la maison en apport. Mais grosso modo, plus on est riche, plus on peut avoir intérêt à devenir propriétaire. On peut aussi regarder l'impact du taux d'emprunt,

(où l'on retrouve que si le taux d'emprunt est trop élevé, je n'ai aucun intérêt à emprunter) ou encore du revenu que l'on souhaite allouer au logement,

Pour comparer l'impact de la durée, on va supposer que la valorisation du loyer et du salaire reste à 2%, mais que la valorisation du bien immobilier est de 2,5% par an.

Certes, le locataire épargne moins sur une durée courte, mais le locataire a de telles mensualités à payer qu'il vaut mieux épargner. Bon, bien sûr la difficulté est de supposer qu'on peut faire varier ces paramètres indépendamment les uns des autres, mais j'ai l'impression que cela permet de  mieux comprendre qui peut être intéressé pour devenir propriétaire.... en l'occurrence ceux qui ont le temps, et ceux qui ont de l'argent....
Bref, je laisse ceux qui le souhaite améliorer le modèle car il est ici très (trop ?) simpliste... même s'il laisse à penser que le choix d'acheter ou de louer n'est pas aussi simple qu'il y paraît, loin de là.....

Friday, June 4 2010

Le paradoxe de Saint Pétersbourg, partie 1

Pour répondre à une question sur mon précédant billet (ici), je vais revenir sur un paradoxe assez classique, le paradoxe de Saint Petersbourg. Mais avant de parler du paradoxe, et de ses implications en théorie de la décision dans l'incertain, je voulais présenter le jeu, et en profiter pour jouer à faire des dessins puisque j'ai cru remarquer que j'avais des amateurs d'explications géométriques.
Le jeu est simple, c'est un jeu de pile ou face répété, le jeu s'arrêtant à la sortie du premier "face" (et on le verra par la suite, l'idée est de doubler ses gains chaque fois que "pile" sort).
Aussi, le temps d'arrêt du jeu est http://perso.univ-rennes1.fr/arthur.charpentier/latex/stpb-01.png dont la loi est simplement

http://perso.univ-rennes1.fr/arthur.charpentier/latex/stpb-02.png  http://perso.univ-rennes1.fr/arthur.charpentier/latex/stpb-03.png
http://perso.univ-rennes1.fr/arthur.charpentier/latex/stpb-04.png  http://perso.univ-rennes1.fr/arthur.charpentier/latex/stpb-05.png
... etc. On retrouve ainsi une loi géométrique de paramètre 1/2. L'espérance du nombre de lancers que l'on ferra avant que le jeu ne s'arrête est fini (alors qu'on le verra le gain espéré est infini), et vaut l'inverse de cette probabilité, i.e. 2. Pour ceux qui ont oublié la formule (que l'on obtient de manière assez calculatoire, en faisant une dérivation dans une série), on peut refaire le calcul,
http://perso.univ-rennes1.fr/arthur.charpentier/latex/stpb-06.png
Personnellement, je ne sais pas calculer cette somme (infinie), mais comme dans mon précédant billet (ici), il existe une somme que l'on peut calculer simplement en faisant un petit dessin,

J'ai 1 carré (mauve) de surface 1, 2 (bleus ) de surface 1/2, puis 3 (verts) de surface 1/4, puis 4 (jaunes) de surface 1/8, puis 5 (rouges) de surface 1/16, 6 (oranges) de surface 1/32, etc. Autrement dit
http://perso.univ-rennes1.fr/arthur.charpentier/latex/stpb-07.png
Or l'espérance que l'on cherche à calculer, c'est cette somme, à un facteur 2 près....  Aussi, en moyenne, on peut espérer faire 2 lancers (la moitié de la surface) ! Ce qui correspond précisément à l'espérance d'une loi géométrique de paramètre 1/2. Décidément, on peut faire plein de choses avec des petits dessins..

Thursday, June 3 2010

Espérance de vie et retraite

Dans un billet qui a presque un an (ici), j'étais revenu sur l'idée reçue comme quoi "tous les ans, on gagne un trimestre d’espérance de vie" . J'avais du alors expliquer que c'était effectivement le cas, en tous les cas pour l'espérance de vie à la naissance. C'est ce que raconte le graphique ci-dessous, avec une projection par la méthode de Lee & Carter, pour les femmes uniquement

>  library(demography)
>  france.LC1 <- lca(fr.mort,adjust="e0",series="female",years=c(1900,2040))
>  france.fcast <- forecast(france.LC1)
>  L2 <- lifetable(france.fcast)
>  ex2=L2$ex
>  L1=lifetable(fr.mort,series="female")
>  ex1=L1$ex
> age=0
>  exF=c(ex1[age+1,],ex2[age+1,])
>  plot(1816:2056,ex,col="blue")
On peut alors faire une régression pour quantifier un peu mieux ce qui s'est passé au cours des 50 dernières années.
>  I=(1950:2000)-1815
>  y=exF[I]
>  x=1950:2000
> lm(y~x)
Coefficients:
(Intercept)            x 
  -438.7249       0.2611 

Avec un pente de 0.26, effectivement, pour une année de plus (entre 1980 et 1981 par exemple), l'espérance de vie à la naissance gagne 0,26 année, soit un trimestre. Pour les hommes, on a
>  I=(1950:2000)-1815
>  y=exH[I]
>  x=1950:2000
>  abline(lm(y~x),col="red")
>  points(x,y,pch=19,col="red")
>  points(x,y,pch=19,col="red")
> lm(y~x)
Coefficients:
(Intercept)            x 
  -357.9901       0.2164 
que l'on pourrait trouver très proche.

J'ai été un peu surpris de voir cet argument du trimestre gagné avancé lors du débat sur les retraites. Pour commencer, j'ai été surpris de voir Xavier Bertrand prétendre que "Quand vous preniez votre retraite à 60 ans en 1982, vous aviez dix ans d’espérance de vie, aujourd’hui vous avez vingt ans d’espérance de vie. Cette formidable bonne nouvelle, il faut la financer". Vérifions puisqu'on a les codes, il suffit de refaire tourner le programme avec
> age=60
Le graphique est alors

pour les femmes, et pour les hommes, on a

Côté chiffres, pour les femmes,
> exF["1982"]
    1982
22.69534

et pour les hommes,
> exH["1982"]
    1982
17.65394

Bref, j'ai du mal à trouver d'où sortent ces dix ans. Quant à aujourd'hui, pour les femmes,
> exF["2010"]
    2010
26.44607
et pour les hommes,
> exH["2010"]
    2010
21.11194

autrement dit on a dépassé les 20 ans. 
Si on calcule la pente de la régression, on obtient pour les femmes,
> lm(y~x)
Coefficients:
(Intercept)            x 
  -281.0926       0.1533 
et pour les hommes,
> lm(y~x)
Coefficients:
(Intercept)            x 
  -192.7518       0.1063 
Autrement dit le gain qui est de l'ordre du trimestre par an à la naissance est plutôt de l'ordre de 2 mois pour les femmes et de 5 semaines pour les hommes. En gros, le gain est divisé par deux entre la naissance et 60 ans. Le graphique ci-dessous montre le gain annuel d'espérance de vie en fonction de l'âge (je suis passé en jours en ordonnées), avec les femmes (en rouge) et les hommes (en bleu)

Bref, si le gain a été très important à la naissance (la surmortalité infantile ayant fortement chuté depuis les années 50), il n'est pas aussi important par la suite, et chute même passé 55 ans ! Autrement dit un bébé vivra - en moyenne - plus longtemps qu'un bébé né en 1950. Mais une personne de 70 ans vivra à peine plus longtemps - en moyenne - qu'une personne de 70 ans en 1950. Bref, parler de ce gain d'un trimestre par an dans un débat sur les retraites (comme cela est fait ici par une députée de Meurthe-et-Moselle) n'a pas de sens.

Tuesday, November 24 2009

Quand il est optimal de ne rien faire...

Tous les bloggers d'économie se sentent régulièrement obligés de parler de ce film culte... et je n'y couperais par aujourd'hui.
Ce week end, en sortant de l'exposition sur les mammouths à Rennes avec mon fils, on est passé à la fête de la science, voir si on pouvait faire quelques casses têtes à un stand tenu par des collègues de Beaulieu. Et là, un petit problème de théorie des jeux m'a été soumis, et je ne pouvais pas passer à côté de l'occasion (surtout quand on connaît la morale) d'en parler ici.
Tout le monde connaît la scène du "duel à trois" où le bon, la brute et le truand se font face... Pour les besoin du jeu, on va faire quelques hypothèses (c'est le principe de base d'un jeu: il faut une règle),

  • tout d'abord, on suppose que l'ordre dans lequel ils tirent a été fixé (et qu'ils vont s'y tenir, sans tricher (même Tuco): le bon, puis le truand, et enfin la brute,
  • ils peuvent tirer (et doivent tirer) tant qu'ils ont des balles, et tant qu'ils sont en vie, le jeu s'arrêtant quand plus personne n'a de balle, ou qu'il n'y a qu'un survivant1
  • on connaît les probabilités que chacun rate sa cible:  le bon (alias Blondin) est un peu nul (oui, il faut un peu d'imagination) car il a 1 chance sur 3 d'atteindre sa cible; le truand (Tuco) est un peu moins mauvais car il a 1 chance sur 2; enfin la brute (Sentenza) est super fort car il ne rate jamais sa cible.
  • ah oui, et les personnages ne sont pas rancuniers... ce n'est pas parce que quelqu'un nous tire dessus qu'on voudra se venger quand ça sera notre tour (et si on a la chance d'être en vie)
..La question est simple "que doit faire Clint, alias Blondin ?". Raisonnons simplement en étudiant les scénarios,
  • s'il tire sur Tuco, il a 1 chance sur 3 de le tuer. S'il est chanceux, il le tue. Alors on retrouve avec un duel entre la brute et le bon. Et comme c'est à la brute de tirer et qu'il ne rate jamais son coup... ce n'est pas franchement malin,
  • s'il tire sur la brute, supposons qu'il le tue. Alors c'est au truand de tirer, et il a 1 chance sur 2 de gagner le dual, alors que le bon a 1 chance sur 3... Bref, les probas ne sont pas franchement en sa faveur...
mais on a regarder ce qui se passait si, par malheur, Blondin tuait quelqu'un... peut être devrait on se demander ce qu'il se passait s'il rate son coup
  • dans ce cas, peu importe qui a été visé car personne n'est rancunier. Dans ce cas, c'est à Tuco de tirer.S'il tire sur Clint, et qu'il le tue, ça sera à la brute de tirer, et alors il n'a aucune chance de s'en sortir vivant. Il est donc impératif que Tuco tire sur Sentenza. 
  • si Tuco rate son coup, alors la brute a tout intérêt à tuer d'abord le truand. En effet, il risque plus de mourir s'il laisse le truand en vie que la brute. Donc, le truand meurt car Sentenza est super fort....
  • Moralité, après un tour, c'est au bon de tirer, il ne peut que tirer sur la brute et espérer réussir son coup. Sinon, c'en est fait de lui...
Bref, en ratant son premier tir, il augmente ses chances de gagner.... je laisse les personnes intéressées faire les maths, mais ce petite exemple montre clairement que, dans la vie, il est parfois optimal de ne rien faire !
1 a priori on peut supposer aussi un jeu à la roulette russe, avec une balle chacun, qui doit arriver à la même conclusion...

Monday, November 2 2009

Jeu de mains, jeu de malins ?

Ce week-end - merci à Serge qui m'a raconté cette histoire - beaucoup de mes illusions de jeunesse se sont envolées.... Mais gardons un peu de suspens pour que mes lecteurs lisent le billet en entier....

  • Pierre, ciseaux ou feuille
Le jeu "pierre, ciseaux, feuille" semble être né en Chine (soit sous le joli nom 五雜俎, alias wuzazu, datant de la fin de période Ming, soit 手勢令 i.e.shoushiling) ou au Japon (soit sous la forme 一二三 , i.e. Hi-fu-mu, c'est à dire un, deux, trois, soit じゃんけんぽん ou plus simplement じゃんけん, alias janken  , lui même basé sur deux anciens jeux, 数拳 - su ken - et 三すくみ拳 -saan sukumi ken). Pour rappel, la pierre (ぐう) bat les ciseaux (ちょき) qui bat à la feuille (ぱあ) qui à son tour bat la pierre. Bref, ce jeux vient d'orient !
Pour preuve, en avril 2005, Takashi Hashiyama, alors président de Maspro Denkoh Corporation, une entreprise d'électronique située à Nagoya, au Japon, n'arrivait pas à savoir chez qui (entre Christie's et Sotheby's) il allait vendre sa collection d'art (estimée à plus de 20 millions de dollars). N'arrivant pas à choisir, le choix s'est fait par "pierre, ciseaux, feuille" (ici).
  • Le théorème min-max
Pour comprendre ce jeu, il faut revenir un peu sur des résultats classiques de théorie des jeux. La matrice de gain pour le joueur X est ici
GAINS
X joue « pierre »
X joue « feuille »
X joue « ciseaux »
Y joue « pierre »
0
1
-1
Y joue « feuille »
-1
0
1
Y joue « ciseaux »
1
-1
0
et de manière symétrique, on peut définir la matrice de gain pour le joueur Y. Notons que l'on suppose ici un "jeu à somme nulle" (i.e. ce que perd X,  Y le gagne, et réciproquement). Cette seconde matrice de gains est alors l'opposé de celle-ci.
La stratégie de base du jeu a été énoncée par Italo Calvino sous la forme suivante, "tu sais que ce que tu peux espérer de mieux est d'éviter le pire".
Intuitivement, supposons que X souhaite jouer "pierre" on peut penser que Y reconstitue les anticipations de X, et donc joue "feuille", mais à son tour X doit modifier ses anticipations et donc jouer "ciseaux", plutôt que "feuille", etc. Bref, rien ne se stabilise et aucune stratégie pure ne s'impose.
Mais s'il n'y a pas de stratégie pure, tentons des stratégies mixtes, i.e. choisissons intelligemment une mesure de probabilités sur l'ensemble des stratégies pures. En pratique, on jouera alors aléatoirement, en pondérant chaque tirage suivant la mesure de probas choisie. Une stratégie mixte (pour X) est alors caractérisée par un vecteur du simplexe,
http://blogperso.univ-rennes1.fr/arthur.charpentier/public/perso2/minimax-1.png
La  stratégie mixte
http://blogperso.univ-rennes1.fr/arthur.charpentier/public/perso2/minimax-2.png
consiste à décider au  hasard quel coup on jouera avec équiprobabilité.
Formellement, notons que le tirage équiprobable - par les deux joueurs - est un équilibre de Nash. En effet, si A désigne la matrice de gain pour X (on est sur des jeux à somme nulle), John von Neumann a montré ce que l'on appelle aujourd'hui le théorème du minimax (en fait, Emile Borel avait également obtenu ce résultat) en 1926, sous la forme suivante: il y a un équilibre de Nash associé à A si et seulement si
http://blogperso.univ-rennes1.fr/arthur.charpentier/public/perso2/minimax-3.png
L'intuition est assez évidente (mais la preuve de ce théorème du point fixe est un peu technique): http://blogperso.univ-rennes1.fr/arthur.charpentier/public/perso2/minimax-4.png est un équilibre de Nash si aucun des jours n'a intérêt de dévier dans sa stratégie, i.e.
http://blogperso.univ-rennes1.fr/arthur.charpentier/public/perso2/minimax-5.png
et
http://blogperso.univ-rennes1.fr/arthur.charpentier/public/perso2/minimax-6.png
On recherche alors un point selle dans la matrice des gains.
Dans le cas de notre jeu de "pierre, ciseaux, feuille", notons que si
http://blogperso.univ-rennes1.fr/arthur.charpentier/public/perso2/minimax-7.png
alors  http://blogperso.univ-rennes1.fr/arthur.charpentier/public/perso2/minimax-8.png, et on note que  http://blogperso.univ-rennes1.fr/arthur.charpentier/public/perso2/minimax-9.png ainsi que http://blogperso.univ-rennes1.fr/arthur.charpentier/public/perso2/minimax-10.png. Aussi, pour toute  stratégie mixte,
http://blogperso.univ-rennes1.fr/arthur.charpentier/public/perso2/minimax-11.png
et de même
http://blogperso.univ-rennes1.fr/arthur.charpentier/public/perso2/minimax-12.png
Bref, cette stratégie est une équilibre de Nash.
  • Pierre, ciseaux, feuille, ou comment trouver une stratégie
Bref, comme on vient de le noter, la meilleure stratégie à adopter quand on jour à "pierre, caillou, feuille" c'est de ne pas avoir de stratégie... ce qui revient à dire que l'issue du jeu est purement aléatoire. Pour Kenneth Binmore (ici) la méthode du minimax consiste à dire que face à un "bon" joueur, il n'y a rien de mieux à faire de que choisir la stratégie mixte du théorème de von Neumann.
Bon, si on réfléchit deux minutes, on sait qu'on ne joue pas une fois à ce jeux, mais que l'on répète le jeux quelques fois (avant de se lasser). C'est ce qu'a décrit Julia Robinson en 1950. L'idée était d'avoir une approche que l'on peut qualifier de bayésienne, consistant à utiliser pour la stratégie de l'adversaire les probabilités observées.
  • Un champion du monde de "pierre, ciseaux, feuille" ?

Maintenant que j'ai fini avec les rappels de théorie, revenons à la discussion de samedi soir.... J'ai appris qu'il existait un champion du monde de "pierre, ciseaux, feuille" ! Serge prétendait - samedi soir - qu'un joueur avait été vainqueur deux années de suite (ce qui m'a vraiment fait douté sur le côté aléatoire du jeu... malheureusement pour mon histoire, ce n'est qu'une légende, car les champions du monde entre 2002 et 2008 ont été Peter Lovering, Rob Krueger, Lee Rammage, Andrew Bergel, Bob Cooper, Andrea Farina et Monica Martinez). 
Comment peut-il y avoir un champion du monde à un jeu qui repose exclusivement sur du hasard ? C'est comme si on inventait un champion du monde de lancer de pièces (ou de dés), qui serait récompensé pour sa régularité1 !
En creusant un peu, j'ai aussi découvert qu'il existait un livre qui apprend à gagner au jeu (je ne l'ai encore lu, mais promis, si la BU le commande, je le dévorerais et ferais un compte rendu détaillé ici même).

  • De l'impossibilité de générer du hasard
Mais au delà de l'étonnement, en creusant un peu, j'ai découvert que la principale raison qui peut expliquer que certaines personnes soient fortes à ce jeu (sic!) est qu'il est impossible à un homme normal de générer une séquence aléatoire ! Autrement dit, si quelqu'un sait décrypter des séquences (souvent inconscientes) chez son adversaire, il augmente ses chances de gagner. C'était l'idée que l'on retrouvait chez Julia Robinson.... me semble-t-il....
1 Pour la petite histoire, je m'étais également posé la question suivante: "supposons que toute la population française participe à ce championnat de France de lancer de pièce. Le vainqueur serait la personne qui ferait le plus de piles de suite (un face et on est éliminé). Quelle serait le score du vainqueur ?" Et bien le vainqueur aurait 25 ou 26 "piles" de suite.... ce qui est assez impressionnant ! Bon, le champion du monde en aurait 32. Avec 1000 joueurs, on peut espérer qu'un joueur obtienne une dizaine de "piles" de suite..... ce qui n'aurait rien d'exceptionnel, loin de là (c'est ce qu'on peut espérer, en moyenne).


Saturday, October 24 2009

Primes, et mathématiques financières (1)

Lors du dîner de gala des JEEA jeudi soir, Mohamed m'a posé une question intéressante, et je lui ai promis un billet (ou plutôt deux car son problème est compliqué, et je ne connais la solution qu'à une version simple). Le problème est le suivant: un gros assureur à trois lettres souhaite encourager les agents commerciaux par une prime. On leur donne un joker, et durant une période d'un mois, ils concluent des affaires nouvelles. Ils ont la possibilité de toucher une fois (et un seule) une prime (en utilisant leur joker) qui sera proportionnelle au montant de l'affaire signée. Quelle est la stratégie optimale pour utiliser leur joker ?. Une question plus courte pour résumer cette optimalité: le deuxième jour, un gros contrat (aux yeux du vendeur) est signé: faut-il utiliser son joker ou vaut-il mieux attendre un peu ? Bon, le vrai problème est qu'ils ont 5 jokers, et qu'ils peuvent les utiliser en une seule fois, ou en plusieurs.... Avant de réfléchir à cette histoire de 5 jokers, regardons un peu avec un....
  • Formalisation du problème...
Faisons quelques hypothèses forcément simplificatrices... On suppose que chaque jour, un contrat est signé, et que les montant des contrats sont indépendants et identiquement distribués (on ne fait pas de plus gros deal en début de mois). Soit le montant de la prime associée à la kième affaire (si on utilisait le joker). Il faut alors arbitrer, chaque jour k, entre
  • toucher 
  • ne pas toucher la prime, et espérer que l'on touchera davantage plus tard.
Notons  la valeur du joker à la date k. Alors
Aussi
soit
On sait aussi que (le dernier jour, si on a le joker, on l'utilise). Autrement dit, on devrait  y arriver par induction backward... Et la résolution dépend de la loi des montants des affaires.
  • si F est uniforme sur [0,100]
Dans ce cas, l'équation se simplifie. Si 
et
soit

On peut visualiser cette fonction sur le graphique suivant, en fonction du temps
Autrement dit, on se fixe une stratégie a priori, et on s'y tient ! Sur la simulation suivant, on utilise son joker dès le 4ème jour,

Bon, je suis nul en calculs, mais en faisant du monte carlo, on en déduit la loi de la date optimale d'exercice,

ainsi que le gain espéré (ce qui permettra à Mohamed de se couvrir).

Notons que l'espérance de la date d'exercice est environ le 12ème jour, et le montant moyen est de 95 (contre 50 en exerçant le dernier jour).
  • si on change de loi, une loi exponentielle ?
Je pense qu'on peut faire des calculs fermés.... mais je suis un peu paresseux.... on obtient la courbe suivante

La distribution de la date optimale donne

et pour le montant empoché

Dans ce cas, on exerce en moyenne au bout de 17 jours, pour un gain moyen de 174.
  • L'exercice d'options américaines
Damned, mais tout ça correspond au problème de valorisation des options américaines (ou plutôt Bermudéennes car le temps est discret). Les options dites bermudéennes peuvent être exercée à un ensemble prédéterminé de dates   
L'idée de la valorisation est simple: à chaque date, le détenteur de l'option a en effet de choix,
  • exercer son option et en retirer un payoff 
  • conserver son option, de telle sorte que son option vaut  en 
Si on note  le facteur d'actualisation entre les dates  et , on en déduit que la valeur en  de l'option peut s'écrire
est la filtration naturelle, et  est une probabilité risque neutre, sous laquelle la valeur actualisée de l'actif est une martingale, i.e. 
Je renvoie à mes notes de cours de méthodes numériques en finance (ici) mais en utilisant les arbres binomiaux, on peut valoriser un put américain, par exemple,


Monday, June 29 2009

"Ce n'est pas la girouette qui tourne, c'est le vent"

(disait Edgar Faure). Allez, je n'avais jamais osé, mais l'occasion est tellement belle que je vais faire un (court) billet de macro-économie.En fait, je suis assez " surpris" par cet emprunt national qui a été annoncé (ici ou ). Il y a quelques mois, on nous expliquait (démonstrations à l'appui) que l'endettement c'était sale et que l'état était au bord de la faillite, etc. Voilà maintenant que les mêmes personnes nous sollicitent pour aider l'état à s'endetter davantage ! Ce qui me surprendra toujours, c'est cette facilité de passer d'une conclusion à son contraire sans même s'en rendre compte (je suis un peu médisant car en occurrence, ce sont des hommes politiques, et pas des économistes), ou alors ça s'appelle de la mauvaise foi. Pourtant en Bretagne, on a parfois l'habitude de voir les girouettes tourner plusieurs fois dans la même journée !


Il y a quelques années, le Ministère de l'Économie, dans un soucis d'éducation avait édité un court livre d'une trentaine de pages sur les mécanismes de base de l'économie (ci-contre). Comme j'ignore les droits en matière de droit d'auteur, je me suis permis de mettre un lien vers la version pdf (c'est pour la bonne cause). Bref, vivement que l'on relance l'éducation économique (et scientifique), et que l'on arrête les plans de communication pour dire un truc et son contraire quelques semaines plus tard !
PS: évidemment, il existe de bien meilleurs ouvrages de vulgarisation économique, mais c'était juste pour rappeler qu'à une époque, l'éducation semblait être une valeur importante.