Lors du dîner de gala des JEEA jeudi soir, Mohamed m'a posé une question intéressante, et je lui ai promis un billet (ou plutôt deux car son problème est compliqué, et je ne connais la solution qu'à une version simple). Le problème est le suivant: un gros assureur à trois lettres souhaite encourager les agents commerciaux par une prime. On leur donne un joker, et durant une période d'un mois, ils concluent des affaires nouvelles. Ils ont la possibilité de toucher une fois (et un seule) une prime (en utilisant leur joker) qui sera proportionnelle au montant de l'affaire signée. Quelle est la stratégie optimale pour utiliser leur joker ?. Une question plus courte pour résumer cette optimalité: le deuxième jour, un gros contrat (aux yeux du vendeur) est signé: faut-il utiliser son joker ou vaut-il mieux attendre un peu ? Bon, le vrai problème est qu'ils ont 5 jokers, et qu'ils peuvent les utiliser en une seule fois, ou en plusieurs.... Avant de réfléchir à cette histoire de 5 jokers, regardons un peu avec un....
  • Formalisation du problème...
Faisons quelques hypothèses forcément simplificatrices... On suppose que chaque jour, un contrat est signé, et que les montant des contrats sont indépendants et identiquement distribués (on ne fait pas de plus gros deal en début de mois). Soit le montant de la prime associée à la kième affaire (si on utilisait le joker). Il faut alors arbitrer, chaque jour k, entre
  • toucher 
  • ne pas toucher la prime, et espérer que l'on touchera davantage plus tard.
Notons  la valeur du joker à la date k. Alors
Aussi
soit
On sait aussi que (le dernier jour, si on a le joker, on l'utilise). Autrement dit, on devrait  y arriver par induction backward... Et la résolution dépend de la loi des montants des affaires.
  • si F est uniforme sur [0,100]
Dans ce cas, l'équation se simplifie. Si 
et
soit

On peut visualiser cette fonction sur le graphique suivant, en fonction du temps
Autrement dit, on se fixe une stratégie a priori, et on s'y tient ! Sur la simulation suivant, on utilise son joker dès le 4ème jour,

Bon, je suis nul en calculs, mais en faisant du monte carlo, on en déduit la loi de la date optimale d'exercice,

ainsi que le gain espéré (ce qui permettra à Mohamed de se couvrir).

Notons que l'espérance de la date d'exercice est environ le 12ème jour, et le montant moyen est de 95 (contre 50 en exerçant le dernier jour).
  • si on change de loi, une loi exponentielle ?
Je pense qu'on peut faire des calculs fermés.... mais je suis un peu paresseux.... on obtient la courbe suivante

La distribution de la date optimale donne

et pour le montant empoché

Dans ce cas, on exerce en moyenne au bout de 17 jours, pour un gain moyen de 174.
  • L'exercice d'options américaines
Damned, mais tout ça correspond au problème de valorisation des options américaines (ou plutôt Bermudéennes car le temps est discret). Les options dites bermudéennes peuvent être exercée à un ensemble prédéterminé de dates   
L'idée de la valorisation est simple: à chaque date, le détenteur de l'option a en effet de choix,
  • exercer son option et en retirer un payoff 
  • conserver son option, de telle sorte que son option vaut  en 
Si on note  le facteur d'actualisation entre les dates  et , on en déduit que la valeur en  de l'option peut s'écrire
est la filtration naturelle, et  est une probabilité risque neutre, sous laquelle la valeur actualisée de l'actif est une martingale, i.e. 
Je renvoie à mes notes de cours de méthodes numériques en finance (ici) mais en utilisant les arbres binomiaux, on peut valoriser un put américain, par exemple,