En esta nueva entrada, nos centraremos en el análisis de los valores de una muestra de datos que exceden cierto umbral fijado de antemano.
Pero si recordáis, en la primera entrada sobre la Teoría de Valores Extremos, nos centramos en la aproximación que aborda la descripción de los valores máximo y mínimos de una distribución de datos.
Para este segundo enfoque es necesario conocer el siguiente resultado teórico:
Sean {X1, … , Xn} variables aleatorias independientes e idénticamente distribuidas, sea u el umbral fijado y {Xi1, … , Xip} donde i1, … , ip ∈ {1,…,n} todos aquellos valores mayores que el umbral u.
La distribución de los excedentes yij = Xij – u , j ∈ {1,…,p} converge a la siguiente distribución, conocida como Distribución de Pareto Generalizada:
Donde
y σ, μ, ξ son la escala, localización e índice de cola de la distribución generalizada de valores extremos correspondiente a la muestra.
¿Cómo aplicamos este resultado en la práctica?
Supongamos que el objeto de nuestro estudio es el índice S&P500 y que, en concreto, queremos conocer cómo se distribuyen los rendimientos diarios históricos más extremos, tanto en el lado positivo, como en el lado negativo.
Tomamos la serie de rendimientos diarios de este índice desde el 31 de diciembre de 1963 hasta el 20 de junio de 2014, y consideramos como valores umbrales el percentil 5 (-1.519%) y el percentil 95 de la muestra (1.520%).
En primer lugar, nos quedamos con los valores que quedan por encima del umbral superior y calculamos las diferencias de cada uno de estos valores a este umbral, logrando así la muestra de excedentes.
Estimamos los valores de los parámetros de la Distribución de Pareto Generalizada usando estimadores de máxima verosimilitud, y obtenemos que con un grado de confianza del 95% los valores para los parámetros son:
Si pintamos en un histograma nuestra muestra de excedentes y superponemos la función de densidad obtenida a partir de los parámetros estimados, podemos visualizar cómo se ajusta la distribución estimada:
Procediendo de forma análoga con los valores que quedan por debajo del percentil 5 obtenemos la siguiente distribución:
De esta forma hemos tenemos dos distribuciones de probabilidad que describen el comportamiento de los valores más extremos de la muestra, y que entre otras cosas, podría servirnos para replantear el cálculo del VaR de una cartera que tradicionalmente se maneja.