En el análisis clásico de cualquier muestra de datos, en general se suelen ignorar los valores extremos, desechando por ejemplo en muchos casos el 5% de los valores mayores y menores. Pero en algunos casos, los eventos que producen estos valores extremos pueden tener un alto impacto, por lo que es necesario buscar un análisis que lejos de ignorarlos se centre en describirlos. Esto nos lleva a la Teoría de Valores Extremos.
Formalmente, la Teoría de Valores Extremos (EVT de sus siglas en inglés) es la rama de la estadística que centra su estudio en los eventos asociados a las colas de la distribución (valores más altos o más bajos de la variable sometida a estudio).
El análisis de los valores extremos se aplica en multitud de campos, como son la hidrología (inundaciones, precipitación máxima esperada en los próximos 100 años), la meteorología (huracanes, cambios extremos de la temperatura) o la ingeniería (resistencia de los materiales) entre otros.
Dentro del mundo de las finanzas, y en concreto dentro del estudio de las series de precios de un activo financiero, la importancia de esta teoría radica en lograr una representación más precisa de los valores extremos de la distribución de rendimientos de dicho activo, que es donde el riesgo es más importante.
En la práctica existen dos aproximaciones a la Teoría de Valores Extremos. El primer método se basa en el ajuste de la distribución de los valores máximos o mínimos, mientras que en la segunda aproximación, el análisis de los valores extremos se realiza a partir del análisis de los valores que exceden cierto umbral.
En este primer post, abordaremos la primera de las aproximaciones, para lo que es fundamental conocer el siguiente resultado teórico:
Sean {X1, … , Xn} variables aleatorias independientes e idénticamente distribuidas.
El Máximo Mn = max{X1, … , Xn} converge a la siguiente distribución
donde
Esta distribución se conoce como Distribución Generalizada de Valores Extremos.
El parámetro μ se corresponde con la localización, σ con la escala y ξ con la forma o índice de cola (indica el tamaño de la cola de la distribución).
Cuando el índice es 0, la distribución se corresponde con una distribución de Gumbel, cuando es negativo con una Distribución de Weibull y cuando es positivo con una Distribución de Frechet.
Este resultado es muy significativo, ya que independientemente de la naturaleza de la distribución inicial, la distribución asintótica del máximo es siempre una de las tres anteriormente descritas.
Del resultado a la práctica
Supongamos que queremos aplicar el resultado anterior para estudiar los rendimientos máximos diarios del S&P 500 en un año.
Para ello, tomamos la serie de rendimientos diarios del S&P 500 usando los precios desde el 31 de diciembre de 1963 hasta el 31 de diciembre de 2013.
Agrupamos los rendimientos diarios en años, lo que nos da lugar a 50 bloques de datos. Cada uno de estos bloques se correspondería entonces con las variables aleatorias Xi del enunciado anterior. Nuestro objetivo es por tanto obtener la distribución del máximo de cada uno de estos bloques Mn = max{X1, … , X50} .
Para estimar los parámetros, usamos estimadores de máxima verosimilitud con un grado de confianza del 95%, y obtenemos los siguientes valores:
μ = 0.0253
σ = 0.0105
ξ = 0.1837
Para visualizar como se ajusta esta distribución a nuestra muestra de datos pintamos un histograma con los máximos de cada bloque y superponemos la función de densidad de la distribución:
Aunque la estimación de los parámetros en sí es importante, conocer el valor de los cuantiles de la distribución ajustada es, en muchos casos, lo que nos ayuda a poder extraer valores de interés para poder analizar la muestra de datos.
Por ejemplo, supongamos que queremos calcular cuál es el valor que en media se espera que sea superado solo una vez cada diez años.
Basta con calcular el cuantil de orden (1-1/10), que para nuestro caso es 0.0546.
Análogamente a la distribución de los máximos, podemos usar el mismo resultado teórico para obtener la distribución de los rendimientos mínimos en un año del S&P 500.
En este caso, el ajuste de la distribución con respecto a la muestra queda de la siguiente manera:
y la máxima pérdida que se espera sólo sea superada una vez cada diez años es -0.0756
¿Te apetece leer la segunda parte de este post? Teoría de Valores Extremos II
related posts
Me ha gustado el post y se entiende muy bien. Personalmente me gustaría saber más sobre el proceso de estimación de parámetros con máxima verosimilitud (¿a lo mejor otro post?). Y, ¿crees que tendría sentido usar EVT con resultados de una cartera o una estrategia implementada? Así se podría calcular una medida parecida al VAR, ¿no? Gracias!