jueves, 6 de marzo de 2014

Análisis de una serie temporal : un activo financiero.

1.1 Introducción

En esta entrada quiero exponer un análisis econométrico de un activo financiero sigiuiendo la metodología Box Jenkins para ello pondré de ejemplo la serie temporal que ya analicé en mi trabajo de fin de máster en Finanzas Cuantitativas del CIFF.  El activo financiero analizado es Societe Generale durante los años 2008 y 2009 aproximadamente. El objetivo de este análisis es poder predecir el comportamiento del activo intentado capturar su media. Hay que aclarar que es muy difícil predecir el comportamiento de un activo financiero mediante un modelo lineal dado que estos activos son todo menos lineales. La herramienta utilizada para este analisis es Eviews aunque Matlab es totalmente valido.

1.2    Modelos Box Jenkins

Una serie temporal es un conjunto de observaciones medidas a intervalos regulares de una o varias variables a lo largo de un periodo de tiempo determinado. En el caso concreto de la predicción de precios del precio de un activo financiero, la  variables que se han considerado más relevantes es el precio. Una vez obtenidos los datos históricos de la variable se ha procedido a su análisis mediante técnicas ARIMA. Los modelos ARIMA son muy flexibles y se usan frecuentemente en el análisis de series temporales. El término ARIMA proviene del acrónimo inglés “AutoRegresiveIntegratedMovingAverage”. Los modelos generales ARIMA combinan tres tipos de procesos: autoregresivos (AR); diferenciados (I) y procesos de media móvil (MA). La nomenclatura empleada para representar un modelo ARIMA es la siguiente: ARIMA(p,d,q), donde p es el orden de la autoregresión, d es el grado de diferenciación y q es el orden de media móvil empleado. A continuación se va a examinar cada uno de estos tres valores por separado:

Autoregresión: En un proceso autoregresivo cada valor de la serie temporal es una función lineal del valor o valores anteriores. En un proceso autoregresivo de primer orden sólo se usa el valor anterior; en un proceso de segundo orden, sólo los dos valores anteriores, etc. Estos procesos se representan como AR(n), donde n indica el orden del proceso. Por lo tanto, AR(1) es un proceso autoregresivo de primer orden donde:



Diferenciación: Una serie temporal donde se mide el efecto acumulado de un proceso sobre una variable se llama integrada. En el largo plazo, el nivel medio de una serie integrada puede no cambiar, pero en el corto plazo puede tener valores que fluctúen. Se puede estudiar una serie integrada simplemente observando los cambios o diferencias (generalmente pequeñas) que aparecen de una observación a la siguiente. Normalmente, estas diferencias suelen estar acotadas. Esta propiedad llamada estacionariedad (de primer orden) es muy deseable . En general, un modelo diferenciado de orden d, donde las variables del proceso son las diferencias d (Yt - Yt-1 - ... - Yt-d ), se representa como I(d) o bien como ARIMA(0,d,0). En raras ocasiones se observa un modelo de orden superior a 2.

Media Móvil: El último tipo de proceso usado en un modelo ARIMA es el de media móvil. En un proceso de media móvil, cada valor está determinado por el ruido actual y el o los precedentes. El orden de un proceso de media móvil especifica cuántas muestras previas del ruido se tienen en cuenta para hallar el valor actual. La ecuación de un proceso de media móvil de primer orden puede verse:


Una vez definidos los parámetros que explican un modelo ARIMA se puede proceder a la
construcción del modelo de la serie estudiada (Box y Jenkins, 1976). 

1.3    Metodología Box-Jenkins

En el análisis de series temporales la metodología Box Jenkins, llamada así después de que George Box y Gwilym Jenkins aplicaran los modelos autorregresivos de media móvil (Arma) o integrado (ARIMA) para encontrar el mejor ajuste de los valores pasados de una serie, sirve  para lograr hacer predicciones de la evolución de la serie en el futuro.

  Esta metodología consta de tres fases:
1.       Identificación de los parámetros del modelo
2.       Estimación de los parámetros
3.       Validación del modelo.

Llegados al punto 3 si los residuos no son ruido blanco se volvería al punto 2. Si el modelo fuera válido ya podría usarse para predecir.

1.3.1     Identificación inicial

Partiremos de la serie de datos de Société Générale a lo largo del horizonte temporal de la muestra. Como se puede ver en la figura 2.1, la serie de precios de Société Générale no es estacionaria en media y se pueden apreciar diferentes tendencias a lo largo de la serie.

Lo siguiente que nos interesa evaluar es si tomar logaritmos o no, al tratarse de una serie financiera la respuesta es clara: Sí, debido a que la diferencia de logaritmos se corresponde con los rendimientos de un activo financiero. En la figura 2.2, está representada la serie de logaritmos neperianos que tiene mucho parecido con la figura 1 con la diferencia de que al tomar logaritmos neperianos lo que logramos es reducir las amplitudes de los precios más altos y aumentar las amplificaciones de los precios más bajos. En la figura 2.2 vemos la serie estacionaria habiendo tomado una diferencia a los logaritmos:



Figura 2.1.Series de Precios normal y logarítmica de Societé Generale


Figura2.2. Serie diferenciada de precios y de logaritmos de  Societé Generale

A simple vista parece una serie estacionaria con media constante muy próxima a cero. Para comprobarlo tenemos el test de de Dickey-Fuller.  No se piede aprecioar claramente si la volatilidad es constante  ya que se aprecian clusters de volatilidad.

En la figura 2.3 es posible ver  la distribución de los rendimientos de la serie. Es una distribución más apuntalada que la distribución normal  (es leptocúrtica) y presenta grandes colas tanto a la izquierda como a la derecha para comprobarlo usamos el  Test de Nomarlidad de Jarque–Bera que contrasta la asimetría y el exceso de curtosis de una distribución que según la distribución normal deberían ser 0. Por lo tanto analiza si la distribución falla en alguna de las características de la normalidad.


Siendo:
n = Número de observaciones
S = Sesgo
K = Curtosis

La hipótesis a contrastar sería la siguiente:
-          H0: la distribución está normalmente distribuida
-          H1: la distribución no está normalmente distribuida


Figura 2.3: Histograma de los rendimientos de la serie


1.3.2    Estimación del modelo

La función de autocorrelación simplemente proporciona las autocorrelaciones calculadas a intervalos de 1, 2, etc.; la función de autocorrelación parcial proporciona los valores de las autocorrelaciones parciales según el intervalo. Las características observadas en dichas funciones determinan los valores de p y q del siguiente modo:
· Los modelos AR(p) tienen valores de la ACF que disminuyen exponencialmente (posiblemente alternando valores positivos y negativos) y se observan p picos en los primeros p valores de la PACF.
·         Los modelos MA(q) tienen q picos en los primeros q valores de la ACF, y valores que disminuyen exponencialmente de la PACF.
·        Si la ACF disminuye muy lentamente, se necesita hacer una diferenciación para identificar el modelo.
·         Modelos mixtos AR y MA tienen funciones ACFs y PACFs más complejas que hacen más difícil identificar la serie.

Para estimar el modelo usaremos el correlograma de la figura 2.4, tanto simple como parcial de la serie:


Figura 2.4. Correlograma de la serie

Se trata de una serie, como muchas de las series financieras, con muy poca estructura y muy difícil de identificar así que intentaremos capturar el modelo usando un ar(1) o ma(1)


Figura 2.5. Estimación de un AR(1)

Se observa que los coeficientes son significativos, al ser menores que 0,05; por lo tanto, podemos decir que rechazamos la H0 que es que el parámetro valga 0. 

1.3.3    Validación del modelo

Para validar el modelo se comprobará que los residuos de la serie estimada en el apartado anterior sean ruido blanco, para ello en la figura 2.6 está representado el correlograma de los residuos.

Figura 2.6. Correlograma de Residuos.

Una vez hecha la validación podemos afirmar que los residuos son limpios y por lo tanto ya estaríamos en disposición de usarlo para realizar la predicción del modelo.

1.3.4    ¿Qué modelo elegir?

Schwarz (BIC) y Akaike (AIC) son un criterio de selección de información estadística que ayuda a determinar qué modelo es apropiado usar para una serie de datos.

Estos modelos deben cumplir:

1)      Tener una buena capacidad de ajuste, es decir, el modelo se debe ajustar al pasado pero sin abandonar su capacidad predictiva
2)      Deben ser sencillos.

Cuanto mayor sea el número de parámetros de un modelo mayor será su capacidad de ajustarse al pasado, sin embargo la capacidad predictiva de un modelo viene determinada por la varianza residual cuanto más baja sea ella más predictivo será el modelo. El problema viene cuando se añaden parámetros para ajustarlo al pasado que hacen subir la varianza residual del modelo.

Por lo tanto se debe buscar un balance entre ambos objetivos y esto viene determinado por el criterio de AIC y  BIC porque ese será el mejor modelo.




Siendo:




Será mejor el modelo con menor BIC y AIC, teniendo en cuenta que BIC penaliza por el número de parámetros y Akaike tiene tendencia a elegir más parámetros.  Para series financieras que tienen muy poca estructura será mejor basar la elección en el BIC para que minimice el número de parámetros a escoger.  En la tabla 2.9  se puede ver los valores del BIC y AIC para mis dos posibles modelos:

Modelo
BIC
AIC
AR(1)
-3,8656
-3,8747
MA(1)
-38665
-3,8756
Tabla 2.9. AIC y BIC de los dos modelos
El modelo MA(1) tiene tanto menor AIC como menor BIC por lo tanto es el más apropiado.

Por lo tanto la ecuación para capturar la media de mi modelo será:


No hay comentarios:

Publicar un comentario