1.1 Introducción
En esta entrada quiero exponer un análisis econométrico de un activo financiero sigiuiendo la metodología Box Jenkins para ello pondré de ejemplo la serie temporal que ya analicé en mi trabajo de fin de máster en Finanzas Cuantitativas del CIFF. El activo financiero analizado es Societe Generale durante los años 2008 y 2009 aproximadamente. El objetivo de este análisis es poder predecir el comportamiento del activo intentado capturar su media. Hay que aclarar que es muy difícil predecir el comportamiento de un activo financiero mediante un modelo lineal dado que estos activos son todo menos lineales. La herramienta utilizada para este analisis es Eviews aunque Matlab es totalmente valido.
1.2 Modelos Box Jenkins
Una serie temporal es un conjunto de
observaciones medidas a intervalos regulares de una o varias variables a lo largo de un periodo de
tiempo determinado. En el caso concreto de la predicción de precios del precio de un activo
financiero, la variables que se han
considerado más relevantes es el precio. Una vez obtenidos los datos históricos
de la variable se ha procedido a su análisis mediante técnicas ARIMA. Los
modelos ARIMA son muy flexibles y se usan frecuentemente en el análisis de
series temporales. El término ARIMA proviene del acrónimo inglés
“AutoRegresiveIntegratedMovingAverage”. Los modelos generales ARIMA combinan
tres tipos de procesos: autoregresivos (AR); diferenciados (I) y procesos de
media móvil (MA). La nomenclatura empleada para representar un modelo ARIMA es
la siguiente: ARIMA(p,d,q), donde p es el orden de la autoregresión, d es el
grado de diferenciación y q es el orden de media móvil empleado. A continuación
se va a examinar cada uno de estos tres valores por separado:
Autoregresión: En un proceso autoregresivo
cada valor de la serie temporal es una función lineal del valor o valores
anteriores. En un proceso autoregresivo de primer orden sólo se usa el valor anterior; en un proceso de
segundo orden, sólo los dos valores anteriores, etc. Estos procesos se
representan como AR(n), donde n indica el orden del proceso. Por lo tanto,
AR(1) es un proceso autoregresivo de primer orden donde:
Diferenciación: Una serie temporal donde se
mide el efecto acumulado de un proceso sobre una variable se llama integrada.
En el largo plazo, el nivel medio de una serie integrada puede no cambiar, pero
en el corto plazo puede tener valores que fluctúen. Se puede estudiar una serie
integrada simplemente observando los cambios o diferencias (generalmente
pequeñas) que aparecen de una observación a la siguiente. Normalmente, estas
diferencias suelen estar acotadas. Esta propiedad llamada estacionariedad (de
primer orden) es muy deseable . En general, un modelo diferenciado de orden d,
donde las variables del proceso son las diferencias d (Yt - Yt-1 - ... - Yt-d
), se representa como I(d) o bien como ARIMA(0,d,0). En raras ocasiones se
observa un modelo de orden superior a 2.
Media Móvil: El último tipo de proceso usado
en un modelo ARIMA es el de media móvil. En un proceso de media móvil, cada
valor está determinado por el ruido actual y el o los precedentes. El orden de
un proceso de media móvil especifica cuántas muestras previas del ruido se
tienen en cuenta para hallar el valor actual. La ecuación de un proceso de
media móvil de primer orden puede verse:
Una vez definidos los parámetros que explican
un modelo ARIMA se puede proceder a la
construcción del modelo de la serie estudiada
(Box y Jenkins, 1976).
1.3 Metodología Box-Jenkins
En el análisis de series temporales la
metodología Box Jenkins, llamada así después de que George Box y Gwilym Jenkins
aplicaran los modelos autorregresivos de media móvil (Arma) o integrado (ARIMA)
para encontrar el mejor ajuste de los valores pasados de una serie, sirve para lograr hacer predicciones de la
evolución de la serie en el futuro.
Esta
metodología consta de tres fases:
1. Identificación de los parámetros del modelo
2. Estimación de los parámetros
3. Validación del modelo.
Llegados
al punto 3 si los residuos no son ruido blanco se volvería al punto 2. Si el
modelo fuera válido ya podría usarse para predecir.
1.3.1 Identificación inicial
Partiremos de la
serie de datos de Société Générale a lo largo del horizonte temporal de la
muestra. Como se puede ver en la figura 2.1, la serie de precios de Société
Générale no es estacionaria en media y se pueden apreciar diferentes tendencias
a lo largo de la serie.
Lo siguiente que
nos interesa evaluar es si tomar logaritmos o no, al tratarse de una serie
financiera la respuesta es clara: Sí, debido a que la diferencia de logaritmos
se corresponde con los rendimientos de un activo financiero. En la figura 2.2,
está representada la serie de logaritmos neperianos que tiene mucho parecido
con la figura 1 con la diferencia de que al tomar logaritmos neperianos lo que
logramos es reducir las amplitudes de los precios más altos y aumentar las
amplificaciones de los precios más bajos. En la figura 2.2 vemos la
serie estacionaria habiendo tomado una diferencia a los logaritmos:
Figura 2.1.Series de Precios normal y logarítmica de Societé
Generale
Figura2.2. Serie diferenciada de precios y de logaritmos
de Societé Generale
A simple vista parece una serie estacionaria con media
constante muy próxima a cero. Para comprobarlo tenemos el test de de
Dickey-Fuller. No se piede aprecioar claramente
si la volatilidad es constante ya que se
aprecian clusters de volatilidad.
En la figura 2.3 es posible ver la distribución de los rendimientos de la
serie. Es una distribución más apuntalada que la distribución normal (es leptocúrtica) y presenta grandes colas
tanto a la izquierda como a la derecha para comprobarlo usamos el Test de Nomarlidad de Jarque–Bera que contrasta
la asimetría y el exceso de curtosis de una distribución que según la
distribución normal deberían ser 0. Por lo tanto analiza si la distribución
falla en alguna de las características de la normalidad.
Siendo:
n = Número de observaciones
S = Sesgo
K = Curtosis
La hipótesis a
contrastar sería la siguiente:
-
H0: la distribución
está normalmente distribuida
-
H1: la distribución no
está normalmente distribuida
Figura 2.3: Histograma de los rendimientos de la serie
1.3.2 Estimación del modelo
La función de
autocorrelación simplemente proporciona las autocorrelaciones calculadas a
intervalos de 1, 2, etc.; la función de autocorrelación parcial proporciona los
valores de las autocorrelaciones parciales según el intervalo. Las
características observadas en dichas funciones determinan los valores de p y q
del siguiente modo:
· Los modelos AR(p) tienen valores
de la ACF que disminuyen exponencialmente (posiblemente alternando valores
positivos y negativos) y se observan p picos en los primeros p valores
de la PACF.
·
Los modelos MA(q) tienen q
picos en los primeros q valores de la ACF, y valores que disminuyen
exponencialmente de la PACF.
· Si la ACF disminuye muy
lentamente, se necesita hacer una diferenciación para identificar el modelo.
·
Modelos mixtos AR y MA tienen
funciones ACFs y PACFs más complejas que hacen más difícil identificar la
serie.
Para estimar el modelo usaremos el correlograma de la figura 2.4,
tanto simple como parcial de la serie:
Figura 2.4. Correlograma de
la serie
Se trata de una
serie, como muchas de las series financieras, con muy poca estructura y muy
difícil de identificar así que intentaremos capturar el modelo usando un ar(1)
o ma(1)
Figura 2.5. Estimación de un AR(1)
Se observa que los
coeficientes son significativos, al ser menores que 0,05; por lo tanto, podemos
decir que rechazamos la H0 que es que el parámetro valga 0.
1.3.3 Validación del modelo
Para validar el
modelo se comprobará que los residuos de la serie estimada en el apartado
anterior sean ruido blanco, para ello en la figura 2.6 está representado el
correlograma de los residuos.
Figura
2.6. Correlograma de Residuos.
Una vez hecha la validación podemos afirmar que los residuos son limpios
y por lo tanto ya estaríamos en disposición de usarlo para realizar la
predicción del modelo.
1.3.4 ¿Qué modelo elegir?
Schwarz (BIC) y Akaike (AIC) son un criterio
de selección de información estadística que ayuda a determinar qué modelo es
apropiado usar para una serie de datos.
Estos modelos deben
cumplir:
1)
Tener una buena capacidad de
ajuste, es decir, el modelo se debe ajustar al pasado pero sin abandonar su
capacidad predictiva
2)
Deben ser sencillos.
Cuanto mayor sea el
número de parámetros de un modelo mayor será su capacidad de ajustarse al
pasado, sin embargo la capacidad predictiva de un modelo viene determinada por
la varianza residual cuanto más baja sea ella más predictivo será el modelo. El
problema viene cuando se añaden parámetros para ajustarlo al pasado que hacen
subir la varianza residual del modelo.
Por lo tanto se
debe buscar un balance entre ambos objetivos y esto viene determinado por el
criterio de AIC y BIC porque ese será el
mejor modelo.
Siendo:
Será mejor el modelo con menor BIC y AIC, teniendo en cuenta que BIC
penaliza por el número de parámetros y Akaike tiene tendencia a elegir más
parámetros. Para series financieras que
tienen muy poca estructura será mejor basar la elección en el BIC para que
minimice el número de parámetros a escoger.
En la tabla 2.9 se puede ver los
valores del BIC y AIC para mis dos posibles modelos:
Modelo
BIC
AIC
AR(1)
-3,8656
-3,8747
MA(1)
-38665
-3,8756
Tabla 2.9. AIC
y BIC de los dos modelos
El modelo MA(1) tiene tanto menor AIC como menor BIC por lo tanto es el
más apropiado.
Por lo tanto la ecuación para capturar la media de mi modelo será:
Modelo
|
BIC
|
AIC
|
AR(1)
|
-3,8656
|
-3,8747
|
MA(1)
|
-38665
|
-3,8756
|











No hay comentarios:
Publicar un comentario