En este post te explicamos qué son los modelos ARIMA y para qué sirven en estadística. También encontrarás qué significan los parámetros de un modelo ARIMA y cómo se construye un modelo estadístico de este tipo. Además, podrás ver cuáles son las ventajas y las desventajas de los modelos ARIMA.
Índice
¿Qué es el modelo ARIMA?
Un modelo autorregresivo integrado de media móvil o modelo ARIMA es un modelo estadístico con tres parámetros (p, d, q) que se usa para analizar las series temporales.
Los modelos ARIMA sirven para hacer predicciones sobre el futuro. La modelización de una serie temporal en un modelo ARIMA consiste en determinar un modelo que permita hacer un pronóstico de la variable en un instante de tiempo futuro basándose en los valores pasados.
Por ejemplo, se puede construir un modelo ARIMA a partir del histórico de datos del valor de las acciones de una empresa para intentar predecir el valor de estas acciones en un futuro, de este modo se puede tomar una decisión sobre si comprar o vender acciones respaldada por un análisis estadístico.
El modelo ARIMA fue desarrollado a finales del siglo XX, los estadísticos Box y Jenkins contribuyeron de manera fundamental a su desarrollo.
Las siglas ARIMA son la abreviación de AutoRegresive Integrated Moving Average, nombre que proviene de sus tres componentes AR (Autoregresivo), I(Integrado) y MA (Medias Móviles).
Componentes del modelo ARIMA
Un modelo ARIMA es una forma de análisis de regresión cuyo objetivo es predecir los movimientos futuros de los mercados financieros o de valores examinando las diferencias entre los valores de la serie de tiempo en lugar de hacerlo a través de los valores en sí.
Así pues, los modelos ARIMA están formados por tres componentes:
- Modelo Autorregresivo (AR): modelo en el que el valor de la variable de salida depende de sus valores anteriores.
- Modelo Integrado (I): representa la diferencia entre las observaciones para permitir que la serie temporal se vuelva estacionaria, es decir, los valores de los datos se reemplazan por la diferencia entre los valores de los datos y los valores anteriores.
- Modelo de Media Móvil (MA): incorpora la dependencia entre una observación y un error residual de un modelo de media móvil aplicado a observaciones pasadas.
Parámetros del modelo ARIMA
Cada componente del modelo ARIMA funciona como un parámetro, de manera que cualquier modelo ARIMA tiene tres parámetros: p, d y q. El valor de cada parámetro indica qué tipo de modelo ARIMA se ha utilizado.
Así pues, los parámetros de un modelo ARIMA se pueden definir de la siguiente manera:
- p: indica el número de observaciones de retraso en el modelo. También se conoce como orden de retraso.
- d: se trata del número de datos anteriores que se resta a cada valor. También se conoce como grado de diferenciación.
- q: es el tamaño de datos que se utiliza para la media móvil. También se conoce como orden de la media móvil.
Si un parámetro es 0, significa que esa componente en particular no se utiliza en el modelo. De modo que el modelo ARIMA se puede construir para realizar la función de un modelo ARMA, o incluso modelos AR, I o MA simples.
Por ejemplo, el modelo ARIMA (0,0,1) es en realidad un modelo MA(1), asimismo, el modelo ARIMA (0,1,0) representa el modelo I(1).
Cómo hacer un modelo ARIMA
Los pasos que se deben seguir para hacer un modelo ARIMA son los siguientes:
- Recogida de datos: lo primero que debemos hacer es recolectar los datos que queremos analizar. Se recomienda tener 50 o más observaciones.
- Representación gráfica: debemos representar los datos observados en un gráfico para ver cómo son, esto te ayudará a decidir sobre la estacionariedad.
- Transformación previa: cuando la varianza de la serie no es estacionaria, se debe aplicar alguna transformación a los datos para convertirla en estacionaria. Normalmente se calcula el logaritmo o el cuadrado de cada dato.
- Eliminación de la tendencia: a partir de la representación gráfica podemos observar si existe alguna tendencia en la serie para corregirla. Una tendencia lineal será corregida tomando primeras diferencias (el valor menos su valor anterior), que será el caso más frecuente. Una tendencia no lineal suele implicar el uso de dos diferencias como mucho.
- Identificación del modelo: consiste en determinar el tipo de modelo ARIMA, esta decisión se toma en base a las funciones de autocorrelación (FAC) y autocorrelación parcial (FAC parcial). Lo más habitual es terminar eligiendo entre los procesos más simples AR(1), AR(2), MA(1), MA(2) y ARMA(1,1), ya que así se pueden interpretar más fácilmente. En caso de duda pueden seleccionarse varios modelos alternativos que serán estimados y contrastados posteriormente, para definir finalmente el modelo adoptado.
- Contraste de los modelo: en este paso debemos determinar cuáles de los modelos escogidos es el mejor para modelizar la serie temporal. Para ello se utilizan varios procedimientos como el contraste de significación de los parámetros, las covarianzas entre los estimadores, el coeficiente de correlación, la suma de cuadrados de errores, etc.
- Análisis de los errores: también se deben analizar las diferencias históricas entre los valores reales y los valores estimados. En este sentido, tenemos que verificar un comportamiento no sistemático de los errores y analizar la posible existencia de errores especialmente significativos.
- Seleccionar el modelo ARIMA: a partir del análisis de los diferentes modelos propuestos realizado en los pasos anteriores, escogemos el mejor modelo ARIMA que se ajusta a nuestros datos.
- Predicción: el modelo ARIMA seleccionado se utilizará como fórmula inicial de predicción.
Ventajas y desventajas de un modelo ARIMA
Ventajas de un modelo ARIMA:
- Un modelo ARIMA es útil para hacer pronósticos a corto plazo.
- Otra ventaja de los modelos ARIMA es que solo necesitan el histórico de datos para construirse.
- Además, permite modelizar conjuntos de datos no estacionarios.
Desventajas de un modelo ARIMA:
- No es un buen modelo para hacer pronósticos a largo plazo.
- Los modelos ARIMA difícilmente son capaces de predecir grandes cambios de tendencia (puntos de inflexión).
- Los parámetros del modelo ARIMA son subjetivos.
la informacion que tienen aqui es muy valiosa, gracias desde colombia.
¡Muchas gracias Sebastian!