Friday 27 October 2017

Difference Between Moving Average And Linear Regression


Mike, primero instale R (si aún no lo ha hecho), ejecute R e instale el paquete TeachingDemos (exactamente cómo depende de su sistema), cargue el paquete con la biblioteca (TeachingDemos) y teclee loess. demo para abrir la página de ayuda para ver Cómo ejecutarlo, puede desplazarse hasta la parte inferior donde están el ejemplo y copiar y pegar ese código en la línea de comandos R39s para ver los ejemplos, a continuación, ejecutar con sus propios datos para explorar aún más. Ndash Greg Snow Mar 23 12 a las 17:15 Aquí hay una respuesta simple pero detallada. Un modelo lineal se ajusta a una relación a través de todos los puntos de datos. Este modelo puede ser de primer orden (otro significado de lineal) o polinomial para tener en cuenta la curvatura, o con splines para tener en cuenta diferentes regiones que tienen un modelo de gobierno diferente. Un ajuste LOESS es una regresión ponderada localmente basada en los puntos de datos originales. Lo que significa que un ajuste LOESS ajusta los valores originales de X e Y, más un conjunto de valores X de salida para calcular nuevos valores de Y (usualmente se usan los mismos valores de X para ambos, pero se usan menos X para los pares XY ajustados Debido al aumento de la computación requerida). Para cada valor X de salida, se utiliza una parte de los datos de entrada para calcular un ajuste. La porción de los datos, generalmente 25 a 100, pero típicamente 33 o 50, es local, es decir, es la porción de los datos originales más cercanos a cada valor X de salida particular. Es un ajuste en movimiento, ya que cada valor de salida X requiere un subconjunto diferente de los datos originales, con pesos diferentes (véase el siguiente párrafo). Este subconjunto de puntos de datos de entrada se utiliza para realizar una regresión ponderada, con los puntos más cercanos al valor X de salida dado mayor peso. Esta regresión es generalmente de primer orden de segundo orden o superior es posible, pero requieren mayor poder de cálculo. El valor Y de esta regresión ponderada calculada en la salida X se utiliza como el valor Y de los modelos para este valor X. La regresión se recalcula en cada valor X de salida para producir un conjunto completo de valores Y de salida. Respondió Feb 21 15 at 21: 08Qué relación y diferencia entre series de tiempo y regresión Para modelos y suposiciones. ¿Es cierto que los modelos de regresión asumen la independencia entre las variables de salida para diferentes valores de la variable de entrada, mientras que el modelo de series de tiempo doesnt ¿Cuáles son algunas otras diferencias Hay una serie de enfoques para el análisis de series de tiempo, Regresión y el método de Box-Jenkins (1976) o ARIMA (AutoRegressive Integrated Moving Average). Este documento introduce el método de regresión. Considero el método de regresión muy superior a ARIMA por tres razones principales que no entiendo muy bien cuál es el método de regresión para las series de tiempo en el sitio web, y cómo es diferente del método Box-Jenkins o ARIMA. Aprecio si alguien puede dar algunas ideas sobre esas preguntas. Gracias y saludos realmente creo que esta es una buena pregunta y merece una respuesta. El vínculo proporcionado es escrito por un psicólogo que está afirmando que algunos home-brew método es una mejor manera de hacer análisis de series de tiempo que Box-Jenkins. Espero que mi intento de respuesta anime a otros, que son más conocedores de series de tiempo, a contribuir. Desde su introducción, parece que Darlington está defendiendo el enfoque de sólo ajustar un modelo de AR por mínimos cuadrados. Es decir, si desea ajustar el modelo zt alpha1 z cdots alphak z varepsilont a la serie de tiempo zt, sólo puede regresar la serie zt de la serie con lag 1, lag 2, y así sucesivamente hasta lag k, usando un Regresión múltiple ordinaria. Esto es ciertamente permitido en R, incluso una opción en la función ar. Lo probé y tiende a dar respuestas similares al método por defecto para ajustar un modelo de AR en R. También aboga por la regresión de zt en cosas como t o poderes de t para encontrar tendencias. Una vez más, esto es absolutamente bien. Un montón de libros sobre la serie de tiempo discutir esto, por ejemplo Shumway-Stoffer y Cowpertwait-Metcalfe. Por lo general, un análisis de series de tiempo podría proceder a lo largo de las siguientes líneas: se encuentra una tendencia, eliminar, a continuación, ajustar un modelo a los residuos. Pero parece que también está defendiendo el ajuste excesivo y luego usar la reducción en el error cuadrático medio entre las series ajustadas y los datos como evidencia de que su método es mejor. Por ejemplo: Siento que los correlogramas son ahora obsoletos. Su propósito principal era permitir a los trabajadores adivinar qué modelos encajarían mejor con los datos, pero la velocidad de las computadoras modernas (por lo menos en la regresión, si no en el modelo de serie) permite que un trabajador simplemente se ajuste a varios modelos y vea exactamente cómo Cada uno se ajusta a la medida del error cuadrático medio. La cuestión de la capitalización en el azar no es relevante para esta elección, ya que los dos métodos son igualmente susceptibles a este problema. Esto no es una buena idea porque la prueba de un modelo se supone que es lo bien que puede pronosticar, no lo bien que se ajusta a los datos existentes. En sus tres ejemplos, utiliza el error cuadrático medio ajustado como su criterio para la calidad del ajuste. Por supuesto, el ajuste excesivo de un modelo va a hacer una estimación en la muestra de error menor, por lo que su afirmación de que sus modelos son mejores porque tienen menor RMSE es incorrecta. En pocas palabras, ya que está utilizando el criterio equivocado para evaluar cuán bueno es un modelo, llega a conclusiones equivocadas sobre la regresión vs. ARIMA. Apuesto a que, si hubiera probado la capacidad predictiva de los modelos en su lugar, ARIMA habría salido en la cima. Tal vez alguien puede intentarlo si tienen acceso a los libros que menciona aquí. Suplementario: para más información sobre la idea de regresión, puede que desee consultar libros de series de tiempo antiguos que fueron escritos antes de que ARIMA se convirtiera en el más popular. Por ejemplo, Kendall, Time-Series. 1973, el capítulo 11 tiene un capítulo entero sobre este método y comparaciones con ARIMA. Por lo que puedo decir, el autor nunca describió su método de elaboración casera en una publicación revisada por pares y las referencias a la literatura estadística y de ella parecen mínimas y sus principales publicaciones sobre temas metodológicos se remontan a los años 70. En sentido estricto, nada de esto demuestra nada, pero sin el tiempo suficiente o la experiencia para evaluar las reclamaciones a mí mismo, yo sería extremadamente renuente a usar cualquiera de ella. Ndash Gala Jul 18 13 at 11: 31Indicador de regresión lineal El indicador de regresión lineal se utiliza para la identificación de tendencias y el seguimiento de tendencias de una manera similar a los promedios móviles. El indicador no debe confundirse con líneas de regresión lineal que son líneas rectas ajustadas a una serie de puntos de datos. El indicador de regresión lineal representa los puntos finales de toda una serie de líneas de regresión lineal dibujadas en días consecutivos. La ventaja del indicador de regresión lineal sobre una media móvil normal es que tiene menos retraso que el promedio móvil, respondiendo más rápido a los cambios de dirección. La desventaja es que es más propenso a whipsaws. El indicador de regresión lineal sólo es adecuado para negociar tendencias fuertes. Las señales se toman de manera similar a los promedios móviles. Utilice la dirección del indicador de regresión lineal para ingresar y salir de operaciones con un indicador de largo plazo como filtro. Ir largo si el indicador de regresión lineal aparece o salir de un comercio corto. Ir corto (o salir de un comercio largo) si el indicador de regresión lineal gira hacia abajo. Una variación de lo anterior es entrar en operaciones cuando el precio cruza el Indicador de Regresión Lineal, pero todavía sale cuando el Indicador de Regresión Lineal se vuelve hacia abajo. Ejemplo Pase el mouse sobre los subtítulos de los gráficos para mostrar las señales comerciales. Go largo L cuando el precio cruza por encima del indicador de regresión lineal de 100 días mientras el 300 días está subiendo Salida X cuando el indicador de regresión lineal de 100 días se vuelve hacia abajo Vaya largo nuevamente a L cuando el precio cruce por encima del indicador de regresión lineal de 100 días X cuando el indicador de regresión lineal de 100 días se vuelve hacia abajo Go largo L cuando el precio cruza por encima de 100 días de regresión lineal Salga de X cuando el indicador de 100 días se vuelve hacia abajo Ir largo L cuando el indicador de regresión lineal de 300 días aparece después del precio cruzado arriba El Indicador de 100 Días Salida X cuando se apaga el Indicador de Regresión Lineal de 300 días. La divergencia bajista en el indicador advierte de una inversión importante de tendencia. La función Diferencia de la Promedio Móvil (Serie de Tiempo) calcula la diferencia entre un valor y su promedio móvil de la serie temporal. Parámetros ------------------ Datos Los datos a analizar. Esto es típicamente un campo en una serie de datos o un valor calculado. Período El número de barras de datos a incluir en el promedio, incluyendo el valor actual. Por ejemplo, un período de 3 incluye el valor actual y los dos valores previos. Función Valor ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ El valor actual para esa línea. Una línea de regresión lineal es una línea recta que está tan cerca de todos los valores dados como sea posible. El promedio móvil de series temporales al principio de una serie de datos no se define hasta que haya suficientes valores para llenar el período dado. Tenga en cuenta que un promedio móvil de series de tiempo difiere mucho de otros tipos de promedios móviles en que el valor actual sigue la tendencia reciente de los datos, no un promedio real de los datos. Debido a esto, el valor de esta función puede ser mayor o menor que todos los valores que se usan si la tendencia de los datos está generalmente aumentando o disminuyendo. La diferencia con el promedio móvil es el promedio móvil restado del valor actual. Uso ----------- Las medias móviles son útiles para suavizar los datos brutos, como los precios diarios. Los datos de precios pueden variar mucho de día a día, oscureciendo si el precio sube o disminuye con el tiempo. Al observar la media móvil del precio, se puede ver un panorama más general de las tendencias subyacentes. Dado que los promedios móviles pueden usarse para ver las tendencias, también pueden usarse para ver si los datos están obstaculizando la tendencia. Esto hace que la diferencia de la media móvil sea útil para resaltar dónde se están rompiendo los datos de la tendencia. Selección de la mejor línea de tendencia para sus datos Cuando desea agregar una línea de tendencia a un gráfico en Microsoft Graph, puede elegir cualquiera de los seis diferentes Tipos de tendencia / regresión. El tipo de datos que tiene determina el tipo de línea de tendencia que debe utilizar. Confiabilidad de línea de tendencia Una línea de tendencia es más confiable cuando su valor R-cuadrado está en o cerca de 1. Cuando se ajusta una línea de tendencia a sus datos, Graph calcula automáticamente su valor R-cuadrado. Si lo desea, puede mostrar este valor en su gráfico. Una línea de tendencia lineal es una línea recta de mejor ajuste que se utiliza con conjuntos de datos lineales simples. Sus datos son lineales si el patrón en sus puntos de datos se asemeja a una línea. Una línea de tendencia lineal por lo general muestra que algo está aumentando o disminuyendo a un ritmo constante. En el ejemplo siguiente, una línea de tendencia lineal muestra claramente que las ventas de refrigeradores han aumentado constantemente durante un período de 13 años. Observe que el valor R-cuadrado es 0.9036, que es un buen ajuste de la línea a los datos. Una línea de tendencia logarítmica es una línea curva mejor ajustada que es más útil cuando la tasa de cambio en los datos aumenta o disminuye rápidamente y luego se nivela. Una línea de tendencia logarítmica puede usar valores negativos y / o positivos. El siguiente ejemplo usa una línea de tendencia logarítmica para ilustrar el crecimiento poblacional predicho de animales en un área de espacio fijo, donde la población nivelada como espacio para los animales disminuyó. Tenga en cuenta que el valor R-cuadrado es 0.9407, que es un ajuste relativamente bueno de la línea a los datos. Una línea de tendencia polinómica es una línea curva que se usa cuando los datos fluctúan. Es útil, por ejemplo, para analizar ganancias y pérdidas en un gran conjunto de datos. El orden del polinomio puede determinarse por el número de fluctuaciones en los datos o por el número de curvas (colinas y valles) que aparecen en la curva. Una línea de tendencia polinomial de orden 2 generalmente tiene sólo una colina o valle. El orden 3 generalmente tiene una o dos colinas o valles. La orden 4 generalmente tiene hasta tres. El siguiente ejemplo muestra una línea de tendencia polinómica de Orden 2 (una colina) para ilustrar la relación entre la velocidad y el consumo de gasolina. Observe que el valor R-cuadrado es 0.9474, que es un buen ajuste de la línea a los datos. Una línea de tendencia de potencia es una línea curva que se utiliza mejor con conjuntos de datos que comparan las mediciones que aumentan a una velocidad específica, por ejemplo, la aceleración de un coche de carreras a intervalos de un segundo. No puede crear una línea de tendencia de energía si sus datos contienen valores cero o negativos. En el ejemplo siguiente, los datos de aceleración se muestran trazando la distancia en metros por segundos. La línea de tendencia de potencia demuestra claramente la creciente aceleración. Tenga en cuenta que el valor R-cuadrado es 0.9923, que es un ajuste casi perfecto de la línea a los datos. Una línea de tendencia exponencial es una línea curva que es más útil cuando los valores de los datos suben o bajan a tasas cada vez más altas. No puede crear una línea de tendencia exponencial si sus datos contienen valores cero o negativos. En el ejemplo siguiente, se utiliza una línea de tendencia exponencial para ilustrar la cantidad decreciente de carbono 14 en un objeto a medida que envejece. Tenga en cuenta que el valor R-cuadrado es 1, lo que significa que la línea se ajusta perfectamente a los datos. Una línea de tendencia de media móvil suaviza las fluctuaciones de los datos para mostrar un patrón o una tendencia más claramente. Una línea de tendencia de media móvil utiliza un número específico de puntos de datos (establecidos por la opción Período), los promedia y utiliza el valor promedio como un punto en la línea de tendencia. Si Period se establece en 2, por ejemplo, el promedio de los dos primeros puntos de datos se utiliza como el primer punto de la línea de tendencia de media móvil. El promedio de los puntos de datos segundo y tercero se utiliza como el segundo punto en la línea de tendencia, y así sucesivamente. En el ejemplo siguiente, una línea de tendencia de media móvil muestra un patrón en el número de viviendas vendidas en un período de 26 semanas.

No comments:

Post a Comment