Linear Regression: Se utiliza para predecir el valor de una variable a partir del valor de otra. La variable que se desea predecir se denomina variable dependiente. La variable que se utiliza para predecir el valor de la otra variable se denomina variable independiente.
También puede usar la regresión lineal para obtener mejores perspectivas al descubrir patrones. Por ejemplo, analizar los datos de ventas y compras puede ayudarle a descubrir patrones de compra específicos en días o momentos específicos. La información obtenida mediante el análisis de regresión puede ayudar a anticipar los momentos de alta demanda de los productos de una empresa.
La regresión lineal debe de cumplir con los siguientes supuestos:
- Las variables deben medirse a nivel continuo. Ejemplos de variables continuas son el tiempo, las ventas y el peso.
- Utilice un diagrama de dispersión para descubrir rápidamente si existe una relación lineal entre esas dos variables.
- Las observaciones deben ser independientes entre sí.
- Sus datos no deben tener valores atípicos significativos.
- Comprobar la homocedasticidad: un concepto estadístico en el que las varianzas a lo largo de la línea de regresión lineal de mejor ajuste permanecen similares a lo largo de toda esa línea.
- Los residuos (errores) de la línea de regresión de mejor ajuste siguen una distribución normal.