Práctica Final de la asignatura "Programación Orientada a Ciencia de Datos" del Máster en Data Science de la Universidad Rey Juan Carlos
Para la realización de esta práctica se ha seleccionado el dataset listings.csv (Airbnb Madrid, 2021-09-10), un conjunto de datos obtenido de insideairbnb.com. Puede ser descargado a través de este enlace.
El objetivo general de esta práctica es proponer un modelo de regresión lineal multivariante para predecir el precio por noche de un espacio ofertado en la plataforma AirBnb y situado en Madrid.
Dicho objetivo, a su vez se dividirá en los siguientes pasos:
- Selección preliminar de variables.
- Separación del conjunto de datos en dos grupos: Training (70% de los datos) y Test (30% de los datos)
- Realización de un análisis exploratorio univariante de los datos.
- Estudio e imputación de datos faltantes.
- Realización de un análisis exploratorio multivariante de los datos.
- Transformaciones necesarias a cada una de las variables para poder ser utilizadas en la regresión.
- Ajuste, aplicación y evaluación de un modelo de regresión lineal múltiple con las variables seleccionadas para la predicción de la variable price.
El código en R se encuentra en el fichero AirBNB-Regresion_Lineal.Rmd, y el análisis está exportado en AirBNB-Regresion_Lineal.html.
Calificación obtenida: 9/10