GitHub - t3rodrig/ih-data-final-project

Sistema de recomendaciones de productos por catálogo

Tonalli Rodríguez
Ironhack México | Data Analytics | 2020-09-12

Información general

Las ventas por catálogo forman parte de la cultura mexicana, y se han utilizado principalmente en momentos de crisis de la economía familiar. Quienes realizan esta actividad son, en su mayoría, mujeres que han encontrado en esta actividad una forma de auto emplearse para tener un mejor control de su tiempo y sus otras actividades.

Uno de los problemas al que se enfrentan las vendedoras por catálogo, principalmente las recien iniciadas, es el de realizar recomendaciones a sus clientes, ya sea de manera general o personalizada.

En este proyecto se presenta un sistema de recomendaciones que muestra los 10 productos más similares (basados en sus descripción) a lo que un usuario describe como producto de interés.

Este proyecto está dedicado a todas aquellas mujeres trabajadoras que han dado todo de sí mismas para sacar a sus familias adelante.

Obtención y manipulación de datos

Para este proyecto, se escogió a la marca Yves Rocher como el catálogo de interés. La extración de datos se realizó mediante web scraping utilizando la herramienta Selenium. Se recolectaron poco más de 600 productos con sus respectivos atributos como precio, descripción, secretro vegetal y categoría.

Para simplificar el modelo, únicamente se tomaron en cuenta los atributos que describen al producto, i.e., nombre del producto, descripción y secreto vegetal. El texto fue limpiado y procesado con la herramienta NLTK con el fin de descartar las palabras vacías y reducir cada palabra a su raíz o stem.

Sistema de recomendaciones

Grosso modo, los sistemas de recomendación pueden sugerir elementos "relevantes" a los usuarios. Los elementos sugeridos son tan relevantes para el usuario como sea posible, de modo que el usuario pueda interactuar con esos elementos: videos, artículos de noticias, productos en línea, etc.

Para poder realizar la recomendación se tiene que elegir una representación de los elementos y determinar la similitud entre los elementos. En este proyecto, se utilizó la representación TF-IDF de la descripción extendida (documento) de los productos con el fin de tomar en cuenta la relevancia de una palabra en un documento y en una colección de documentos. Con respecto a la similitud de los elementos, se utilizó la similitud coseno por ser independiente de la magnitud de los vectores y del tamaño del espacio vectorial.

Proyecto a futuro

El siguiente paso es construir una aplicación web full stack donde el motor de búsqueda sea precisamente el sistema de recomendaciones.

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
data		data
images		images
.gitignore		.gitignore
01-web-scraping.ipynb		01-web-scraping.ipynb
02-data_cleanning.ipynb		02-data_cleanning.ipynb
03-recommender_system.ipynb		03-recommender_system.ipynb
Procfile		Procfile
README.md		README.md
api.py		api.py
example.env		example.env
myroutines.py		myroutines.py
nltk.txt		nltk.txt
requirements.txt		requirements.txt
runtime.txt		runtime.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Sistema de recomendaciones de productos por catálogo

Información general

Obtención y manipulación de datos

Sistema de recomendaciones

Proyecto a futuro

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

t3rodrig/ih-data-final-project

Folders and files

Latest commit

History

Repository files navigation

Sistema de recomendaciones de productos por catálogo

Información general

Obtención y manipulación de datos

Sistema de recomendaciones

Proyecto a futuro

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages