Amazon-Recommender-System

A Python Data Science project that leverages NumPy, Pandas, Matplotlib to implement an item-item collaborative filtering algorithm on a 3,000+ item dataset. This is a group project worked on by myself, Kelvin Bian, and Kishan Patel.

Libraries used

numpy
matplotlib
pandas
json
sklearn
scipy
warnings
gzip
surprise
tqdm

Dataset

The dataset we worked with is the Amazon Luxury Beauty Dataset, which is a collection of 3,000+ items such as perfume cologne, makeup, foundation, brush, and skincare products.

Justification for Item-Item Collaborative Filtering

In e-commerce, items are more stable than users, whose preferences change frequently. This makes items a reliable basis for recommendations.

Process:

Determine Item Signatures: Based on user ratings in the user-item matrix.
Find Similar Items: Identify items rated by the user that are similar to the target item.
Predict Ratings: Calculate the weighted sum of ratings for similar items to generate a recommendation.

This method leverages item stability to provide consistent and personalized recommendations.

Step 1: Data Preprocessing

The dataset is filtered to retain only relevant metrics:

asin: Product ID
reviewerID: User ID
overall: Rating

The data is grouped by reviewerID to analyze user-specific interactions. A random seed is set to ensure the reproducibility of results across different runs of the model. This guarantees consistent outputs for evaluation and comparison.

Split data into training data set (80%) and testing data set (20%).

Handle duplicate (user, item) pairs by averaging all of a user's reviews for a specific item.

Step 2: Item-Item Collaborative Filtering

Compute an Item-Item similarity matrix across all items using cosine similarity as the similarity metric.
Make predictions on test set - for each item in test set, choose 5 most similar items and compute weighted average of corresponding similar items

Step 3: Predicition Evaluation

Use accuracy metrics such as RMSE and MAE to gauge model accuracy.

Step 4: Item Recommendations

Based on the information derived from Item-Item CF, recommend 10 items to each user.

Step 5: Recommendation Evaluation

Use metrics such as Precision, Recall, and NDCG to assess quality of recommendations.

Step 6: Further Exploration

Compare this approach with other approaches:

Item-Item Collaborative Filtering with a Baseline estimate derived from global mean, user deviation, and item deviation.
Content based filtering, incorporating TF-IDF.
SVD - Singular Value Decomposition to construct matrices that encapsulates the patterns of the data, and tunes the values to fit the dataset.

Description of Files

itemFilter.py : Implements the Model described in Steps 1-5 - Item-Item Collaborative Filtering
itemFilter_baseline.py : Builds off of itemFilter.py and provides baseline estimates for items with null predictions due to cold start problem
contentCF.py : Implements content based collaborative filtering
SVDFilter.py : Implements SVD-based filtering
recommendations.txt : recommendations of top 10 items for each user derived from itemFilter.py

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
Data Science Final Project.pptx		Data Science Final Project.pptx
Item-Item Collaborative Filtering on Amazon Luxury Beauty Dataset.pdf		Item-Item Collaborative Filtering on Amazon Luxury Beauty Dataset.pdf
README.md		README.md
SVDFilter.py		SVDFilter.py
contentCF.py		contentCF.py
itemFilter.py		itemFilter.py
itemFilter_baseline.py		itemFilter_baseline.py
recommendations.txt		recommendations.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Amazon-Recommender-System

Libraries used

Dataset

Justification for Item-Item Collaborative Filtering

Process:

Step 1: Data Preprocessing

Step 2: Item-Item Collaborative Filtering

Step 3: Predicition Evaluation

Step 4: Item Recommendations

Step 5: Recommendation Evaluation

Step 6: Further Exploration

Description of Files

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

KriChau95/Amazon-Recommender-System

Folders and files

Latest commit

History

Repository files navigation

Amazon-Recommender-System

Libraries used

Dataset

Justification for Item-Item Collaborative Filtering

Process:

Step 1: Data Preprocessing

Step 2: Item-Item Collaborative Filtering

Step 3: Predicition Evaluation

Step 4: Item Recommendations

Step 5: Recommendation Evaluation

Step 6: Further Exploration

Description of Files

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages