CodeMix Generation – NLP Project

English ↔ CodeMix (English-Hindi) translation using Seq2Seq neural models with attention. Explored the impact of Language Identification (LID) tags on translation performance.

Key Features

Seq2Seq model with attention mechanism.
Translation directions:
- English → CodeMix
- CodeMix → English
Experimented with and without LID tags.
Evaluated using perplexity and BLEU scores.

Results (Highlights)

Without LID tags: BLEU ≈ 0.03 (English→CodeMix), 0.02 (CodeMix→English)
With LID tags: BLEU ≈ 0.06 (English→CodeMix), 0.04 (CodeMix→English)

Files

Notebooks for all translation directions (with/without LID tags)
Final Report

Technologies

Python • PyTorch • Spacy • TorchText

Authors

Vishal Patel
Pawan Patidar

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
codemix_to_english		codemix_to_english
english_to_codemix		english_to_codemix
train_data		train_data
validation_data		validation_data
README.md		README.md
final_project_report.pdf		final_project_report.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CodeMix Generation – NLP Project

Key Features

Results (Highlights)

Files

Technologies

Authors

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

CodeMix Generation – NLP Project

Key Features

Results (Highlights)

Files

Technologies

Authors

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages