Simple Language Model

A minimal feed‑forward neural language model built with PyTorch. It takes a fixed‑length context window of 5 BERT token IDs and predicts the next token. Using a tinyshakespeare.txt dataset

✨ Key points

Tiny architecture Embedding → Average → FC → ReLU → FC (≈ 300 k trainable parameters)
CSV data pipeline context + target stored as rows: tok1,tok2,tok3,tok4,tok5,target
Trainer class handles dataloader, loss, optimizer, checkpointing
Works with any text after tokenising by bert‑base‑uncased tokenizer

🔧 Requirements

Package	Version
Python	≥ 3.9
PyTorch	≥ 1.13 or 2.x
transformers	≥ 4.40

Install dependencies:

pip install torch transformers tqdm

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
__pycache__		__pycache__
checkpoints		checkpoints
data		data
FeedForwardLM.py		FeedForwardLM.py
LMDataset.py		LMDataset.py
README.md		README.md
Trainer.py		Trainer.py
example.ipynb		example.ipynb
image.png		image.png
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Simple Language Model

✨ Key points

🔧 Requirements

About

Uh oh!

Releases

Packages

Languages

t3i8m/Simple-Language-Model

Folders and files

Latest commit

History

Repository files navigation

Simple Language Model

✨ Key points

🔧 Requirements

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages