kenlm

Running

usage: main.py [-h] [-n N] [--test_len TEST_LEN] [-u UNKNOWN_THRESHOLD] [-o OUTPUT] [-p PRUNE] input train_len

Train, validate, and serialize an n-gram model

positional arguments:
  input                 Input training and validation file
  train_len             Length of training set

options:
  -h, --help            show this help message and exit
  -n N                  n-gram model depth
  --test_len TEST_LEN   Length of testing set
  -u UNKNOWN_THRESHOLD, --unknown_threshold UNKNOWN_THRESHOLD
                        Threshold for including words
  -o OUTPUT, --output OUTPUT
                        Binary output file
  -p PRUNE, --prune PRUNE
                        Prune the model

ex.

python3 main.py --test-len=100000 en.tok 3000000

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
LICENSE		LICENSE
README.md		README.md
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

kenlm

Running

About

Uh oh!

Releases 1

Packages

Languages

License

jamesseeman/kenlm

Folders and files

Latest commit

History

Repository files navigation

kenlm

Running

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Languages

Packages