@unglish/word-generator

Generate English-like nonce words using configurable phonotactics.

Install

npm install @unglish/word-generator

Quick Start

import { generateWord, generateWords } from "@unglish/word-generator";

const one = generateWord();
console.log(one.written.clean);

const deterministic = generateWord({ seed: 42 });
console.log(deterministic.written.clean);

const batch = generateWords(5, { seed: 42, mode: "lexicon" });
console.log(batch.map(w => w.written.clean));

generateWords(count, { seed }) is deterministic and yields different words in the same seeded stream.

By default generation includes morphology when the active config enables it. Pass { morphology: false } for bare root forms.

RNG Control

import { createSeededRng, generateWord } from "@unglish/word-generator";

const rand = createSeededRng(42);
const a = generateWord({ rand });
const b = generateWord({ rand });

Use seed for one-off deterministic calls, or pass rand to control a shared RNG stream.

Trace-First Diagnostics

For n-gram or orthography outliers, use trace: true and inspect word.trace instead of only checking surface strings.

import { generateWord } from "@unglish/word-generator";

const word = generateWord({ seed: 42, mode: "lexicon", trace: true });

console.log(word.written.clean);
console.log(word.trace?.summary);
console.log(word.trace?.stages[0]);
console.log(word.trace?.graphemeSelections[0]);

Detailed trace workflow: docs/word-trace-diagnostics.md

Top-Down Phoneme Targeting

Generation now plans words top-down:

sample a target phoneme count,
sample a compatible syllable count,
distribute onset/coda consonant budgets across syllables,
generate phonemes, repairs, pronunciation, and spelling.

The built-in English config ships with this wired through:

phonemeLengthWeights
phonemeToSyllableWeights

Custom language configs should provide both tables. They are required parts of LanguageConfig, not optional tuning extras.

After retuning those tables, run:

npm run analyze:phoneme-length
npm run test:quality

Boundary Policy Config (0.6.0)

Boundary adjustment probabilities moved to a dedicated generationWeights.boundaryPolicy object.

import { createGenerator, englishConfig } from "@unglish/word-generator";

const generator = createGenerator({
  ...englishConfig,
  generationWeights: {
    ...englishConfig.generationWeights,
    boundaryPolicy: {
      equalSonorityDrop: 90,
      risingCodaDrop: 25,
    },
  },
});

Breaking change:

generationWeights.probability.boundaryDrop was removed.
Use generationWeights.boundaryPolicy.equalSonorityDrop instead.

Pronunciation Config

Stress and aspiration are declarative under pronunciation.

import { createGenerator, englishConfig } from "@unglish/word-generator";

const generator = createGenerator({
  ...englishConfig,
  pronunciation: {
    ...englishConfig.pronunciation,
    stress: {
      ...englishConfig.pronunciation.stress,
      primary: { type: "penultimate" },
    },
    aspiration: {
      enabled: true,
      targets: [{ segment: "onset", index: 0, manner: ["stop"], voiced: false }],
      rules: [{ id: "word-initial", when: { wordInitial: true }, probability: 100 }],
      fallbackProbability: 0,
    },
  },
});

Development

npm test
npm run lint
npm run dev

Additional checks:

npm run test:quality
npm run analyze:phoneme-length
npm run test:perf
npm run analyze:phonemes
npm run analyze:trigrams
npm run audit:trace

Documentation

Contribution workflow: CONTRIBUTING.md
Agent-specific constraints: agents.md
Diagnostics/design docs index: docs/README.md
Tuning notes and diagnostics: TUNING.md

Name		Name	Last commit message	Last commit date
Latest commit History 332 Commits
.githooks		.githooks
.github/workflows		.github/workflows
data		data
demo		demo
docs		docs
scripts		scripts
src		src
tasks		tasks
.gitignore		.gitignore
.prettierrc		.prettierrc
CHANGELOG.md		CHANGELOG.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
PR-SUMMARY.md		PR-SUMMARY.md
README.md		README.md
TUNING.md		TUNING.md
agents.md		agents.md
eslint.config.mjs		eslint.config.mjs
package-lock.json		package-lock.json
package.json		package.json
tea.yaml		tea.yaml
tsconfig.json		tsconfig.json
vite.config.js		vite.config.js
vitest.config.ts		vitest.config.ts
vitest.perf.config.ts		vitest.perf.config.ts
vitest.quality.config.ts		vitest.quality.config.ts

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

@unglish/word-generator

Install

Quick Start

RNG Control

Trace-First Diagnostics

Top-Down Phoneme Targeting

Boundary Policy Config (0.6.0)

Pronunciation Config

Development

Documentation

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

@unglish/word-generator

Install

Quick Start

RNG Control

Trace-First Diagnostics

Top-Down Phoneme Targeting

Boundary Policy Config (0.6.0)

Pronunciation Config

Development

Documentation

About

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages