AI Model Meta Information Scraper

Scrapes model information from AI providers (currently: OpenAI).

Installation

git clone <repository-url>
cd model-meta
uv venv
source .venv/bin/activate
uv pip install -e .
python -m playwright install chromium

Usage

python scrape_models.py --provider openai

Options:

--openai-api-key <key> or set OPENAI_API_KEY
--timeout <ms> (increase timeout)
--debug (verbose logging)
--use-cache (use cached HTML)
--dry-run (no API calls)

Output: meta/openai.json with scraped model info.

How It Works

Automates browser with Playwright
Extracts model documentation links and HTML
Uses GPT-4.1 (OpenAI API) to parse content
Validates data with Pydantic models (model_type.py)
Saves as JSON

Output Example

{
  "id": "openai",
  "friendly_name": "OpenAI",
  "models": [
    {
      "id": "gpt-4",
      "friendly_name": "GPT-4",
      "pricing": { "unit": "usd/1m_tokens", "input": 30.0, "output": 60.0 },
      "context_length": 8192,
      "max_output_tokens": 4096,
      "knowledge_cutoff_date": "2023-04-01",
      "capabilities": ["text_input", "text_output", "reasoning"]
    }
  ]
}

Adding Providers

Add a new scraper class in scrapers/ (inherits ModelScraper)
Implement scrape_models()
Register in scrapers/__init__.py and scrape_models.py

Example:

from scrapers.base import ModelScraper

class NewProviderScraper(ModelScraper):
  def scrape_models(self):
    return {
      "id": "new-provider",
      "friendly_name": "New Provider",
      "models": [ /* ... */ ]
    }

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
meta		meta
scrapers		scrapers
.gitignore		.gitignore
README.md		README.md
model_type.py		model_type.py
pyproject.toml		pyproject.toml
scrape_models.py		scrape_models.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI Model Meta Information Scraper

Installation

Usage

How It Works

Output Example

Adding Providers

About

Uh oh!

Releases

Packages

Uh oh!

Languages

mainly-ai/model-meta

Folders and files

Latest commit

History

Repository files navigation

AI Model Meta Information Scraper

Installation

Usage

How It Works

Output Example

Adding Providers

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages