safety-research

Here are 5 public repositories matching this topic...

pablo-chacon / Spoon-Bending

Educational analysis of LLM alignment, safety behavior, and framing-sensitive response patterns.

research model-alignment interpretability educational-project ai-alignment gpt4 large-language-models llm prompt-engineering reasoning-patterns gpt5 safety-research ai-bias context-engineering

Updated Nov 4, 2025

SoftPrompt-IR is a low-level symbolic annotation layer for LLM prompts, making intent strength, direction, and priority explicit. It is not a DSL or framework, but a minimal, composable way to reduce ambiguity, improve safety, and structure prompts.

low-level intermediate-representation ai-safety interpretability creative-writing ai-alignment symbolic-representation human-ai-interaction llm prompt-engineering generative-ai prompt-design safety-research llm-research intent-annotation

Updated Dec 30, 2025

evalops / override-cascade-dspy

Star

DSPy framework for detecting and preventing safety override cascades in LLM systems. Research-grade implementation for studying when completion urgency overrides safety constraints.

python machine-learning ai-safety cognitive-architecture research-framework dspy llm-evaluation llm-safety safety-research override-cascade

Updated Sep 14, 2025
Python

eddyayalagil / override-cascade-dspy

Star

🌐 Detect and prevent safety overrides in LLM systems with this DSPy-based framework, ensuring actions align with safety constraints.

python machine-learning ai-safety cognitive-architecture research-framework dspy llm-evaluation llm-safety safety-research override-cascade

Updated Jan 1, 2026
Python

AlexCodeGlider / gliderAviationSafety

Star

Explore glider aviation safety through in-depth data analysis. This project leverages incident reports and manufacturing data, utilizing Python and Jupyter Notebooks for trend identification, risk assessment, and safety enhancement in glider aviation.

python exploratory-data-analysis jupyter-notebook data-visualization data-analysis statistical-modeling aviation-safety glider-aviation safety-research

Updated Dec 30, 2023
Jupyter Notebook

Improve this page

Add a description, image, and links to the safety-research topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the safety-research topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

safety-research

Here are 5 public repositories matching this topic...

pablo-chacon / Spoon-Bending

tobs-code / SoftPrompt-IR

evalops / override-cascade-dspy

eddyayalagil / override-cascade-dspy

AlexCodeGlider / gliderAviationSafety

Improve this page

Add this topic to your repo