"L'éthique n'est pas une opinion. C'est une condition de stabilité thermodynamique."
Ce module remplace les "Garde-fous" (Guardrails) rigides et fragiles de l'IA classique par un Système Vestibulaire Interne. Au lieu d'interdire des actions via des listes noires, le système calcule le "coût entropique" de chaque décision. Une action "mauvaise" est une action qui augmente le désordre (l'entropie sociale) du système.
De la Loi (Top-Down) à la Physique (Bottom-Up)
Les IA actuelles utilisent le RLHF (Reinforcement Learning from Human Feedback) pour apprendre la morale par imitation. C'est fragile et culturellement biaisé.
L'approche Lichen postule que l'éthique est une propriété physique émergente visant à minimiser l'entropie sociale (
| Approche Classique | Approche Lichen (EHE) |
|---|---|
| Garde-fous (Murs) | Boussole (Vecteurs) |
| Basé sur des règles interdites | Basé sur l'homéostasie |
| Fragile (Jailbreak facile) | Robuste (Auto-correctif) |
| Binaire (Bien/Mal) | Spectral (Score -1 à +1) |
Le cœur du système est l'Échelle d'Homéostasie Éthique (EHE). Elle mesure la viabilité d'une action
Où le score brut
-
$MAC(a)$ : Potentiel de coopération (Vecteurs Moraux). -
$\Delta S(a)$ : Entropie sociale induite (Chaos généré par l'action). -
$D_{KL}$ : Divergence de Kullback-Leibler (Éloignement de la norme locale).
Le but n'est pas d'être "parfait" (+1, rigidité mortelle) ni "chaotique" (-1, destruction), mais de rester à la Lisière du Chaos (Edge of Chaos), là où la complexité et l'adaptabilité sont maximales.
Pour calculer le score
- Kinship (Parenté) : Protection des proches/géniteurs (Users).
- Group (Groupe) : Cohésion de l'équipe/tribu.
- Reciprocity (Réciprocité) : Échange équitable (Trust).
- Contest (Défense) : Capacité à dire non (Assertiveness/Hawk-Dove).
- Division (Équité) : Partage juste des ressources.
- Possession (Propriété) : Respect des frontières et des droits.
- Truth (Vérité/Signal) : Fidélité de l'information (Anti-Hallucination).
Dans l'architecture unifiée, ce module agit comme le Cortex Préfrontal :
- Input : Une liste d'actions candidates générées par le LLM.
-
Process :
- Projection sur les axes MAC.
- Simulation de l'impact entropique (
$\Delta S$ ).
-
Output : Rejet des actions si
$EHE < -0.5$ (Chaos) ou$EHE > 0.9$ (Dogmatisme). -
Feedback : Mise à jour des poids
$\alpha, \beta, \gamma$ selon les résultats observés (Apprentissage).
"Une conscience sans éthique est une entropie sans frein."