Skip to content

Latest commit

 

History

History

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

README.md

BIU Santé / Médica / Métadictionnaire : données

Données importées dans la base de données MySQL. Deux sources

tsv : tab separated values, utf-8.

Fichier tabulaire unicode avec la tabulation pour séparateur de cellule (\t), modifiable avec le tableur LibreOffice (mais surtout pas Microsoft.Excel qui sciemment décode mal l’unicode).

tsv, LibreOffice

“Événements”

Toutes les données à charger dans la base relationnelle sont dans un format tabulaire d’“événements”, au sens où toutes les lignes ne sont pas des données indépendantes, mais sont des sortes de commandes, produisant un contexte pour les lignes suivantes (ex: un saut de page est déclaré une fois pour toutes les entrées qui suivent, jusqu’au saut de page suivant). Ce format est réfléchi pour limiter les redondances, et faciliter la modification humaine. Les données sont chargées dans la base SQL par l’automate Biusante\Medict\Insert.

commande paramètre 1 paramètre 2 paramètre 3
pb 754 768 4823244
n° page affiché (décimal, romain, etc…) “refimg”, numéro décimal séquentiel pour url, ex ?do=page&cote=37020d&p=768 identitiant livancpages de l’ancienne base
entry Glycinium, Glycium, Béryllium 1
vedettes (un ou plusieurs mot) nombre de sauts de pages de l’entrée, 0 = (p. 754), 1 = (p. 754-755), 5 = (p. 754-759)…
orth Glycinium
orth Glycium
orth Béryllium
vedette dédoublonnée (si nécessaire)
foreign Glycium deu
foreign glycion eng
foreign glicio ita
traduction code langue 3 c.
term Catalyse ou fermentation glycique
sous-entrée, ex: locution
clique Catalyse ou fermentation glycique | Homérique
mots liés

Le modèle pour les traductions et les mots liées résulte de longues discussions avec l’équipe scientifique.

Soit l’entrée « Glycinium, Glycium, Béryllium ». Graphe complet Pour les traductions, il a été considéré que le lexicographe a établi une équivalence terminologique stricte, non seulement entre chaque vedette et chaque traduction 2 à 2 : [fra] glycinium <-> [deu] Glycium, [fra] béryllium <-> [deu] Glycium, [fra] glycinium <-> [eng] glycion… mais aussi entre les mots en langue étrangère entre eux : [deu] Glycium <-> [eng] glycion <-> [ita] glicio <-> [deu] Glycium. En termes de théorie des graphes, ces mots (forme graphique + langue) sont les nœuds d’un graphe complet épuisant toutes les relations entre les nœuds. ([fra] glycinium, [fra] béryllium, [fra] glycinium, [deu] Glycium, [eng] glycion, [ita] glicio).

Pour les mots liés (renvois, locutions…) un extrait de l’article INSTINCT, Littré Robin 13e éd., 1873, p. 806-807. permettra d’illustrer le modèle.

INSTINCT. s. m. […] — Instincts altruistes. V. ALTRUISME. […] — Perversion morale des instincts. V. FOLIE héréditaire.

<entry xml:id="instinct">
  <form><orth>Instinct</orth>, s. m.</form>
  <sense>— <term>Instincts altruistes</term>. V. <ref target="altruisme">Altruisme</ref>.</sense>
  <sense>— <term>Perversion morale des instincts</term>. V. <xr><ref target="folie">Folie</ref> héréditaire</xr>.</sense>
</entry>
entry Instinct
term Instincts altruistes
clique Instincts altruistes | Altruisme
term Perversion morale des instincts
clique Perversion morale des instincts | Folie | Folie héréditaire

Instincts altruistes et Perversion morale des instincts sont des sous-vedettes de l’article INSTINCT. Le balisage a permis d’en délimiter la portée avec l’élément <sense>. Ceci est signifié par la commande term. Folie héréditaire n’est pas une sous-vedette de l’article INSTINCT, mais un renvoi à une sous-vedette de l’article FOLIE. Il a été essayé de supposer que tous les renvois d’un article formaient une seule clique, il en résultait par exemple que Altruisme était lié à Folie. Après expérience sur la totalité des données, il a été constaté que cela produisait beaucoup plus de bruit que de relations sémantiques. La commande clique modélise les rapprochements sémantiques suivants (Instinct, Instincts altruistes, Altruisme) et (Instinct, Perversion morale des instincts, Folie, Folie héréditaire). Instinct et Altruisme sont liés (ainsi que Instincts altruistes), Instinct et Folie sont liés (ainsi que Perversion morale des instincts et Folie héréditaire) ; mais pas Altruisme et Folie.