Données importées dans la base de données MySQL. Deux sources
- ../anc_sql, ../anc_tsv, données anciennes archivées.
- medict-xml, pour les titres indexés finement, ne pas modifier ici, mais dans le XML
Fichier tabulaire unicode avec la tabulation pour séparateur de cellule (\t), modifiable avec le tableur LibreOffice (mais surtout pas Microsoft.Excel qui sciemment décode mal l’unicode).
Toutes les données à charger dans la base relationnelle sont dans un format tabulaire d’“événements”, au sens où toutes les lignes ne sont pas des données indépendantes, mais sont des sortes de commandes, produisant un contexte pour les lignes suivantes (ex: un saut de page est déclaré une fois pour toutes les entrées qui suivent, jusqu’au saut de page suivant). Ce format est réfléchi pour limiter les redondances, et faciliter la modification humaine. Les données sont chargées dans la base SQL par l’automate Biusante\Medict\Insert.
| commande | paramètre 1 | paramètre 2 | paramètre 3 |
|---|---|---|---|
| pb | 754 | 768 | 4823244 |
| n° page affiché (décimal, romain, etc…) | “refimg”, numéro décimal séquentiel pour url, ex ?do=page&cote=37020d&p=768 | identitiant livancpages de l’ancienne base | |
| entry | Glycinium, Glycium, Béryllium | 1 | |
| vedettes (un ou plusieurs mot) | nombre de sauts de pages de l’entrée, 0 = (p. 754), 1 = (p. 754-755), 5 = (p. 754-759)… | ||
| orth | Glycinium | ||
| orth | Glycium | ||
| orth | Béryllium | ||
| vedette dédoublonnée (si nécessaire) | |||
| foreign | Glycium | deu | |
| foreign | glycion | eng | |
| foreign | glicio | ita | |
| traduction | code langue 3 c. | ||
| term | Catalyse ou fermentation glycique | ||
| sous-entrée, ex: locution | |||
| clique | Catalyse ou fermentation glycique | Homérique | ||
| mots liés |
Le modèle pour les traductions et les mots liées résulte de longues discussions avec l’équipe scientifique.
Soit l’entrée « Glycinium, Glycium, Béryllium ».
Pour les traductions, il a été considéré que le lexicographe a établi une équivalence terminologique stricte, non seulement entre chaque vedette et chaque traduction 2 à 2 : [fra] glycinium <-> [deu] Glycium, [fra] béryllium <-> [deu] Glycium, [fra] glycinium <-> [eng] glycion… mais aussi entre les mots en langue étrangère entre eux : [deu] Glycium <-> [eng] glycion <-> [ita] glicio <-> [deu] Glycium. En termes de théorie des graphes, ces mots (forme graphique + langue) sont les nœuds d’un graphe complet épuisant toutes les relations entre les nœuds. ([fra] glycinium, [fra] béryllium, [fra] glycinium, [deu] Glycium, [eng] glycion, [ita] glicio).
Pour les mots liés (renvois, locutions…) un extrait de l’article INSTINCT, Littré Robin 13e éd., 1873, p. 806-807. permettra d’illustrer le modèle.
INSTINCT. s. m. […] — Instincts altruistes. V. ALTRUISME. […] — Perversion morale des instincts. V. FOLIE héréditaire.
<entry xml:id="instinct">
<form><orth>Instinct</orth>, s. m.</form>
<sense>— <term>Instincts altruistes</term>. V. <ref target="altruisme">Altruisme</ref>.</sense>
<sense>— <term>Perversion morale des instincts</term>. V. <xr><ref target="folie">Folie</ref> héréditaire</xr>.</sense>
</entry>
| entry | Instinct |
|---|---|
| term | Instincts altruistes |
| clique | Instincts altruistes | Altruisme |
| term | Perversion morale des instincts |
| clique | Perversion morale des instincts | Folie | Folie héréditaire |
Instincts altruistes et Perversion morale des instincts sont des sous-vedettes de l’article INSTINCT. Le balisage a permis d’en délimiter la portée avec l’élément <sense>. Ceci est signifié par la commande term. Folie héréditaire n’est pas une sous-vedette de l’article INSTINCT, mais un renvoi à une sous-vedette de l’article FOLIE. Il a été essayé de supposer que tous les renvois d’un article formaient une seule clique, il en résultait par exemple que Altruisme était lié à Folie. Après expérience sur la totalité des données, il a été constaté que cela produisait beaucoup plus de bruit que de relations sémantiques. La commande clique modélise les rapprochements sémantiques suivants (Instinct, Instincts altruistes, Altruisme) et (Instinct, Perversion morale des instincts, Folie, Folie héréditaire). Instinct et Altruisme sont liés (ainsi que Instincts altruistes), Instinct et Folie sont liés (ainsi que Perversion morale des instincts et Folie héréditaire) ; mais pas Altruisme et Folie.
