Si l = [A,B,…], par exemple l = [A,B], est une liste de concepts, il est facile de
chercher des kw a, b,… ‘sous’ A-B : a < A-B, ce que l'on notera encore par abus : A-B
cela correspond à a→b ≾ A-B (CF tdkg algebra II)
Exemple pour language-bio:
En général, quand on prend l au hasard, A-B est vide, mais on peut chercher des proxi de A,B,... de manière à trouver un ensemble non vide, et donc chercher C-D~A-B, tq que C-D soit non vide.
Pour définir précisément ~, on se donne 3 morphismes sur tdkg:
a↪ b : inclusion* (non orientée) : a inclus dans b ou l'inverse.
a < b : dérivation* : on monte en abstraction (phylogenèse)
a→b : association* : b est associé à a (réticulation)
et bien sur on peut les composer.
A priori la distance associée à ces morphismes est différentes : disons 0 dans le premier cas, 1 dans le 2e 2 dans le 3e.
pour éviter l'explosion combinatoire, on peut chercher d'abord les inclusions* de [A,B] puis en chercher d'une part les dérivations* d'autres par les associations*, concaténer, et en faire toutes les combinaisons :
[A,B] ⇝ [[A,A',...],[B,B',...]] ⇝ [[A,B],[A,B'],...,[U,V ],...], U-V~A-B
on peut associer à chaque couple [U,V ] une note entre 0 et 2*2 selon le morphisme dont il est issu, mais aussi chaque concept A ayant un rang fréquentiel rg(A) dans tdkg, on dispose de la somme des rang rg(U)+rg(V), qui donne un indice de la probabilité que U-V soit non vide : plus la somme des rangs est élevée, plus il y a de chance que U-V soit populé.
Il ne reste plus, par ordre de note croissante et de rang décroissant, à calculer U-V. (si ressource computationnelle suffisante, on peut faire le calcul pour tous les [U,V ])
exemple : pour symmetry-data, qui est réduit à asymmetric information < symmetry_information, on trouve notamment le proxi information-data :
No comments:
Post a Comment