Skip to content

Latest commit

 

History

History
48 lines (40 loc) · 976 Bytes

File metadata and controls

48 lines (40 loc) · 976 Bytes

Cosas que faltan por hacer

Clustering

  • Reescribir el codigo para que sea maś eficiente
  • Imprimir por pantalla info importante
  • Test de memooria y procesador
  • Asegurarme que funciona

Algorithms

  • Preprocessing
    • Para trivial y fuzzy
    • Para uNER y fast uNER
  • Algoritmos
    • Trivial, fuzzy,uNER,fast_uNER
  • Post processing
    • Para uNER

Evaluation

  • Metricas de accuracy:
    • Con embeddings
    • Sin embeddings
  • Clustering
  • Metrica por articulo y global
  • Bootstrap
  • Evaluation time
  • Resources time
  • Provarlo con BERT y BERT biomedical

Server

  • Añadir la opción de subir archivos

Labeling

  • Revisar
  • Añadir adjetivos

Ploting

  • Salida algoritmo (embeddings) para cada articulo i/o global
  • Distribucion de metrica de cada algoritmo y cada articulo
  • Bootstraping de la metrica media de cada algoritmo conforme añadimos articulos (bootstraping)
  • Clustering augmentation
  • Labeling
  • Wordmap
  • Wordmap mosaic

Test