- Reescribir el codigo para que sea maś eficiente
- Imprimir por pantalla info importante
- Test de memooria y procesador
- Asegurarme que funciona
- Preprocessing
- Para trivial y fuzzy
- Para uNER y fast uNER
- Algoritmos
- Trivial, fuzzy,uNER,fast_uNER
- Post processing
- Para uNER
- Metricas de accuracy:
- Con embeddings
- Sin embeddings
- Clustering
- Metrica por articulo y global
- Bootstrap
- Evaluation time
- Resources time
- Provarlo con BERT y BERT biomedical
- Añadir la opción de subir archivos
- Revisar
- Añadir adjetivos
- Salida algoritmo (embeddings) para cada articulo i/o global
- Distribucion de metrica de cada algoritmo y cada articulo
- Bootstraping de la metrica media de cada algoritmo conforme añadimos articulos (bootstraping)
- Clustering augmentation
- Labeling
- Wordmap
- Wordmap mosaic