Semantic Drift – analiza rozrzutu semantycznego fraz kluczowych

Ten projekt pokazuje jak zmierzyć rozrzut semantyczny fraz wygenerowanych z Google Autocomplete, na przykładzie hasła „kredyt hipoteczny”.

Wizualizacja pozwala zrozumieć, które zapytania są blisko głównego tematu (core), a które zaczynają dryfować semantycznie (drift), co jest szczególnie przydatne w SEO, NLP i analizie intencji użytkowników.

Co robi ten projekt

Wczytuje frazy z pliku .jsonl (z Google Autocomplete)
Generuje embeddingi fraz lokalnym modelem
Oblicza odległość każdej frazy od centroidu (średniego embeddingu)
Dzieli frazy na:
- core – bardzo zbliżone do głównego tematu
- semi – poboczne
- drift – semantycznie odklejone
Tworzy wykres PCA w 2D

Jak uruchomić

Zainstaluj zależności:

pip install -r requirements.txt

Uruchamiaj po kolei pliki 1,2,3.py - jeśli masz ochotę wrzuć je jako pipeline poprzez np. orkiestrator main.py

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
1.py		1.py
2.py		2.py
3.py		3.py
LICENSE		LICENSE
README.md		README.md
frazy.txt		frazy.txt
frazy_kredyt_hipoteczny.jsonl		frazy_kredyt_hipoteczny.jsonl
frazy_wyniki.json		frazy_wyniki.json
requirements.txt		requirements.txt
rozrzut.png		rozrzut.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Semantic Drift – analiza rozrzutu semantycznego fraz kluczowych

Co robi ten projekt

Jak uruchomić

About

Uh oh!

Releases

Packages

Languages

License

dolppl/Semantic-drift

Folders and files

Latest commit

History

Repository files navigation

Semantic Drift – analiza rozrzutu semantycznego fraz kluczowych

Co robi ten projekt

Jak uruchomić

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages