Use case: given sebuah link artikel berita, kita ingin lihat bagaimana sentimen artikel tersebut pada rojak.
Sebagai MVP, kita ingin pencarian dilakukan secara exact match dan tidak ada fuzzy search. Tantangannya adalah satu berita bisa memiliki beberapa URL berbeda, terutama apabila terdapat query string yang tidak relevan dengan beritanya. Contohnya pada detik.com:
http://news.detik.com/berita/d-3328647/ppp-ingin-pemilu-sistem-terbuka-pemilih-coblos-nama-caleg?_ga=1.102210820.421029061.1457685142
Terdapat query _ga yang tidak berhubungan. Solusinya adalah kita strip query string dari URLnya ketika melakukan pencarian.
Use case: given sebuah link artikel berita, kita ingin lihat bagaimana sentimen artikel tersebut pada rojak.
Sebagai MVP, kita ingin pencarian dilakukan secara exact match dan tidak ada fuzzy search. Tantangannya adalah satu berita bisa memiliki beberapa URL berbeda, terutama apabila terdapat query string yang tidak relevan dengan beritanya. Contohnya pada detik.com:
Terdapat query
_gayang tidak berhubungan. Solusinya adalah kita strip query string dari URLnya ketika melakukan pencarian.