Merged
Conversation
- 검색어 자체를 포함하는 결과에 가산점
… 뒤로 갈수록 더 낮은 가중치로 계산됨 - 종이의 집 검색을 예시로 들면 종 -> 종이 -> 종이의 -> 종이의 집 검색순서로 각각 '종', '종이', '종이', '종이, 집' 으로 토큰이 수집되는데 마지막 종이의 -> 종이의 집 으로 넘어갈 때 앞에 단어에 우선순위를 주지 않으면 종이 와 집 토큰이 같은 점수를 가져서 검색결과가 뒤섞일 수 있기 때문에 UX에 영향을 줄 수 있음 그래서 이전 검색결과에서 크게 벗어나지 않게 갱신되도록 변경
Closed
1 task
Contributor
Author
|
이게 키워드를 동일한걸 많이 쓰면 도 예외가 있네요 쉽지않군요 |
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Add this suggestion to a batch that can be applied as a single commit.This suggestion is invalid because no changes were made to the code.Suggestions cannot be applied while the pull request is closed.Suggestions cannot be applied while viewing a subset of changes.Only one suggestion per line can be applied in a batch.Add this suggestion to a batch that can be applied as a single commit.Applying suggestions on deleted lines is not supported.You must change the existing code in this line in order to create a valid suggestion.Outdated suggestions cannot be applied.This suggestion has been applied or marked resolved.Suggestions cannot be applied from pending reviews.Suggestions cannot be applied on multi-line comments.Suggestions cannot be applied while the pull request is queued to merge.Suggestion cannot be applied right now. Please check back later.
PR 요약
기존에서 standard analyzer 로 매칭되는 가중치 높임 + nori 구문 일치는 앞에서 부터 높은점수 뒤로 갈수록 더 낮은 가중치로 계산됨
체크리스트
상세 설명
기존에서 standard analyzer 로 매칭되는 가중치 높임 + nori 구문 일치는 앞에서 부터 높은점수 뒤로 갈수록 더 낮은 가중치로 계산됨
또 복합어가 있으면 키워드와 완전히 같은 경우에도 우선순위가 밀리는 경우가 생겼는데 이를 해결함
종이의 로 검색할 때
인정 종이풍선 vs 종이의 집 검색 중 종이의 집이 score가 높아야하는데
종이풍선의 토큰이 종이, 종이풍선 으로 종이토큰에 두번이나 hit되어서 순서역전을 방지하기 위해서 각 매칭마다 중복 hit를 제외함
종이의 집 검색을 예시로 들면 종 -> 종이 -> 종이의 -> 종이의 집 검색순서로 각각 '종', '종이', '종이', '종이, 집' 으로 토큰이 수집되는데 마지막 종이의 -> 종이의 집 으로 넘어갈 때 앞에 단어에 우선순위를 주지 않으면 종이 와 집 토큰이 같은 점수를 가져서 검색결과가 뒤섞일 수 있기 때문에 UX에 영향을 줄 수 있음 그래서 이전 검색결과에서 크게 벗어나지 않게 갱신되도록 변경
검증 단계
로컬 테스트
이미지는 S3 연결을 제대로 안해서 안보입니다.

추가 코멘트
그전에는 종이의 -> 종이의 집 으로 넘어가면 종이 달이 사라지고 집에 관련된 검색어들이 먼저 검색되던 케이스를 수정했습니다.
boost 값을 조정한거라서 예외케이스가 또 나올수 있어요