Skip to content

[Content] 콘텐츠 키워드 검색 개선#130

Merged
jeonggiju merged 2 commits intodevfrom
feature/elastic-search-fullcontext-boost#129
Jan 29, 2026
Merged

[Content] 콘텐츠 키워드 검색 개선#130
jeonggiju merged 2 commits intodevfrom
feature/elastic-search-fullcontext-boost#129

Conversation

@userjin2123
Copy link
Copy Markdown
Contributor

PR 요약

기존에서 standard analyzer 로 매칭되는 가중치 높임 + nori 구문 일치는 앞에서 부터 높은점수 뒤로 갈수록 더 낮은 가중치로 계산됨

체크리스트

  • 이 PR과 관련된 이슈가 있나요? (#xxx)
  • 기능/버그 수정 테스트 완료
  • 코드 리뷰 완료

상세 설명

기존에서 standard analyzer 로 매칭되는 가중치 높임 + nori 구문 일치는 앞에서 부터 높은점수 뒤로 갈수록 더 낮은 가중치로 계산됨
또 복합어가 있으면 키워드와 완전히 같은 경우에도 우선순위가 밀리는 경우가 생겼는데 이를 해결함
종이의 로 검색할 때
인정 종이풍선 vs 종이의 집 검색 중 종이의 집이 score가 높아야하는데
종이풍선의 토큰이 종이, 종이풍선 으로 종이토큰에 두번이나 hit되어서 순서역전을 방지하기 위해서 각 매칭마다 중복 hit를 제외함

종이의 집 검색을 예시로 들면 종 -> 종이 -> 종이의 -> 종이의 집 검색순서로 각각 '종', '종이', '종이', '종이, 집' 으로 토큰이 수집되는데 마지막 종이의 -> 종이의 집 으로 넘어갈 때 앞에 단어에 우선순위를 주지 않으면 종이 와 집 토큰이 같은 점수를 가져서 검색결과가 뒤섞일 수 있기 때문에 UX에 영향을 줄 수 있음 그래서 이전 검색결과에서 크게 벗어나지 않게 갱신되도록 변경

  • 조건은 키워드와 토큰이 순서에 맞게, 또 앞에서 부터 매칭 되는것은 가산점, 다른 여러 토큰이 매칭되도 가산점을 주도록 변경했습니다.

검증 단계

로컬 테스트

이미지는 S3 연결을 제대로 안해서 안보입니다.
image

image image

추가 코멘트

그전에는 종이의 -> 종이의 집 으로 넘어가면 종이 달이 사라지고 집에 관련된 검색어들이 먼저 검색되던 케이스를 수정했습니다.
boost 값을 조정한거라서 예외케이스가 또 나올수 있어요

… 뒤로 갈수록 더 낮은 가중치로 계산됨

- 종이의 집 검색을 예시로 들면 종 -> 종이 -> 종이의 -> 종이의 집 검색순서로 각각 '종', '종이', '종이', '종이, 집' 으로 토큰이 수집되는데 마지막 종이의 -> 종이의 집 으로 넘어갈 때 앞에 단어에 우선순위를 주지 않으면 종이 와 집 토큰이 같은 점수를 가져서 검색결과가 뒤섞일 수 있기 때문에 UX에 영향을 줄 수 있음 그래서 이전 검색결과에서 크게 벗어나지 않게 갱신되도록 변경
@userjin2123 userjin2123 self-assigned this Jan 28, 2026
@userjin2123 userjin2123 added the feat 새로운 기능 추가 label Jan 28, 2026
@github-project-automation github-project-automation bot moved this to Todo in mopl-sb5 Jan 28, 2026
@userjin2123 userjin2123 linked an issue Jan 28, 2026 that may be closed by this pull request
1 task
@userjin2123
Copy link
Copy Markdown
Contributor Author

이게 키워드를 동일한걸 많이 쓰면 도 예외가 있네요 쉽지않군요
실제 키워드 검색을 어떤 식으로 기업들이 하고 있는지 궁금해지네요

@jeonggiju jeonggiju merged commit af123d8 into dev Jan 29, 2026
1 check passed
@github-project-automation github-project-automation bot moved this from Todo to Done in mopl-sb5 Jan 29, 2026
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

feat 새로운 기능 추가

Projects

Status: Done

Development

Successfully merging this pull request may close these issues.

[Content] 콘텐츠 키워드 검색 개선

2 participants