Skip to content

[Content] 키워드 검색 시 제목에 가중치 + 형태소 분리 시 의도되지 않는 것 임시 방편 적용#122

Merged
jeonggiju merged 2 commits intodevfrom
feature/content-elasticsearch-title-score-boost#121
Jan 28, 2026
Merged

[Content] 키워드 검색 시 제목에 가중치 + 형태소 분리 시 의도되지 않는 것 임시 방편 적용#122
jeonggiju merged 2 commits intodevfrom
feature/content-elasticsearch-title-score-boost#121

Conversation

@userjin2123
Copy link
Copy Markdown
Contributor

@userjin2123 userjin2123 commented Jan 27, 2026

PR 요약

[Content] 키워드 검색 시 제목에 가중치 + 형태소 분리 시 의도되지 않는 것 임시 방편 적용

체크리스트

상세 설명

제목 + 설명이 같은 가중치를 받고 있어서
키워드 전체를 제목에 포함한 것을 가장 큰 가중치를
키워드 전체를 접두사로 쓴 제목이 있으면 더 큰 가중치를
그 외에는 nori 형태소 토큰으로 나눠서 가중치를 줬습니다.

또한 제목이 설명보다 더 큰 가중치를 받습니다.

검증 단계

추가 코멘트

nori가 '종이의' 만 주면 종 이 의 로 형태소를 분리하는걸 확인했는데요
종이, 종, 이 이런식도 아니고 그냥 종, 이, 의 로 분해되고 기존 설정에 의해서 조사는 버려서 '종, 이' 만 토큰으로 남습니다.
'종이의 집' 키워드를 넣으면 '종이, 집' 으로 나옵니다. 정확히 어떻게 나누는 지 모르겠어요!
'종이의 ' 처럼 공백을 넣으면 정확히 종이 의 로 분해합니다. 공백으로 넣으면 문맥을 더 잘 이해하는건지 정확한건 공식 깃허브나 소스, 문서등을 참고해봐야할 것 같아요

진짜 왜이러는지 모름... 공백넣으면 왜 더 잘되는지 테스트하다가 '종이의' 까지 쳤을땐 잘못나오다가 '종이의 ' 치니깐 잘나와서 일단 임시방편으로 두었습니다.

다른 케이스들도 테스트 가능하신분들 해주세요 PR 바로 merge안하고 브랜치에서 먼저 테스트하셔도 됩니다. 아니면 코드부분만 긁어서 local에서 추가하셔서 테스트해보세요!

… 수 있을 때 잘못 형태소 분해를 하는것을 수정

- nori가 '종이의' 만 주면 종 이 의 로 형태소를 분리하는걸 확인했는데요, '종이의 ' 처럼 공백을 넣으면 정확히 종이 의 로 분해합니다. 공백으로 넣으면 문맥을 더 잘 이해하는건지 정확한건 공식 깃허브나 소스, 문서등을 참고해봐야할 것 같아요
@userjin2123 userjin2123 self-assigned this Jan 27, 2026
@userjin2123 userjin2123 added the feat 새로운 기능 추가 label Jan 27, 2026
@github-project-automation github-project-automation bot moved this to Todo in mopl-sb5 Jan 27, 2026
@jeonggiju jeonggiju merged commit ddf808d into dev Jan 28, 2026
1 check passed
@github-project-automation github-project-automation bot moved this from Todo to Done in mopl-sb5 Jan 28, 2026
@userjin2123 userjin2123 deleted the feature/content-elasticsearch-title-score-boost#121 branch January 28, 2026 08:26
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

feat 새로운 기능 추가

Projects

Status: Done

Development

Successfully merging this pull request may close these issues.

[Content] 키워드 검색 시 제목에 가중치 + 형태소 분리 시 의도되지 않는 것 임시 방편 적용

2 participants