[Content] 키워드 검색 시 제목에 가중치 + 형태소 분리 시 의도되지 않는 것 임시 방편 적용#122
Merged
Conversation
… 수 있을 때 잘못 형태소 분해를 하는것을 수정 - nori가 '종이의' 만 주면 종 이 의 로 형태소를 분리하는걸 확인했는데요, '종이의 ' 처럼 공백을 넣으면 정확히 종이 의 로 분해합니다. 공백으로 넣으면 문맥을 더 잘 이해하는건지 정확한건 공식 깃허브나 소스, 문서등을 참고해봐야할 것 같아요
2 tasks
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Add this suggestion to a batch that can be applied as a single commit.This suggestion is invalid because no changes were made to the code.Suggestions cannot be applied while the pull request is closed.Suggestions cannot be applied while viewing a subset of changes.Only one suggestion per line can be applied in a batch.Add this suggestion to a batch that can be applied as a single commit.Applying suggestions on deleted lines is not supported.You must change the existing code in this line in order to create a valid suggestion.Outdated suggestions cannot be applied.This suggestion has been applied or marked resolved.Suggestions cannot be applied from pending reviews.Suggestions cannot be applied on multi-line comments.Suggestions cannot be applied while the pull request is queued to merge.Suggestion cannot be applied right now. Please check back later.
PR 요약
[Content] 키워드 검색 시 제목에 가중치 + 형태소 분리 시 의도되지 않는 것 임시 방편 적용
체크리스트
상세 설명
제목 + 설명이 같은 가중치를 받고 있어서
키워드 전체를 제목에 포함한 것을 가장 큰 가중치를
키워드 전체를 접두사로 쓴 제목이 있으면 더 큰 가중치를
그 외에는 nori 형태소 토큰으로 나눠서 가중치를 줬습니다.
또한 제목이 설명보다 더 큰 가중치를 받습니다.
검증 단계
추가 코멘트
nori가 '종이의' 만 주면 종 이 의 로 형태소를 분리하는걸 확인했는데요
종이, 종, 이 이런식도 아니고 그냥 종, 이, 의 로 분해되고 기존 설정에 의해서 조사는 버려서 '종, 이' 만 토큰으로 남습니다.
'종이의 집' 키워드를 넣으면 '종이, 집' 으로 나옵니다. 정확히 어떻게 나누는 지 모르겠어요!
'종이의 ' 처럼 공백을 넣으면 정확히 종이 의 로 분해합니다. 공백으로 넣으면 문맥을 더 잘 이해하는건지 정확한건 공식 깃허브나 소스, 문서등을 참고해봐야할 것 같아요
진짜 왜이러는지 모름... 공백넣으면 왜 더 잘되는지 테스트하다가 '종이의' 까지 쳤을땐 잘못나오다가 '종이의 ' 치니깐 잘나와서 일단 임시방편으로 두었습니다.
다른 케이스들도 테스트 가능하신분들 해주세요 PR 바로 merge안하고 브랜치에서 먼저 테스트하셔도 됩니다. 아니면 코드부분만 긁어서 local에서 추가하셔서 테스트해보세요!