Skip to content

유저 배치 쌤플한다는 것은 여러유저를 묶어서 동시에 한 rating씩 학습한다는 것인가요? #5

@alanpurple

Description

@alanpurple

안녕하세요 위메프 W마인드실 오원석이라고 합니다.

우선 소중한 노하우를 논문으로 공유해주신 것에 감사드립니다.

올려주신 논문 잘 보고 구현해보고 있습니다.

셰도코드 부분을 보면

결국 예를들어 5 유저의 각각 1래팅 씩을 쎄타2의 다섯가지 업데이트가 존재하며

결국 5가지 쎄타2에 대한 쎄타1의 그레디언트를 동시에 적용한 후

쎄타2는 다시 로컬업데이트때 적용했던 그레디언트를 전부 합쳐서 하이퍼파라미터베타 곱해서 업데이트 하는 것이 맞나요?

결국 배치하나가 5유저라면 레이팅5개가 피드되어 로컬 5번, 글로벌1번 업데이트 되는 게 맞는지요?

그리고 유저별로 레이팅 갯수가 너무 차이나면 바이어스가 문제되어 갯수도 맞춰줘야 하는 것이 맞겠죠?

while not converge 라는 부분도 결국 레이팅 갯수를 어느 정도 맞춘 상태에서 배치별 밸리데이션 셋 (ex - 5유저에 대한 각각 20래이팅 ) 의 loss가 일정 이상 줄어드는 것으로 보면 될까요? 아니면 전체 레이팅에서의 밸리데이션 셋을 정의해야 할까요.

답변 기다리겠습니다.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions