안녕하세요 위메프 W마인드실 오원석이라고 합니다.
우선 소중한 노하우를 논문으로 공유해주신 것에 감사드립니다.
올려주신 논문 잘 보고 구현해보고 있습니다.
셰도코드 부분을 보면
결국 예를들어 5 유저의 각각 1래팅 씩을 쎄타2의 다섯가지 업데이트가 존재하며
결국 5가지 쎄타2에 대한 쎄타1의 그레디언트를 동시에 적용한 후
쎄타2는 다시 로컬업데이트때 적용했던 그레디언트를 전부 합쳐서 하이퍼파라미터베타 곱해서 업데이트 하는 것이 맞나요?
결국 배치하나가 5유저라면 레이팅5개가 피드되어 로컬 5번, 글로벌1번 업데이트 되는 게 맞는지요?
그리고 유저별로 레이팅 갯수가 너무 차이나면 바이어스가 문제되어 갯수도 맞춰줘야 하는 것이 맞겠죠?
while not converge 라는 부분도 결국 레이팅 갯수를 어느 정도 맞춘 상태에서 배치별 밸리데이션 셋 (ex - 5유저에 대한 각각 20래이팅 ) 의 loss가 일정 이상 줄어드는 것으로 보면 될까요? 아니면 전체 레이팅에서의 밸리데이션 셋을 정의해야 할까요.
답변 기다리겠습니다.