Skip to content

Bro,还请指教。 #7

@cheafon

Description

@cheafon
Image 我在6个问题,10个epoch的测试集上不断的去监控与ground truth的similarity,得到了这个图表,我不是很理解它为什么会波动如此。

比如用绿色折线代表的问题举例,按我的直觉,在第五个epoch出现了急速下降,那么第六个epoch会反思到这个版本的playbook是不好的,则会通过这个惩罚因子修正走向。换句话说,我觉得这些曲线应该是不断收敛的呀。

为什么好像它并未察觉,导致相似度越来越低呢?还是说我去评估这个系统应该用均值来评估?

另外有没有办法去让某个问题的最佳playbook版本有所保留,类似于针对性的保存最优权重。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions