Skip to content

每个环境都有不同的随训练变化的action_space该如何解决? #28

@lszsnmlmzsby

Description

@lszsnmlmzsby

如题,每个环境中的action_space都随训练更新,但env_wrapper中的解决方式是只使用第一个环境的第一个时间步的action_space,完全不进行任何更新

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions