Skip to content

Hỏi cách huấn luyện trên tập dữ liệu tùy chỉnh #99

@leviethung2103

Description

@leviethung2103

Cho mình hỏi là: Mình có 1 tập dữ liệu viết tay tầm 1300 hình. Mỗi hình là 1 chữ viết tay tiếng Nhật Kanji.

Mình muốn train model OCR cho tập dữ liệu này thì mình nên chỉnh sửa như thế nào ?

Hiện tại thì mình có làm như sau:

  1. Chuẩn bị dataset để train, valid
  2. Sửa đổi config->vocab: thay bằng từ tiếng Nhật có tập dataset

Không rõ mình có cần phải sửa đổi model không nhỉ ? Hiện tại default mình thấy đang dùng VGG19 làm backbone.

Hiện tại mình đang theo hướng fine tune từ pre-tranined model. Đây là config của mình
CleanShot 2023-05-05 at 23 08 31

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions