Этот датасет предназначен для задач автоматического тифлокомментирования и содержит:
- Более 200 произведений искусства;
- Для каждой картины представлены тифлокомментарии в двух форматах:
- Полная версия (развёрнутое описание);
- Краткая версия (сжатое описание).
Дополнительно для каждой картины указаны:
- Автор;
- Название;
- Жанр;
- Художественный стиль;
- Преобладающие цвета;
- Передаваемые эмоции.
- Основные элементы на картинах размечены при помощи bounding box (прямоугольные рамки) и снабжены краткими описаниями.
- ⚠ Позднее было осознано, что было бы точнее использовать полигоны для разметки, а не прямоугольники, но на момент создания датасета изменения внести уже было сложно.
- Справочник по художественным стилям и жанрам — объяснения на простом, понятном языке.
- Палитра цветов — набор базовых цветов и их оттенков (они описаны через ощущения, запахи, тактильные ассоциации и эмоции, которые могут вызывать).
Из-за ограничений по размеру файлы изображений размещены на внешних хостингах.
🔗 Скачать полный архив изображений с OneDrive
Целью создания датасета является поддержка исследований и разработок в области инклюзивных технологий, визуального описания для незрячих и слабовидящих людей, а также обучение моделей генерации интерпретативных описаний визуального искусства.
Все материалы в этом датасете собраны исключительно из открытых источников.
- Изображения произведений искусства получены из публичных коллекций, находящихся в открытом доступе.
- Тифлокомментарии взяты с сайтов музеев и культурных учреждений, в рамках их инклюзивных проектов.
- Часть описаний была сгенерирована с помощью ИИ и отредактирована вручную для улучшения качества и доступности.
Данный датасет предназначен исключительно для исследовательских и образовательных целей. Если вы используете его в своих проектах или публикациях, пожалуйста, указывайте ссылку на этот репозиторий.
⚠ В случае нарушения авторских прав, пожалуйста, свяжитесь со мной, и соответствующие материалы будут немедленно удалены.