MMTL-UniAD: A Unified Framework for Multimodal and Multi-Task Learning in Assistive Driving Perception

简介 | Introduction

Advanced driver assistance systems require a comprehensive understanding of the driver’s mental/physical state and traffic context but existing works often neglect the potential benefits of joint learning between these tasks. This paper proposes MMTL-UniAD, a unified multi-modal multitask learning framework that simultaneously recognizes driver behavior (e.g., looking around, talking), driver emotion (e.g., anxiety, happiness), vehicle behavior (e.g., parking, turning), and traffic context (e.g., traffic jam, traffic smooth).

环境搭建 | Environment Setup

系统要求 | System Requirements

Python 3.7+
CUDA 11.0+ (用于GPU加速 | for GPU acceleration)
24GB+ RAM

安装步骤 | Installation Steps

克隆仓库 | Clone the repository

git clone https://github.com/Wenzhuo-Liu/MMTL-UniAD.git

创建虚拟环境 | Create a virtual environment

conda create -n MMTL python=3.8
conda activate MMTL

安装依赖 | Install dependencies

pip install -r requirements.txt

数据预处理 | Data Preprocessing

本项目使用AIDE数据集，需要进行预处理以提取面部和身体区域。

This project uses the AIDE dataset, which needs preprocessing to extract facial and body regions.

使用Crop.py进行预处理 | Using Crop.py for Preprocessing

Crop.py脚本用于从原始图像中提取面部和身体区域：

The Crop.py script is used to extract facial and body regions from the original images:

# 运行Crop.py脚本
python Crop.py

该脚本会：

读取原始图像和对应的注释文件
提取面部和身体区域
将提取的图像保存到相应的目录中

The script will:

Read the original images and corresponding annotation files
Extract facial and body regions
Save the extracted images to the appropriate directories

使用方法 | Usage

运行模型 | Running the Model

使用 run.py 脚本来训练或测试模型。该脚本支持两种模式：训练模式和测试模式。

Use the run.py script to train or test the model. The script supports two modes: training mode and testing mode.

# 修改 run.py 中的模式参数
# Modify the mode parameter in run.py
mode = "train"  # 训练模式 | Training mode
# mode = "test"  # 测试模式 | Testing mode

# 然后运行脚本
# Then run the script
python run.py

模型架构 | Model Architecture

模型可以同时处理多种输入：

车内视角图像
前方视角图像
左侧视角图像
右侧视角图像
面部图像
身体图像
姿态骨骼关键点
手势骨骼关键点

项目结构 | Project Structure

TEM3-Learning/
├── run.py                    # 主运行脚本，支持训练和测试模式
├── Crop.py                      # 数据预处理脚本，用于提取面部和身体区域
├── training.csv                 # 训练数据索引
├── validation.csv               # 验证数据索引
├── testing.csv                  # 测试数据索引
├── Logs/                        # 日志和模型保存目录
├── requirements.txt             # 项目依赖
└── README.md                    # 项目说明

联系方式 | Contact

如有任何问题，请通过以下方式联系我们：

电子邮件：wzliu@bit.edu.cn; yichengqiao21@gmail.com

For any questions, please contact us at:

Email: wzliu@bit.edu.cn; yichengqiao21@gmail.com

作者 | Authors

Wenzhuo Liu¹
Wenshuo Wang¹,∗
Yicheng Qiao²
Qiannan Guo²
Jiayin Zhu³
Pengfei Li²
Zilong Chen²
Huiming Yang²
Zhiwei Li⁴
Lening Wang⁵
Tiao Tan²
Huaping Liu²

¹²³⁴⁵ 代表不同的机构隶属关系 | Representing different institutional affiliations

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MMTL-UniAD: A Unified Framework for Multimodal and Multi-Task Learning in Assistive Driving Perception

简介 | Introduction

环境搭建 | Environment Setup

系统要求 | System Requirements

安装步骤 | Installation Steps

数据预处理 | Data Preprocessing

使用Crop.py进行预处理 | Using Crop.py for Preprocessing

使用方法 | Usage

运行模型 | Running the Model

模型架构 | Model Architecture

项目结构 | Project Structure

联系方式 | Contact

作者 | Authors

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
Attention.py		Attention.py
Crop.py		Crop.py
Fusion.py		Fusion.py
README.md		README.md
framework.jpg		framework.jpg
requirements.txt		requirements.txt
run.py		run.py
speedtest.py		speedtest.py
testing.csv		testing.csv
training.csv		training.csv
validation.csv		validation.csv

Folders and files

Latest commit

History

Repository files navigation

MMTL-UniAD: A Unified Framework for Multimodal and Multi-Task Learning in Assistive Driving Perception

简介 | Introduction

环境搭建 | Environment Setup

系统要求 | System Requirements

安装步骤 | Installation Steps

数据预处理 | Data Preprocessing

使用Crop.py进行预处理 | Using Crop.py for Preprocessing

使用方法 | Usage

运行模型 | Running the Model

模型架构 | Model Architecture

项目结构 | Project Structure

联系方式 | Contact

作者 | Authors

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages