MetaTab

This is the official guide for the paper “Detecting Logic Errors in LM-Generated Programs for Tabular Data via Metamorphic Testing.”

Requirements

Python ≥ 3.10
Linux

Installation

Clone this repository and install the required dependencies:

pip install -r requirements.txt

Usage

1. Data Preparation

Extract the dataset:

unzip assets/data.zip -d path/to/data

2. Model Setup

Set up the tabular language models locally:

TableGPT: https://huggingface.co/tablegpt/TableGPT2-7B
TableLLM: https://huggingface.co/RUCKBReasoning/TableLLM-7b

3. Step-by-Step Example (TableGPT)

Intermediate Program Generation (Original)

python run_tablegpt_agent.py \
    --model tablegpt \
    --dataset wtq --sub_sample False \
    --perturbation none --use_full_table True \
    --disable_resort True --norm_cache True \
    --resume 0 --stop_at 1e6 --self_consistency 5 --temperature 0.8 \
    --log_dir output/wtq_agent --cache_dir cache/tablegpt

Intermediate Program Generation (Perturbed)

Permutation Metamorphic Relations (PMR)

PMR1: Shuffle

python run_tablegpt_agent.py \
    --model tablegpt \
    --dataset wtq --sub_sample False \
    --perturbation shuffle --use_full_table True \
    --disable_resort True --norm_cache True \
    --resume 0 --stop_at 1e6 --self_consistency 5 --temperature 0.8 \
    --log_dir output/wtq_agent --cache_dir cache/tablegpt

PMR2: Column Shuffle

python run_tablegpt_agent.py \
    --model tablegpt \
    --dataset wtq --sub_sample False \
    --perturbation column_shuffle --use_full_table True \
    --disable_resort True --norm_cache True \
    --resume 0 --stop_at 1e6 --self_consistency 5 --temperature 0.8 \
    --log_dir output/wtq_agent --cache_dir cache/tablegpt

PMR3: Transpose

python run_tablegpt_agent.py \
    --model tablegpt \
    --dataset wtq --sub_sample False \
    --perturbation transpose --use_full_table True \
    --disable_resort True --norm_cache True \
    --resume 0 --stop_at 1e6 --self_consistency 5 --temperature 0.8 \
    --log_dir output/wtq_agent --cache_dir cache/tablegpt

PMR4: Reconstruction

python run_reconstruction_tablegpt_agent.py \
    --model tablegpt \
    --dataset wtq --sub_sample False \
    --perturbation none --use_full_table True \
    --disable_resort True --norm_cache True \
    --resume 0 --stop_at 1e6 --self_consistency 5 --temperature 0.8 \
    --log_dir output/wtq_agent --cache_dir cache/tablegpt

Decomposition Metamorphic Relations (DMR)

DMR1

python run_tablegpt_agent_cut.py \
    --model tablegpt \
    --dataset wtq --sub_sample False \
    --perturbation none --use_full_table True \
    --disable_resort True --norm_cache True \
    --resume 0 --stop_at 1e6 --self_consistency 5 --temperature 0.8 \
    --log_dir output/wtq_agent --cache_dir cache/tablegpt

DMR2

python run_tablegpt_agent_c_cut.py \
    --model tablegpt \
    --dataset wtq --sub_sample False \
    --perturbation none --use_full_table True \
    --disable_resort True --norm_cache True \
    --resume 0 --stop_at 1e6 --self_consistency 5 --temperature 0.8 \
    --log_dir output/wtq_agent --cache_dir cache/tablegpt

Semantic Metamorphic Relations (SMR)

SMR1

python Symbolization_pure_numbers_to_words.py

SMR2

python Category_Anonymization.py

SMR3

python filter_time_series_table.py

After preprocessing, run:

python run_tablegpt_agent.py \
    --model tablegpt \
    --dataset wtq --sub_sample False \
    --perturbation none --use_full_table True \
    --disable_resort True --norm_cache True \
    --resume 0 --stop_at 1e6 --self_consistency 5 --temperature 0.8 \
    --log_dir output/wtq_agent --cache_dir cache/tablegpt

Evaluation

Error Rate

python evaluate_agent_all_type.py

Recall, Precision, F1 Score

python hhh_wtq.py

Environment

PyTorch

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
agent		agent
assets		assets
examples		examples
prompt		prompt
scripts		scripts
utils		utils
Category_Anonymization.py		Category_Anonymization.py
METATAB1.png		METATAB1.png
METATAB2.png		METATAB2.png
README.md		README.md
Symbolization_pure_numbers_to_words.py		Symbolization_pure_numbers_to_words.py
evaluate.py		evaluate.py
evaluate_agent_all_type.py		evaluate_agent_all_type.py
evaluate_robustness.py		evaluate_robustness.py
filter_time_series_table.py		filter_time_series_table.py
generate_tables.py		generate_tables.py
requirement.txt		requirement.txt
run_agent.py		run_agent.py
run_cot.py		run_cot.py
run_helper.py		run_helper.py
run_reconstruction_tablegpt_agent.py		run_reconstruction_tablegpt_agent.py
run_tableLLM_agent.py		run_tableLLM_agent.py
run_tablegpt_agent.py		run_tablegpt_agent.py
run_tablegpt_agent_2_table.py		run_tablegpt_agent_2_table.py
run_tablegpt_agent_2_table_tabfact.py		run_tablegpt_agent_2_table_tabfact.py
run_tablegpt_agent_adv_test.py		run_tablegpt_agent_adv_test.py
run_tablegpt_agent_c_cut.py		run_tablegpt_agent_c_cut.py
run_tablegpt_agent_cut.py		run_tablegpt_agent_cut.py
run_tablegpt_agent_cut_tabfact.py		run_tablegpt_agent_cut_tabfact.py
run_tablegpt_agent_wo_jiange.py		run_tablegpt_agent_wo_jiange.py
run_tablegpt_agent_wo_jiange_huanhang.py		run_tablegpt_agent_wo_jiange_huanhang.py
run_tablegpt_agent_wo_jiange_huanhang_kongge1.py		run_tablegpt_agent_wo_jiange_huanhang_kongge1.py
run_tablegpt_cot.py		run_tablegpt_cot.py
run_tablellama_agent.py		run_tablellama_agent.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MetaTab

Requirements

Installation

Usage

1. Data Preparation

2. Model Setup

3. Step-by-Step Example (TableGPT)

Intermediate Program Generation (Original)

Intermediate Program Generation (Perturbed)

Permutation Metamorphic Relations (PMR)

Decomposition Metamorphic Relations (DMR)

Semantic Metamorphic Relations (SMR)

Evaluation

Environment

About

Uh oh!

Releases

Packages

Languages

stbst1/MetaTab

Folders and files

Latest commit

History

Repository files navigation

MetaTab

Requirements

Installation

Usage

1. Data Preparation

2. Model Setup

3. Step-by-Step Example (TableGPT)

Intermediate Program Generation (Original)

Intermediate Program Generation (Perturbed)

Permutation Metamorphic Relations (PMR)

Decomposition Metamorphic Relations (DMR)

Semantic Metamorphic Relations (SMR)

Evaluation

Environment

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages