Participatory Systems for Personalized Prediction

Quickstart

Setup

Install required packages pip install -r requirements.txt

Train a Participatory System

Load a Dataset

data_file_processed = get_processed_data_file(settings['data_name'], rebalancing_type=settings['rebalancing_type'])
data = BinaryClassificationDataset.load(file=data_file_processed)

Train a Set of Classifiers

generic_model = train_model(X=data.training.X, G=None, y=data.training.y, settings=settings,
                                normalize_variables=False)
                                
candidate_models = []
    for encoding_type in ['onehot', 'intersectional']:
        for name_subset in powerset(data.group_attributes.names, min_size=1):
            curr_settings['encoding_type'] = encoding_type
            G_name_subset = G_train[list(name_subset)]
            curr_settings['training_groups'] = data.group_encoder.groups
            h = train_sklearn_linear_model(X_train, G_name_subset, y_train,
                                           method_name=curr_settings['method_name'],
                                           settings=curr_settings, normalize_variables=False)

            candidate_models.append(h)

Fit a Participatory System

p_seq = SequentialSystem(data, generic_model, assignment_metric=settings['assignment_metric'],
                         assignment_sample=settings['assignment_sample'])
p_seq.update_assignments(candidate_models)

Reproduce Results

Dataset Processing

We provide raw data and processing code for:

apnea

We provide processing code only for:

cshock_eicu
cshock_eicu
cshockR_mimic
cshockR_mimic
lungcancer
saps
support

To process datasets, use the create_dataset.py script with dataset names separated with spaces.

python3 create_datasets.py --data-names [DATA_NAME]

where DATA_NAME is e.g., apnea

Experimental Results

Train and benchmark models with a variety of parameters and benchmark criteria.

python3 train_and_benchmark.py --data-name apnea --models sequential flat participatory_simple --table-type performance --assignment-metric auc

Aggregate results across datasets into CSVs using aggregate_results.py. This will produce file similar to aggregated_results.zip

Miscellaneous

Code Structure

├── data         # datasets and processing code       
├── psc          # source code                    
├── scripts      # scripts to run source code                                                       
└── results      # results files

Debugging

Error: ModuleNotFoundError: No module named 'psc' Try running export PYTHONPATH="${PYTHONPATH}:/psc/"`

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
data		data
psc		psc
scripts		scripts
.gitignore		.gitignore
README.md		README.md
aggregated_results.zip		aggregated_results.zip
manuscript.pdf		manuscript.pdf
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Participatory Systems for Personalized Prediction

Quickstart

Setup

Train a Participatory System

Load a Dataset

Train a Set of Classifiers

Fit a Participatory System

Reproduce Results

Dataset Processing

Experimental Results

Miscellaneous

Code Structure

Debugging

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Participatory Systems for Personalized Prediction

Quickstart

Setup

Train a Participatory System

Load a Dataset

Train a Set of Classifiers

Fit a Participatory System

Reproduce Results

Dataset Processing

Experimental Results

Miscellaneous

Code Structure

Debugging

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages