allenai · IanMagnusson · Aug 25, 2022 · Aug 26, 2022 · Aug 30, 2022 · Aug 30, 2022
diff --git a/CHANGELOG.md b/CHANGELOG.md
@@ -23,14 +23,14 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0
 - Adds a new MetaICLTask that supports all evaluation tasks in that benchmark
 - Adds a new MetaICLModel that replicates the formatting and truncation used by MetaICL for few shot evaluation
 - An option for rank classification to average log likelihoods by token length
-- Adds support for inference with IA3 adaptors loaded from a file on decoder only ranked classification models
+- Adds support for inference with IA3 adapters loaded from a file on decoder only ranked classification models
 - Add support for MetaICL's race-high and numer_sense tasks
 - Adds QA task support for autoregressive (previously only available with Eleuther task format)
 - Adds QA task support for T5 models
 - Optional `random_subsample_seed` for PredictStep
 - An option for rank classification to average log likelihoods by token length
 - Added MRQA task
-- Adds support for inference with IA3 adapters loaded from a file on decoder only ranked classification models
+- Adds an example experiment that uses IA3 adapters from Tango with catwalk training
 - Added the ability to train `HFAutoModel`
 - Adds ability to backoff to auto device_map on out of memory error for ranked classification models
 

diff --git a/catwalk/models/__init__.py b/catwalk/models/__init__.py
@@ -7,7 +7,6 @@
 from catwalk.models.rank_classification import EncoderDecoderRCModel, DecoderOnlyRCModel
 from catwalk.models.t5 import T5Model, T5ModelFromPretrained
 from catwalk.models.metaicl import MetaICLModel
-from catwalk.models.ia3 import IA3MetaICLModel
 
 _ENCODER_DECODER_MODELS = {
     "t5-small",
@@ -95,4 +94,4 @@ def _shorten_hf_name(hf_name: str) -> str:
     MODELS[name] = GPTModel(hf_name)
     MODELS[f"eai::{name}"] = EAIGPT(hf_name)
     MODELS[f"rc::{name}"] = DecoderOnlyRCModel(hf_name)
-    MODELS[f"metaicl::{name}"] = MetaICLModel(hf_name)
+    MODELS[f"metaicl::{name}"] = MetaICLModel(hf_name)
diff --git a/catwalk/models/ia3.py b/catwalk/models/ia3.py
diff --git a/experiments/ia3.py b/experiments/ia3.py
@@ -0,0 +1,107 @@
+
+import argparse
+
+from tango import Workspace
+from tango.common.logging import initialize_logging
+from tango.integrations.transformers.ia3 import modify_with_ia3
+
+from catwalk import cached_transformers
+from catwalk.models.rank_classification import DecoderOnlyRCModel
+from catwalk.steps import TabulateMetricsStep, FinetuneStep
+from catwalk.tasks import TASK_SETS
+
+import torch
+
+from transformers import AutoModelForCausalLM, GPT2LMHeadModel
+
+
+class DecoderOnlyIA3Mixin:
+    @classmethod
+    def _make_model(self, pretrained_model_name_or_path: str, *, ia3_weights_file: str = None, make_copy: bool = True, **kwargs) -> GPT2LMHeadModel:
+        model = cached_transformers.get(AutoModelForCausalLM, pretrained_model_name_or_path, make_copy=make_copy, **kwargs)
+        model = modify_with_ia3(model)
+        if ia3_weights_file is not None:
+            state_dict = torch.load(ia3_weights_file)
+            model.load_state_dict(state_dict, strict=False)
+
+        return model
+
+
+class IA3DecoderOnlyRCModel(DecoderOnlyIA3Mixin, DecoderOnlyRCModel):
+    def __init__(
+        self,
+        pretrained_model_name_or_path: str,
+        *,
+        likelihood_averaging: str = 'char',
+        ia3_weights_file: str = None,
+        **model_kwargs
+    ):
+        super().__init__(
+            pretrained_model_name_or_path,
+            likelihood_averaging=likelihood_averaging,
+            ia3_weights_file=ia3_weights_file,
+            **model_kwargs
+        )
+
+
+def main():
+    initialize_logging()
+
+    parser = argparse.ArgumentParser()
+    parser.add_argument("--model", type=str, required=True)
+    parser.add_argument("--task", type=str, nargs="+")
+    parser.add_argument("--batch_size", type=int, default=16)
+    parser.add_argument("--grad_acc", type=int, default=1)
+    parser.add_argument("--device_count", type=int, default=1)
+    parser.add_argument(
+        "-d",
+        "-w",
+        type=str,
+        default=None,
+        metavar="workspace",
+        dest="workspace",
+        help="the Tango workspace with the cache",
+    )
+    args = parser.parse_args()
+
+    assert args.model in MODEL_NAME_TO_CONFIG, f'no default IA3 config for {args.model}'
+    model = IA3DecoderOnlyRCModel(args.model)
+
+    if args.workspace is None:
+        workspace = None
+    else:
+        workspace = Workspace.from_url(args.workspace)
+
+    from catwalk.steps import CalculateMetricsStep
+    from catwalk.steps import PredictStep
+
+    tasks = set()
+    for task in args.task:
+        try:
+            tasks |= TASK_SETS[task]
+        except KeyError:
+            tasks.add(task)
+
+    model_step = FinetuneStep(
+            model=model,
+            tasks=tasks,
+            batch_size=args.batch_size,
+            grad_accum=args.grad_acc,
+            device_count=args.device_count
+        )
+
+    metric_task_dict = {}
+    for task in tasks:
+        predictions = PredictStep(model=model_step, task=task, batch_size=args.batch_size)
+        metrics = CalculateMetricsStep(
+            model=model_step, task=task, predictions=predictions
+        )
+        metric_task_dict[task] = metrics
+
+    table_step = TabulateMetricsStep(metrics=metric_task_dict)
+    table_step_result = table_step.result(workspace)
+    print("\n".join(table_step_result))
+
+
+if __name__ == "__main__":
+    main()