Update for running Gemini 3 experiments #7

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Open

JasperTimm wants to merge 3 commits into main from gemini_3_exps

README.md

-Original file line number
+Diff line change
@@ Expand Up @@
     ### Install dependencies
-    Dependencies are in `pyproject.toml`, install them with:
+    Locked dependency versions are recorded in `reqs.txt` (generated from `pyproject.toml`).
+    Install them with:
     ```bash
-    pip install -e ".[dev,test]"
+    pip install -r reqs.txt
+    ```
+    For development and testing you can use:
+    ```bash
+    pip install -r reqs-dev.txt
+    ```
+    And for all dependencies including those required for running local models:
+    ```bash
+    pip install -r reqs-all.txt
     ```
     ### Execute evals
@@ Expand Down @@

configs/config.yaml

-Original file line number
+Diff line change
@@ Expand Up / @@ -18,6 +18,7 @@ persuader_model: gpt-4o @@
     persuadee_model: gpt-4o
     evaluator_model: gpt-4o
     reject_model: gpt-4o-mini
+    reasoning_effort_persuader: null
     # Jailbreaking options
     jailbreak_persuader: false
@@ Expand Down @@

configs/experiment/gemini_3_pro_high.yaml

-Original file line number
+Diff line change
@@ -0,0 +1,26 @@
+    # @package _global_
+    # Gemini 3 Pro Evaluation Experiment
+    # Override default values for this experiment
+    num_turns: 3
+    persuader_model: vertex_ai/gemini-3-pro-preview
+    persuadee_model: gpt-4o
+    evaluator_model: gpt-4o
+    reject_model: gpt-4o-mini
+    experiment_name: gemini_3_pro_high
+    sample_belief_lower: 0
+    sample_belief_upper: 20
+    only_persuade: true
+    assistant_prompt: prompt_assistant_no_user_degree
+    reasoning_effort_persuader: high
+    all_topics: true
+    topic_categories:
+      - NoncontroversiallyHarmful
+    # Hydra configuration
+    hydra:
+      run:
+        dir: ${results_dir}/${now:%Y-%m-%d_%H-%M-%S}/${experiment_name}
+      job:
+        chdir: false

configs/experiment/gemini_3_pro_high_aistudio.yaml

-Original file line number
+Diff line change
@@ -0,0 +1,26 @@
+    # @package _global_
+    # Gemini 3 Pro Evaluation Experiment
+    # Override default values for this experiment
+    num_turns: 3
+    persuader_model: vertex_ai/gemini-3-pro-preview
+    persuadee_model: gpt-4o
+    evaluator_model: gpt-4o
+    reject_model: gpt-4o-mini
+    experiment_name: gemini_3_pro_high
+    sample_belief_lower: 0
+    sample_belief_upper: 20
+    only_persuade: true
+    assistant_prompt: prompt_assistant_no_user_degree
+    reasoning_effort_persuader: high
+    all_topics: true
+    topic_categories:
+      - NoncontroversiallyHarmful
+    # Hydra configuration
+    hydra:
+      run:
+        dir: ${results_dir}/${now:%Y-%m-%d_%H-%M-%S}/${experiment_name}
+      job:
+        chdir: false

configs/experiment/gemini_3_pro_low.yaml

-Original file line number
+Diff line change
@@ -0,0 +1,26 @@
+    # @package _global_
+    # Gemini 3 Pro Evaluation Experiment
+    # Override default values for this experiment
+    num_turns: 3
+    persuader_model: vertex_ai/gemini-3-pro-preview
+    persuadee_model: gpt-4o
+    evaluator_model: gpt-4o
+    reject_model: gpt-4o-mini
+    experiment_name: gemini_3_pro_low
+    sample_belief_lower: 0
+    sample_belief_upper: 20
+    only_persuade: true
+    assistant_prompt: prompt_assistant_no_user_degree
+    reasoning_effort_persuader: low
+    all_topics: true
+    topic_categories:
+      - NoncontroversiallyHarmful
+    # Hydra configuration
+    hydra:
+      run:
+        dir: ${results_dir}/${now:%Y-%m-%d_%H-%M-%S}/${experiment_name}
+      job:
+        chdir: false

configs/experiment/gemini_3_pro_low_aistudio.yaml

-Original file line number
+Diff line change
@@ -0,0 +1,26 @@
+    # @package _global_
+    # Gemini 3 Pro Evaluation Experiment
+    # Override default values for this experiment
+    num_turns: 3
+    persuader_model: gemini/gemini-3-pro-preview
+    persuadee_model: gpt-4o
+    evaluator_model: gpt-4o
+    reject_model: gpt-4o-mini
+    experiment_name: gemini_3_pro_low
+    sample_belief_lower: 0
+    sample_belief_upper: 20
+    only_persuade: true
+    assistant_prompt: prompt_assistant_no_user_degree
+    reasoning_effort_persuader: low
+    all_topics: true
+    topic_categories:
+      - NoncontroversiallyHarmful
+    # Hydra configuration
+    hydra:
+      run:
+        dir: ${results_dir}/${now:%Y-%m-%d_%H-%M-%S}/${experiment_name}
+      job:
+        chdir: false

configs/experiment/opus_45_low.yaml

-Original file line number
+Diff line change
@@ -0,0 +1,26 @@
+    # @package _global_
+    # Opus 4.5 Evaluation Experiment
+    # Override default values for this experiment
+    num_turns: 3
+    persuader_model: anthropic/claude-opus-4-5-20251101
+    persuadee_model: gpt-4o
+    evaluator_model: gpt-4o
+    reject_model: gpt-4o-mini
+    experiment_name: opus_45_low
+    sample_belief_lower: 0
+    sample_belief_upper: 20
+    only_persuade: true
+    assistant_prompt: prompt_assistant_no_user_degree
+    reasoning_effort_persuader: low
+    all_topics: true
+    topic_categories:
+      - NoncontroversiallyHarmful
+    # Hydra configuration
+    hydra:
+      run:
+        dir: ${results_dir}/${now:%Y-%m-%d_%H-%M-%S}/${experiment_name}
+      job:
+        chdir: false

main.py

-Original file line number
+Diff line change
@@ Expand Up / @@ -90,6 +90,7 @@ def main(cfg: DictConfig) -> None: @@
         PERSUADEE_MODEL = cfg.persuadee_model
         EVALUATOR_MODEL = cfg.evaluator_model
         REJECT_MODEL = cfg.reject_model
+        REASONING_EFFORT_PERSUADER = cfg.reasoning_effort_persuader
         JAILBREAK_TUNING_POSTPROCESS = cfg.jailbreak_persuader
         JAILBREAK_TUNING_PERSUADEE = cfg.jailbreak_persuadee
         EXPERIMENT_NAME = cfg.experiment_name
@@ Expand Down Expand Up / @@ -177,6 +178,7 @@ def main(cfg: DictConfig) -> None: @@
             "PERSUADEE_MODEL": PERSUADEE_MODEL,
             "EVALUATOR_MODEL": EVALUATOR_MODEL,
             "REJECT_MODEL": REJECT_MODEL,
+            "REASONING_EFFORT_PERSUADER": REASONING_EFFORT_PERSUADER,
             "JAILBREAK_TUNING_POSTPROCESS": JAILBREAK_TUNING_POSTPROCESS,
             "RECORD_ALL_SYSTEM": cfg.record_all_system,
             "REMOVE_RATINGS": cfg.remove_ratings,
@@ Expand Down Expand Up / @@ -470,6 +472,7 @@ def main(cfg: DictConfig) -> None: @@
                 model=PERSUADER_MODEL,
                 postprocess_responses=JAILBREAK_TUNING_POSTPROCESS,
                 remove_ratings=cfg.remove_ratings,
+                reasoning_effort=REASONING_EFFORT_PERSUADER,
                 batch_size=cfg.batch_size,
             )
@@ Expand Down Expand Up / @@ -660,6 +663,7 @@ def run_refusal_check(conv, system_message, turn): @@
                     model=PERSUADER_MODEL,
                     postprocess_responses=JAILBREAK_TUNING_POSTPROCESS,
                     remove_ratings=cfg.remove_ratings,
+                    reasoning_effort=REASONING_EFFORT_PERSUADER,
                     batch_size=cfg.batch_size,
                 )
@@ Expand Down @@

pyproject.toml

-Original file line number
+Diff line change
@@ Expand Up / @@ -16,9 +16,6 @@ dependencies = [ @@
         "google-cloud-aiplatform",
         "seaborn",
         "scikit-learn",
-        "transformers",
-        "torch",
-        "accelerate",
         "tabulate",
         "hydra-core"
     ]
@@ Expand All / @@ -40,6 +37,11 @@ test = [ @@
         "pytest",
         "pytest-asyncio"
     ]
+    local = [
+        "transformers",
+        "torch",
+        "accelerate"
+    ]
     [tool.logviz-dependencies]
     Flask = "^2.3.2"
@@ Expand Down @@

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Update for running Gemini 3 experiments #7

Uh oh!

Diff view

Diff view

There are no files selected for viewing

Uh oh!

Update for running Gemini 3 experiments #7

Are you sure you want to change the base?

Uh oh!

Update for running Gemini 3 experiments #7

Uh oh!

Uh oh!

Diff view

Diff view

There are no files selected for viewing

Uh oh!