From d51eb79b341af13bd64c331b8e7cbf108f384399 Mon Sep 17 00:00:00 2001
From: HiranoMasaaki <lambda.groove@gmail.com>
Date: Wed, 4 Mar 2026 23:09:27 +0000
Subject: [PATCH 1/2] fix: merge consecutive system messages for OpenAI
 providers

OpenAI reasoning models (e.g., gpt-5-nano) don't handle multiple
consecutive system/developer messages well, producing empty responses.
This adds a provider-specific mergeConsecutiveSystemMessages transform
in LLMExecutor, following the existing filterReasoningPartsForProvider
pattern. Only applies to openai and azure-openai providers.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
---
 .changeset/merge-system-messages-openai.md |   5 +
 packages/runtime/src/llm/executor.test.ts  | 130 +++++++++++++++++++++
 packages/runtime/src/llm/executor.ts       |  71 ++++++++++-
 3 files changed, 203 insertions(+), 3 deletions(-)
 create mode 100644 .changeset/merge-system-messages-openai.md

diff --git a/.changeset/merge-system-messages-openai.md b/.changeset/merge-system-messages-openai.md
new file mode 100644
index 00000000..13befc62
--- /dev/null
+++ b/.changeset/merge-system-messages-openai.md
@@ -0,0 +1,5 @@
+---
+"@perstack/runtime": patch
+---
+
+Merge consecutive system messages for OpenAI/Azure OpenAI providers to prevent empty responses from reasoning models
diff --git a/packages/runtime/src/llm/executor.test.ts b/packages/runtime/src/llm/executor.test.ts
index 762bac2c..e1bdca02 100644
--- a/packages/runtime/src/llm/executor.test.ts
+++ b/packages/runtime/src/llm/executor.test.ts
@@ -660,4 +660,134 @@ describe("LLMExecutor", () => {
       }
     })
   })
+
+  describe("system message merging", () => {
+    it("merges consecutive system messages for OpenAI provider", async () => {
+      mockGenerateText.mockResolvedValue({ finishReason: "stop" } as never)
+
+      const adapter = createMockAdapter({ providerName: "openai" as ProviderName })
+      const model = createMockModel()
+      const executor = new LLMExecutor(adapter, model)
+
+      await executor.generateText({
+        messages: [
+          { role: "system" as const, content: "System part 1" },
+          { role: "system" as const, content: "System part 2" },
+          { role: "system" as const, content: "System part 3" },
+          { role: "user" as const, content: "Hello" },
+        ],
+        maxRetries: 3,
+        tools: {},
+      })
+
+      const callArgs = mockGenerateText.mock.calls[0][0]
+      expect(callArgs.messages).toEqual([
+        { role: "system", content: "System part 1\n\nSystem part 2\n\nSystem part 3", providerOptions: undefined },
+        { role: "user", content: "Hello" },
+      ])
+    })
+
+    it("preserves providerOptions from last system message in group", async () => {
+      mockGenerateText.mockResolvedValue({ finishReason: "stop" } as never)
+
+      const adapter = createMockAdapter({ providerName: "openai" as ProviderName })
+      const model = createMockModel()
+      const executor = new LLMExecutor(adapter, model)
+
+      await executor.generateText({
+        messages: [
+          { role: "system" as const, content: "Part 1" },
+          {
+            role: "system" as const,
+            content: "Part 2",
+            providerOptions: { anthropic: { cacheControl: { type: "ephemeral" } } },
+          },
+          { role: "user" as const, content: "Hello" },
+        ],
+        maxRetries: 3,
+        tools: {},
+      })
+
+      const callArgs = mockGenerateText.mock.calls[0][0]
+      expect(callArgs.messages[0]).toEqual({
+        role: "system",
+        content: "Part 1\n\nPart 2",
+        providerOptions: { anthropic: { cacheControl: { type: "ephemeral" } } },
+      })
+    })
+
+    it("does not merge system messages for Anthropic provider", async () => {
+      mockGenerateText.mockResolvedValue({ finishReason: "stop" } as never)
+
+      const adapter = createMockAdapter({ providerName: "anthropic" as ProviderName })
+      const model = createMockModel()
+      const executor = new LLMExecutor(adapter, model)
+
+      await executor.generateText({
+        messages: [
+          { role: "system" as const, content: "System part 1" },
+          { role: "system" as const, content: "System part 2" },
+          { role: "user" as const, content: "Hello" },
+        ],
+        maxRetries: 3,
+        tools: {},
+      })
+
+      const callArgs = mockGenerateText.mock.calls[0][0]
+      expect(callArgs.messages).toEqual([
+        { role: "system", content: "System part 1" },
+        { role: "system", content: "System part 2" },
+        { role: "user", content: "Hello" },
+      ])
+    })
+
+    it("passes through single system message unchanged for OpenAI", async () => {
+      mockGenerateText.mockResolvedValue({ finishReason: "stop" } as never)
+
+      const adapter = createMockAdapter({ providerName: "openai" as ProviderName })
+      const model = createMockModel()
+      const executor = new LLMExecutor(adapter, model)
+
+      const opts = { anthropic: { cacheControl: { type: "ephemeral" } } }
+      await executor.generateText({
+        messages: [
+          { role: "system" as const, content: "Only system", providerOptions: opts },
+          { role: "user" as const, content: "Hello" },
+        ],
+        maxRetries: 3,
+        tools: {},
+      })
+
+      const callArgs = mockGenerateText.mock.calls[0][0]
+      expect(callArgs.messages[0]).toEqual({
+        role: "system",
+        content: "Only system",
+        providerOptions: opts,
+      })
+    })
+
+    it("merges system messages for Azure OpenAI provider", async () => {
+      mockGenerateText.mockResolvedValue({ finishReason: "stop" } as never)
+
+      const adapter = createMockAdapter({ providerName: "azure-openai" as ProviderName })
+      const model = createMockModel()
+      const executor = new LLMExecutor(adapter, model)
+
+      await executor.generateText({
+        messages: [
+          { role: "system" as const, content: "Part A" },
+          { role: "system" as const, content: "Part B" },
+          { role: "user" as const, content: "Hello" },
+        ],
+        maxRetries: 3,
+        tools: {},
+      })
+
+      const callArgs = mockGenerateText.mock.calls[0][0]
+      expect(callArgs.messages).toEqual([
+        { role: "system", content: "Part A\n\nPart B", providerOptions: undefined },
+        { role: "user", content: "Hello" },
+      ])
+    })
+  })
 })
diff --git a/packages/runtime/src/llm/executor.ts b/packages/runtime/src/llm/executor.ts
index 9ff2d3e4..b8507f65 100644
--- a/packages/runtime/src/llm/executor.ts
+++ b/packages/runtime/src/llm/executor.ts
@@ -26,6 +26,12 @@ const PROVIDERS_WITHOUT_REASONING_HISTORY: ProviderName[] = [
   "ollama",
 ]
 
+/** Providers that don't handle multiple consecutive system messages well */
+const PROVIDERS_REQUIRING_MERGED_SYSTEM_MESSAGES: ProviderName[] = [
+  "openai",
+  "azure-openai",
+]
+
 /**
  * Filter out reasoning parts from messages for providers that don't support them.
  * This prevents "Non-OpenAI reasoning parts are not supported" warnings from AI SDK.
@@ -55,6 +61,56 @@ function filterReasoningPartsForProvider(
   })
 }
 
+/**
+ * Merge consecutive system messages into a single message for providers that
+ * don't support multiple system/developer messages (e.g., OpenAI reasoning models).
+ * Preserves providerOptions from the last message in each group.
+ */
+function mergeConsecutiveSystemMessages(
+  messages: ModelMessage[],
+  providerName: ProviderName,
+): ModelMessage[] {
+  if (!PROVIDERS_REQUIRING_MERGED_SYSTEM_MESSAGES.includes(providerName)) {
+    return messages
+  }
+  const result: ModelMessage[] = []
+  let systemGroup: { content: string; providerOptions?: ModelMessage["providerOptions"] }[] = []
+
+  const flushSystemGroup = () => {
+    if (systemGroup.length === 0) return
+    if (systemGroup.length === 1) {
+      result.push({
+        role: "system" as const,
+        content: systemGroup[0].content,
+        providerOptions: systemGroup[0].providerOptions,
+      })
+    } else {
+      const lastOptions = systemGroup[systemGroup.length - 1].providerOptions
+      result.push({
+        role: "system" as const,
+        content: systemGroup.map((m) => m.content).join("\n\n"),
+        providerOptions: lastOptions,
+      })
+    }
+    systemGroup = []
+  }
+
+  for (const message of messages) {
+    if (message.role === "system") {
+      systemGroup.push({
+        content: message.content as string,
+        providerOptions: message.providerOptions,
+      })
+    } else {
+      flushSystemGroup()
+      result.push(message)
+    }
+  }
+  flushSystemGroup()
+
+  return result
+}
+
 export class LLMExecutor {
   constructor(
     private readonly adapter: ProviderAdapter,
@@ -73,7 +129,10 @@ export class LLMExecutor {
         ? this.adapter.getReasoningOptions(params.reasoningBudget)
         : undefined
     const providerOptions = this.mergeProviderOptions(baseProviderOptions, reasoningOptions)
-    const messages = filterReasoningPartsForProvider(params.messages, this.adapter.providerName)
+    const messages = mergeConsecutiveSystemMessages(
+      filterReasoningPartsForProvider(params.messages, this.adapter.providerName),
+      this.adapter.providerName,
+    )
 
     try {
       const result = await generateText({
@@ -123,7 +182,10 @@ export class LLMExecutor {
         ? this.adapter.getReasoningOptions(params.reasoningBudget)
         : undefined
     const providerOptions = this.mergeProviderOptions(baseProviderOptions, reasoningOptions)
-    const messages = filterReasoningPartsForProvider(params.messages, this.adapter.providerName)
+    const messages = mergeConsecutiveSystemMessages(
+      filterReasoningPartsForProvider(params.messages, this.adapter.providerName),
+      this.adapter.providerName,
+    )
 
     try {
       const result = await generateText({
@@ -159,7 +221,10 @@ export class LLMExecutor {
         ? this.adapter.getReasoningOptions(params.reasoningBudget)
         : undefined
     const providerOptions = this.mergeProviderOptions(baseProviderOptions, reasoningOptions)
-    const messages = filterReasoningPartsForProvider(params.messages, this.adapter.providerName)
+    const messages = mergeConsecutiveSystemMessages(
+      filterReasoningPartsForProvider(params.messages, this.adapter.providerName),
+      this.adapter.providerName,
+    )
 
     const streamResult = streamText({
       model: this.model,

From 73bef6f6c59dee390bd388e432ba07bae9a69f8c Mon Sep 17 00:00:00 2001
From: HiranoMasaaki <lambda.groove@gmail.com>
Date: Wed, 4 Mar 2026 23:10:31 +0000
Subject: [PATCH 2/2] style: fix formatting

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
---
 packages/runtime/src/llm/executor.test.ts | 6 +++++-
 packages/runtime/src/llm/executor.ts      | 5 +----
 2 files changed, 6 insertions(+), 5 deletions(-)

diff --git a/packages/runtime/src/llm/executor.test.ts b/packages/runtime/src/llm/executor.test.ts
index e1bdca02..ee8e260e 100644
--- a/packages/runtime/src/llm/executor.test.ts
+++ b/packages/runtime/src/llm/executor.test.ts
@@ -682,7 +682,11 @@ describe("LLMExecutor", () => {
 
       const callArgs = mockGenerateText.mock.calls[0][0]
       expect(callArgs.messages).toEqual([
-        { role: "system", content: "System part 1\n\nSystem part 2\n\nSystem part 3", providerOptions: undefined },
+        {
+          role: "system",
+          content: "System part 1\n\nSystem part 2\n\nSystem part 3",
+          providerOptions: undefined,
+        },
         { role: "user", content: "Hello" },
       ])
     })
diff --git a/packages/runtime/src/llm/executor.ts b/packages/runtime/src/llm/executor.ts
index b8507f65..3fb6795f 100644
--- a/packages/runtime/src/llm/executor.ts
+++ b/packages/runtime/src/llm/executor.ts
@@ -27,10 +27,7 @@ const PROVIDERS_WITHOUT_REASONING_HISTORY: ProviderName[] = [
 ]
 
 /** Providers that don't handle multiple consecutive system messages well */
-const PROVIDERS_REQUIRING_MERGED_SYSTEM_MESSAGES: ProviderName[] = [
-  "openai",
-  "azure-openai",
-]
+const PROVIDERS_REQUIRING_MERGED_SYSTEM_MESSAGES: ProviderName[] = ["openai", "azure-openai"]
 
 /**
  * Filter out reasoning parts from messages for providers that don't support them.