From a045f6223fd8ac813dfd65fd3e3d7bb076fec758 Mon Sep 17 00:00:00 2001
From: Chris0Jeky <jeky.tck@gmail.com>
Date: Sun, 29 Mar 2026 03:43:28 +0100
Subject: [PATCH 1/5] Add manual-audit.spec.ts for opt-in headed Playwright
 audit pack

Covers the core Home -> Inbox/Capture -> Review -> Board loop with
numbered screenshots at each milestone, plus advanced checks (command
palette, capture hotkey, board/filter lifecycle) and an opt-in live
LLM provider probe gated behind TASKDECK_RUN_LIVE_LLM_TESTS.
---
 .../tests/e2e/manual-audit.spec.ts            | 255 ++++++++++++++++++
 1 file changed, 255 insertions(+)
 create mode 100644 frontend/taskdeck-web/tests/e2e/manual-audit.spec.ts

diff --git a/frontend/taskdeck-web/tests/e2e/manual-audit.spec.ts b/frontend/taskdeck-web/tests/e2e/manual-audit.spec.ts
new file mode 100644
index 000000000..e74910215
--- /dev/null
+++ b/frontend/taskdeck-web/tests/e2e/manual-audit.spec.ts
@@ -0,0 +1,255 @@
+/**
+ * Manual audit pack — opt-in headed Playwright suite for operator-visible debugging.
+ *
+ * Covers the core Home -> Inbox/Capture -> Review -> Board loop with screenshots
+ * at each milestone, plus selected advanced checks (command palette, filter panel,
+ * board settings lifecycle).
+ *
+ * Usage:
+ *   npm run test:e2e:audit:headed
+ *
+ * Live-provider probes (optional):
+ *   TASKDECK_RUN_LIVE_LLM_TESTS=1 npm run test:e2e:audit:headed
+ *
+ * This pack is NOT part of required CI. It is intended for local operator audits,
+ * pre-release sanity checks, and visual debugging sessions.
+ */
+
+import { expect, test } from '@playwright/test'
+import { parseTrueishEnv } from '../../scripts/demo-shared.mjs'
+import { registerAndAttachSession, type AuthResult } from './support/authSession'
+import { createBoardWithColumn } from './support/boardHelpers'
+import {
+  createCaptureItem,
+  listBoardCards,
+  waitForCardWithTitle,
+  waitForProposalCreated,
+} from './support/captureFlow'
+
+test.use({
+  screenshot: 'on',
+  trace: 'retain-on-failure',
+  launchOptions: {
+    slowMo: 250,
+  },
+})
+
+let auth: AuthResult
+
+test.beforeEach(async ({ page, request }) => {
+  auth = await registerAndAttachSession(page, request, 'audit')
+})
+
+test.describe('Core loop: Home -> Inbox/Capture -> Review -> Board', () => {
+  test('full capture-triage-review-apply loop with screenshots', async ({ page, request }, testInfo) => {
+    // Step 1: Home landing
+    await page.goto('/workspace/home')
+    await expect(page.getByRole('heading', { name: 'Home', exact: true })).toBeVisible()
+    await page.screenshot({ path: testInfo.outputPath('01-home.png'), fullPage: true })
+
+    // Step 2: Create board with column via API
+    const seed = `${Date.now()}-${Math.floor(Math.random() * 1_000_000)}`
+    const boardId = await createBoardWithColumn(request, auth, seed, {
+      boardNamePrefix: 'Audit Board',
+      description: 'manual audit e2e board',
+      columnNamePrefix: 'Inbox',
+    })
+
+    // Step 3: Create capture item via API
+    const checklistTaskTitle = `Audit card ${seed}`
+    const captureText = `- [ ] ${checklistTaskTitle}`
+    const createdCapture = await createCaptureItem(request, auth, boardId, captureText)
+    const captureId = createdCapture.id
+
+    // Step 4: Navigate to Inbox and verify capture item
+    await page.goto('/workspace/inbox')
+    await expect(page.getByRole('heading', { name: 'Inbox', level: 1 })).toBeVisible()
+    const captureRow = page.locator('[data-testid="inbox-item"]').filter({ hasText: checklistTaskTitle }).first()
+    await expect(captureRow).toBeVisible()
+    await page.screenshot({ path: testInfo.outputPath('02-inbox-with-capture.png'), fullPage: true })
+
+    // Step 5: Triage capture item
+    await captureRow.click()
+    const triageButton = page.locator('.td-inbox-detail__actions button').filter({ hasText: 'Start Triage' }).first()
+    await expect(triageButton).toBeVisible()
+    await page.screenshot({ path: testInfo.outputPath('03-inbox-detail-pre-triage.png'), fullPage: true })
+    await triageButton.click()
+
+    // Step 6: Wait for proposal creation
+    const triagedCapture = await waitForProposalCreated(request, auth, captureId)
+    const proposalId = triagedCapture.provenance?.proposalId
+    expect(proposalId).toBeTruthy()
+
+    // Verify no card created yet (proposal-first)
+    const cardsAfterTriage = await listBoardCards(request, auth, boardId)
+    expect(cardsAfterTriage.length).toBe(0)
+
+    // Step 7: Navigate to proposal in Review
+    await page.getByRole('button', { name: 'Refresh Detail' }).click()
+    const openProposalButton = page.getByRole('button', { name: 'Open in Review' })
+    await expect(openProposalButton).toBeVisible()
+    await openProposalButton.click()
+
+    await expect(page).toHaveURL(new RegExp(`/workspace/review\\?boardId=${boardId}#proposal-${proposalId}`))
+    const proposalCard = page.locator(`#proposal-${proposalId}`)
+    await expect(proposalCard).toBeVisible()
+    await page.screenshot({ path: testInfo.outputPath('04-review-proposal.png'), fullPage: true })
+
+    // Step 8: Approve proposal
+    await proposalCard.getByRole('button', { name: 'Approve for board' }).click()
+    await expect(proposalCard.getByText('Approved')).toBeVisible()
+    await page.screenshot({ path: testInfo.outputPath('05-review-approved.png'), fullPage: true })
+
+    // Step 9: Apply proposal to board
+    page.once('dialog', (dialog) => dialog.accept())
+    await proposalCard.getByRole('button', { name: 'Apply to board' }).click()
+    await expect(proposalCard.getByText('Applied')).toBeVisible()
+    await page.screenshot({ path: testInfo.outputPath('06-review-applied.png'), fullPage: true })
+
+    // Step 10: Verify card on board
+    const createdCard = await waitForCardWithTitle(request, auth, boardId, checklistTaskTitle)
+
+    await page.goto(`/workspace/boards/${boardId}`)
+    const card = page.locator('[data-card-id]').filter({ hasText: createdCard.title }).first()
+    await expect(card).toBeVisible()
+    await page.screenshot({ path: testInfo.outputPath('07-board-with-card.png'), fullPage: true })
+
+    // Step 11: Open card and verify provenance links
+    await card.getByRole('heading', { name: createdCard.title, exact: true }).click()
+    await expect(page.getByRole('heading', { name: 'Edit Card' })).toBeVisible()
+    await expect(page.getByText('Capture Origin')).toBeVisible()
+    await expect(page.getByRole('link', { name: 'Open Capture' })).toHaveAttribute(
+      'href',
+      `/workspace/inbox?boardId=${boardId}#capture-${captureId}`,
+    )
+    await expect(page.getByRole('link', { name: 'Open Proposal' })).toHaveAttribute(
+      'href',
+      `/workspace/review?boardId=${boardId}#proposal-${proposalId}`,
+    )
+    await page.screenshot({ path: testInfo.outputPath('08-card-provenance.png'), fullPage: true })
+  })
+})
+
+test.describe('Advanced checks', () => {
+  test('command palette search navigates to inbox', async ({ page }, testInfo) => {
+    await page.goto('/workspace/boards')
+    await expect(page.getByRole('button', { name: '+ New Board' })).toBeVisible()
+
+    await page.keyboard.press('Control+K')
+    const palette = page.getByRole('dialog', { name: 'Command palette' })
+    await expect(palette).toBeVisible()
+    await page.screenshot({ path: testInfo.outputPath('09-command-palette.png'), fullPage: true })
+
+    const paletteInput = palette.getByPlaceholder('Type a command or search...')
+    await paletteInput.fill('inbox')
+    await paletteInput.press('Enter')
+
+    await expect(page).toHaveURL(/\/workspace\/inbox$/)
+    await page.screenshot({ path: testInfo.outputPath('10-inbox-from-palette.png'), fullPage: true })
+  })
+
+  test('capture hotkey opens modal and saves item', async ({ page }, testInfo) => {
+    await page.goto('/workspace/boards')
+    await expect(page.getByRole('button', { name: '+ New Board' })).toBeVisible()
+
+    const captureText = `Audit capture ${Date.now()}`
+
+    await page.keyboard.press('Control+Shift+C')
+    const captureModal = page.getByRole('dialog', { name: 'Capture item' })
+    await expect(captureModal).toBeVisible()
+    await page.screenshot({ path: testInfo.outputPath('11-capture-modal.png'), fullPage: true })
+
+    await captureModal.getByPlaceholder('Capture a thought, task, or follow-up...').fill(captureText)
+    await captureModal.getByPlaceholder('Capture a thought, task, or follow-up...').press('Control+Enter')
+
+    await expect(page).toHaveURL(/\/workspace\/inbox$/)
+    await expect(page.locator('.td-inbox-row__excerpt').first()).toContainText(captureText)
+    await page.screenshot({ path: testInfo.outputPath('12-inbox-after-capture.png'), fullPage: true })
+  })
+
+  test('board create, column, card, and filter panel', async ({ page }, testInfo) => {
+    const boardName = `Audit Filter Board ${Date.now()}`
+    const columnName = `To Do ${Date.now()}`
+    const matchingCard = `Alpha ${Date.now()}`
+    const hiddenCard = `Beta ${Date.now()}`
+
+    // Create board
+    await page.goto('/workspace/boards')
+    await page.getByRole('button', { name: '+ New Board' }).click()
+    await page.getByPlaceholder('Board name').fill(boardName)
+    await page.getByRole('button', { name: 'Create', exact: true }).click()
+    await expect(page).toHaveURL(/\/workspace\/boards\/[a-f0-9-]+$/)
+    await expect(page.getByRole('heading', { name: boardName })).toBeVisible()
+    await page.screenshot({ path: testInfo.outputPath('13-new-board.png'), fullPage: true })
+
+    // Add column
+    await page.getByRole('button', { name: '+ Add Column' }).click()
+    await page.getByPlaceholder('Column name').fill(columnName)
+    await page.getByRole('button', { name: 'Create', exact: true }).click()
+    await expect(page.getByRole('heading', { name: columnName, exact: true })).toBeVisible()
+
+    // Add cards
+    const column = page.locator('[data-column-id]')
+      .filter({ has: page.getByRole('heading', { name: columnName, exact: true }) })
+      .first()
+
+    for (const cardTitle of [matchingCard, hiddenCard]) {
+      await column.getByRole('button', { name: 'Add Card' }).click()
+      await column.getByPlaceholder('Enter card title...').fill(cardTitle)
+      const createCardResponse = page.waitForResponse((response) =>
+        response.request().method() === 'POST'
+        && /\/api\/boards\/[a-f0-9-]+\/cards$/i.test(response.url())
+        && response.ok())
+      await column.getByRole('button', { name: 'Add', exact: true }).click()
+      await createCardResponse
+      await expect(page.locator('[data-card-id]').filter({ hasText: cardTitle }).first()).toBeVisible()
+    }
+
+    await page.screenshot({ path: testInfo.outputPath('14-board-with-cards.png'), fullPage: true })
+
+    // Filter panel
+    await page.keyboard.press('f')
+    await expect(page.getByRole('heading', { name: 'Filter Cards' })).toBeVisible()
+    await page.getByPlaceholder('Search cards...').fill(matchingCard)
+    await expect(page.locator('[data-card-id]:visible')).toHaveCount(1)
+    await expect(page.locator('[data-card-id]').filter({ hasText: matchingCard })).toBeVisible()
+    await page.screenshot({ path: testInfo.outputPath('15-filter-active.png'), fullPage: true })
+  })
+})
+
+test.describe('Live LLM provider probe', () => {
+  test.skip(
+    !parseTrueishEnv(process.env.TASKDECK_RUN_LIVE_LLM_TESTS),
+    'Set TASKDECK_RUN_LIVE_LLM_TESTS=1 to run the opt-in live-provider probe.',
+  )
+
+  test('live LLM health check and first chat turn', async ({ page }, testInfo) => {
+    await page.goto('/workspace/automations/chat')
+    await expect(page.locator('[data-llm-health-state="configured"]')).toBeVisible()
+    await expect(page.getByText('Live LLM configured')).toBeVisible()
+    await page.screenshot({ path: testInfo.outputPath('16-llm-configured.png'), fullPage: true })
+
+    await page.getByRole('button', { name: 'Verify LLM' }).click()
+    await expect(page.locator('[data-llm-health-state="verified"]')).toBeVisible({ timeout: 30_000 })
+    await expect(page.getByText('Live LLM verified')).toBeVisible()
+    await page.screenshot({ path: testInfo.outputPath('17-llm-verified.png'), fullPage: true })
+
+    const probeToken = `AUDIT_LLM_PROBE_${Date.now()}`
+
+    await page.getByPlaceholder('Session title').fill(`Audit LLM ${Date.now()}`)
+    await page.getByRole('button', { name: 'Create Session' }).click()
+
+    await page.getByPlaceholder('Describe an automation instruction...').fill(
+      `Reply with exactly two lines. Line 1: ${probeToken}. Line 2: Wednesday.`,
+    )
+    await page.getByRole('button', { name: 'Send Message' }).click()
+
+    const assistantMessage = page
+      .locator('.td-message')
+      .filter({ has: page.locator('.td-message-role', { hasText: 'Assistant' }) })
+      .last()
+    const assistantContent = assistantMessage.locator('.td-message-content')
+    await expect(assistantContent).toContainText(probeToken, { timeout: 30_000 })
+    await page.screenshot({ path: testInfo.outputPath('18-llm-response.png'), fullPage: true })
+  })
+})

From 7093d206a9dc0efdb6fa7eda8942b29f92d73cce Mon Sep 17 00:00:00 2001
From: Chris0Jeky <jeky.tck@gmail.com>
Date: Sun, 29 Mar 2026 03:43:32 +0100
Subject: [PATCH 2/5] Update test:e2e:audit:headed script to use
 manual-audit.spec.ts

---
 frontend/taskdeck-web/package.json | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/frontend/taskdeck-web/package.json b/frontend/taskdeck-web/package.json
index fe1946c96..133038aa6 100644
--- a/frontend/taskdeck-web/package.json
+++ b/frontend/taskdeck-web/package.json
@@ -23,7 +23,7 @@
     "test:ui": "vitest --ui",
     "test:coverage": "node -e \"require('fs').mkdirSync('test-results',{recursive:true})\" && vitest run --coverage --reporter=default --reporter=junit --outputFile.junit=./test-results/vitest.coverage.junit.xml",
     "test:e2e": "playwright test",
-    "test:e2e:audit:headed": "playwright test tests/e2e/automation-ops.spec.ts tests/e2e/capture-loop.spec.ts tests/e2e/live-llm.spec.ts --headed --reporter=line",
+    "test:e2e:audit:headed": "playwright test tests/e2e/manual-audit.spec.ts --headed --reporter=line",
     "test:e2e:concurrency": "playwright test tests/e2e/concurrency.spec.ts --reporter=line",
     "test:e2e:live-llm:headed": "playwright test tests/e2e/live-llm.spec.ts --headed --reporter=line",
     "test:e2e:headed": "playwright test --headed"

From f46704452e5f985e64920e9e49070df43b19f63e Mon Sep 17 00:00:00 2001
From: Chris0Jeky <jeky.tck@gmail.com>
Date: Sun, 29 Mar 2026 03:43:35 +0100
Subject: [PATCH 3/5] Add docs/testing/MANUAL_AUDIT_PACK.md explaining audit
 pack usage

---
 docs/testing/MANUAL_AUDIT_PACK.md | 73 +++++++++++++++++++++++++++++++
 1 file changed, 73 insertions(+)
 create mode 100644 docs/testing/MANUAL_AUDIT_PACK.md

diff --git a/docs/testing/MANUAL_AUDIT_PACK.md b/docs/testing/MANUAL_AUDIT_PACK.md
new file mode 100644
index 000000000..4f28c4bc3
--- /dev/null
+++ b/docs/testing/MANUAL_AUDIT_PACK.md
@@ -0,0 +1,73 @@
+# Manual Audit Pack
+
+An opt-in headed Playwright suite for operator-visible debugging and pre-release sanity checks.
+
+## Quick Start
+
+```bash
+cd frontend/taskdeck-web
+npm run test:e2e:audit:headed
+```
+
+With live LLM provider probes:
+
+```bash
+TASKDECK_RUN_LIVE_LLM_TESTS=1 npm run test:e2e:audit:headed
+```
+
+## What It Covers
+
+### Core Loop (Home -> Inbox/Capture -> Review -> Board)
+
+1. Home landing page renders correctly
+2. Capture item created and visible in Inbox
+3. Triage initiated from Inbox detail view
+4. Proposal appears in Review view after triage
+5. Approve and apply proposal
+6. Card appears on board with provenance links back to capture and proposal
+
+### Advanced Checks
+
+- Command palette search navigates to Inbox
+- Capture hotkey (`Ctrl+Shift+C`) opens modal and saves item
+- Board creation, column/card management, and filter panel
+
+### Live LLM Provider Probe (opt-in)
+
+- LLM health check (configured -> verified)
+- First chat turn returns a live (non-degraded) response
+
+Gated behind `TASKDECK_RUN_LIVE_LLM_TESTS=1`. Skipped by default.
+
+## Screenshots
+
+Every test step captures a numbered screenshot to the Playwright output directory. These are useful for visual regression comparison, audit trails, and debugging.
+
+Screenshots are saved as `01-home.png`, `02-inbox-with-capture.png`, etc. in the test output path (typically `test-results/`).
+
+## When to Use
+
+| Scenario | Use this pack? |
+|----------|---------------|
+| Local operator audit before release | Yes |
+| Visual debugging a UI regression | Yes |
+| Pre-demo sanity check (quick) | Yes |
+| Full stakeholder demo recording | No -- use `stakeholder-demo.spec.ts` with `TASKDECK_RUN_DEMO=1` |
+| CI smoke gate | No -- use `npm run test:e2e` (default headless) |
+| Live LLM provider verification | Yes, with `TASKDECK_RUN_LIVE_LLM_TESTS=1` |
+
+## How It Differs from Other E2E Packs
+
+- **Default smoke (`npm run test:e2e`)**: Headless, fast, runs in CI. Tests individual features in isolation.
+- **Stakeholder demo recorder (`stakeholder-demo.spec.ts`)**: Requires seeded demo data, captures video, designed for external presentation. Opt-in via `TASKDECK_RUN_DEMO=1`.
+- **Manual audit pack (`npm run test:e2e:audit:headed`)**: Headed with slow motion (250ms), captures screenshots at each milestone, covers the full capture-review-board loop end-to-end. Designed for operator debugging and quick visual audits. No demo seed required.
+
+## Configuration
+
+The pack uses the standard `playwright.config.ts` with these test-level overrides:
+
+- `screenshot: 'on'` -- always capture screenshots
+- `trace: 'retain-on-failure'` -- trace files kept on failure for debugging
+- `launchOptions.slowMo: 250` -- 250ms delay between actions for visual clarity
+- `--headed` -- browser visible (set via npm script)
+- `--reporter=line` -- compact output for terminal readability

From 653643fa5fd90895996be8a35852d33cc0c3954b Mon Sep 17 00:00:00 2001
From: Chris0Jeky <jeky.tck@gmail.com>
Date: Sun, 29 Mar 2026 03:47:38 +0100
Subject: [PATCH 4/5] Exclude manual-audit.spec.ts from default CI via
 testIgnore

Add testIgnore for manual-audit.spec.ts in playwright.config.ts so
the default `npm run test:e2e` (CI gate) does not pick up the slow-
motion audit pack. The dedicated npm script targets the file explicitly,
bypassing testIgnore. Remove unused env-var skip guard in favour of
config-level exclusion.
---
 docs/testing/MANUAL_AUDIT_PACK.md          |  4 ++
 frontend/taskdeck-web/playwright.config.ts | 47 +++++++++++-----------
 2 files changed, 28 insertions(+), 23 deletions(-)

diff --git a/docs/testing/MANUAL_AUDIT_PACK.md b/docs/testing/MANUAL_AUDIT_PACK.md
index 4f28c4bc3..9a24c6310 100644
--- a/docs/testing/MANUAL_AUDIT_PACK.md
+++ b/docs/testing/MANUAL_AUDIT_PACK.md
@@ -62,6 +62,10 @@ Screenshots are saved as `01-home.png`, `02-inbox-with-capture.png`, etc. in the
 - **Stakeholder demo recorder (`stakeholder-demo.spec.ts`)**: Requires seeded demo data, captures video, designed for external presentation. Opt-in via `TASKDECK_RUN_DEMO=1`.
 - **Manual audit pack (`npm run test:e2e:audit:headed`)**: Headed with slow motion (250ms), captures screenshots at each milestone, covers the full capture-review-board loop end-to-end. Designed for operator debugging and quick visual audits. No demo seed required.
 
+## CI Exclusion
+
+The `manual-audit.spec.ts` file is listed in `playwright.config.ts` under `testIgnore`, so `npm run test:e2e` (the default CI command) skips it. The dedicated `npm run test:e2e:audit:headed` script explicitly targets the file, bypassing `testIgnore`.
+
 ## Configuration
 
 The pack uses the standard `playwright.config.ts` with these test-level overrides:
diff --git a/frontend/taskdeck-web/playwright.config.ts b/frontend/taskdeck-web/playwright.config.ts
index 616fdae42..9f64b7775 100644
--- a/frontend/taskdeck-web/playwright.config.ts
+++ b/frontend/taskdeck-web/playwright.config.ts
@@ -1,21 +1,21 @@
 import { defineConfig } from '@playwright/test'
-import {
-  buildHttpOrigin,
-  defaultFrontendHost,
-  defaultFrontendPort,
-  parseFrontendHost,
-  resolveDefaultFrontendPort,
-} from './playwright.port-resolution'
-import { resolveDemoBackendLlmEnv, resolvePlaywrightBackendLlmEnv } from './playwright.demo-llm'
-import { resolveReuseExistingServer } from './playwright.server-reuse'
-
-const e2eDbPath = process.env.TASKDECK_E2E_DB ?? 'taskdeck.e2e.db'
-const defaultApiBaseUrl = 'http://localhost:5000/api'
-const demoBackendLlmEnv = resolveDemoBackendLlmEnv(process.env)
-const backendLlmEnv = resolvePlaywrightBackendLlmEnv(process.env)
-const reuseExistingServer = resolveReuseExistingServer(process.env, {
-  requiresFreshServer: Object.keys(demoBackendLlmEnv).length > 0,
-})
+import {
+  buildHttpOrigin,
+  defaultFrontendHost,
+  defaultFrontendPort,
+  parseFrontendHost,
+  resolveDefaultFrontendPort,
+} from './playwright.port-resolution'
+import { resolveDemoBackendLlmEnv, resolvePlaywrightBackendLlmEnv } from './playwright.demo-llm'
+import { resolveReuseExistingServer } from './playwright.server-reuse'
+
+const e2eDbPath = process.env.TASKDECK_E2E_DB ?? 'taskdeck.e2e.db'
+const defaultApiBaseUrl = 'http://localhost:5000/api'
+const demoBackendLlmEnv = resolveDemoBackendLlmEnv(process.env)
+const backendLlmEnv = resolvePlaywrightBackendLlmEnv(process.env)
+const reuseExistingServer = resolveReuseExistingServer(process.env, {
+  requiresFreshServer: Object.keys(demoBackendLlmEnv).length > 0,
+})
 
 const frontendConfig = resolveFrontendConfig()
 const frontendHost = frontendConfig.host
@@ -28,12 +28,12 @@ const backendCorsOrigins = resolveBackendCorsOrigins(
   frontendConfig.origin,
   process.env.TASKDECK_E2E_API_CORS_ORIGINS,
 )
-const backendServerEnv: Record<string, string> = {
-  ASPNETCORE_ENVIRONMENT: 'Development',
-  ConnectionStrings__DefaultConnection: `Data Source=${e2eDbPath}`,
-  ASPNETCORE_URLS: apiConfig.origin,
-  ...backendLlmEnv,
-}
+const backendServerEnv: Record<string, string> = {
+  ASPNETCORE_ENVIRONMENT: 'Development',
+  ConnectionStrings__DefaultConnection: `Data Source=${e2eDbPath}`,
+  ASPNETCORE_URLS: apiConfig.origin,
+  ...backendLlmEnv,
+}
 
 for (const [index, origin] of backendCorsOrigins.entries()) {
   backendServerEnv[`Cors__DevelopmentAllowedOrigins__${index}`] = origin
@@ -41,6 +41,7 @@ for (const [index, origin] of backendCorsOrigins.entries()) {
 
 export default defineConfig({
   testDir: './tests/e2e',
+  testIgnore: ['**/manual-audit.spec.ts'],
   forbidOnly: !!process.env.CI,
   fullyParallel: false,
   workers: process.env.CI ? 1 : undefined,

From 4feb7ec7f66845c6eb2d180261b1e8762454f79d Mon Sep 17 00:00:00 2001
From: Chris0Jeky <jeky.tck@gmail.com>
Date: Sun, 29 Mar 2026 04:00:54 +0100
Subject: [PATCH 5/5] Fix testIgnore blocking audit pack; use env var gate
 instead

Playwright's testIgnore applies even when files are passed as explicit
CLI arguments, so the npm script always found zero tests. Replace with
TASKDECK_RUN_AUDIT env var gate on each describe block (matching the
existing stakeholder-demo and live-llm patterns). The npm script sets
the env var automatically via a cross-platform node wrapper.

Also reverts CRLF line-ending noise in playwright.config.ts and updates
MANUAL_AUDIT_PACK.md to reflect the actual CI exclusion mechanism.
---
 docs/testing/MANUAL_AUDIT_PACK.md             |  2 +-
 frontend/taskdeck-web/package.json            |  2 +-
 frontend/taskdeck-web/playwright.config.ts    | 47 +++++++++----------
 .../tests/e2e/manual-audit.spec.ts            |  9 ++++
 4 files changed, 34 insertions(+), 26 deletions(-)

diff --git a/docs/testing/MANUAL_AUDIT_PACK.md b/docs/testing/MANUAL_AUDIT_PACK.md
index 9a24c6310..0d013776b 100644
--- a/docs/testing/MANUAL_AUDIT_PACK.md
+++ b/docs/testing/MANUAL_AUDIT_PACK.md
@@ -64,7 +64,7 @@ Screenshots are saved as `01-home.png`, `02-inbox-with-capture.png`, etc. in the
 
 ## CI Exclusion
 
-The `manual-audit.spec.ts` file is listed in `playwright.config.ts` under `testIgnore`, so `npm run test:e2e` (the default CI command) skips it. The dedicated `npm run test:e2e:audit:headed` script explicitly targets the file, bypassing `testIgnore`.
+All tests in `manual-audit.spec.ts` are gated behind `TASKDECK_RUN_AUDIT=1`. When `npm run test:e2e` runs in CI, the env var is unset and all audit tests are skipped. The dedicated `npm run test:e2e:audit:headed` script sets the env var automatically.
 
 ## Configuration
 
diff --git a/frontend/taskdeck-web/package.json b/frontend/taskdeck-web/package.json
index 133038aa6..dd4c0ec1a 100644
--- a/frontend/taskdeck-web/package.json
+++ b/frontend/taskdeck-web/package.json
@@ -23,7 +23,7 @@
     "test:ui": "vitest --ui",
     "test:coverage": "node -e \"require('fs').mkdirSync('test-results',{recursive:true})\" && vitest run --coverage --reporter=default --reporter=junit --outputFile.junit=./test-results/vitest.coverage.junit.xml",
     "test:e2e": "playwright test",
-    "test:e2e:audit:headed": "playwright test tests/e2e/manual-audit.spec.ts --headed --reporter=line",
+    "test:e2e:audit:headed": "node -e \"process.env.TASKDECK_RUN_AUDIT='1';require('child_process').execSync('npx playwright test tests/e2e/manual-audit.spec.ts --headed --reporter=line',{stdio:'inherit',env:process.env})\"",
     "test:e2e:concurrency": "playwright test tests/e2e/concurrency.spec.ts --reporter=line",
     "test:e2e:live-llm:headed": "playwright test tests/e2e/live-llm.spec.ts --headed --reporter=line",
     "test:e2e:headed": "playwright test --headed"
diff --git a/frontend/taskdeck-web/playwright.config.ts b/frontend/taskdeck-web/playwright.config.ts
index 9f64b7775..616fdae42 100644
--- a/frontend/taskdeck-web/playwright.config.ts
+++ b/frontend/taskdeck-web/playwright.config.ts
@@ -1,21 +1,21 @@
 import { defineConfig } from '@playwright/test'
-import {
-  buildHttpOrigin,
-  defaultFrontendHost,
-  defaultFrontendPort,
-  parseFrontendHost,
-  resolveDefaultFrontendPort,
-} from './playwright.port-resolution'
-import { resolveDemoBackendLlmEnv, resolvePlaywrightBackendLlmEnv } from './playwright.demo-llm'
-import { resolveReuseExistingServer } from './playwright.server-reuse'
-
-const e2eDbPath = process.env.TASKDECK_E2E_DB ?? 'taskdeck.e2e.db'
-const defaultApiBaseUrl = 'http://localhost:5000/api'
-const demoBackendLlmEnv = resolveDemoBackendLlmEnv(process.env)
-const backendLlmEnv = resolvePlaywrightBackendLlmEnv(process.env)
-const reuseExistingServer = resolveReuseExistingServer(process.env, {
-  requiresFreshServer: Object.keys(demoBackendLlmEnv).length > 0,
-})
+import {
+  buildHttpOrigin,
+  defaultFrontendHost,
+  defaultFrontendPort,
+  parseFrontendHost,
+  resolveDefaultFrontendPort,
+} from './playwright.port-resolution'
+import { resolveDemoBackendLlmEnv, resolvePlaywrightBackendLlmEnv } from './playwright.demo-llm'
+import { resolveReuseExistingServer } from './playwright.server-reuse'
+
+const e2eDbPath = process.env.TASKDECK_E2E_DB ?? 'taskdeck.e2e.db'
+const defaultApiBaseUrl = 'http://localhost:5000/api'
+const demoBackendLlmEnv = resolveDemoBackendLlmEnv(process.env)
+const backendLlmEnv = resolvePlaywrightBackendLlmEnv(process.env)
+const reuseExistingServer = resolveReuseExistingServer(process.env, {
+  requiresFreshServer: Object.keys(demoBackendLlmEnv).length > 0,
+})
 
 const frontendConfig = resolveFrontendConfig()
 const frontendHost = frontendConfig.host
@@ -28,12 +28,12 @@ const backendCorsOrigins = resolveBackendCorsOrigins(
   frontendConfig.origin,
   process.env.TASKDECK_E2E_API_CORS_ORIGINS,
 )
-const backendServerEnv: Record<string, string> = {
-  ASPNETCORE_ENVIRONMENT: 'Development',
-  ConnectionStrings__DefaultConnection: `Data Source=${e2eDbPath}`,
-  ASPNETCORE_URLS: apiConfig.origin,
-  ...backendLlmEnv,
-}
+const backendServerEnv: Record<string, string> = {
+  ASPNETCORE_ENVIRONMENT: 'Development',
+  ConnectionStrings__DefaultConnection: `Data Source=${e2eDbPath}`,
+  ASPNETCORE_URLS: apiConfig.origin,
+  ...backendLlmEnv,
+}
 
 for (const [index, origin] of backendCorsOrigins.entries()) {
   backendServerEnv[`Cors__DevelopmentAllowedOrigins__${index}`] = origin
@@ -41,7 +41,6 @@ for (const [index, origin] of backendCorsOrigins.entries()) {
 
 export default defineConfig({
   testDir: './tests/e2e',
-  testIgnore: ['**/manual-audit.spec.ts'],
   forbidOnly: !!process.env.CI,
   fullyParallel: false,
   workers: process.env.CI ? 1 : undefined,
diff --git a/frontend/taskdeck-web/tests/e2e/manual-audit.spec.ts b/frontend/taskdeck-web/tests/e2e/manual-audit.spec.ts
index e74910215..e64666726 100644
--- a/frontend/taskdeck-web/tests/e2e/manual-audit.spec.ts
+++ b/frontend/taskdeck-web/tests/e2e/manual-audit.spec.ts
@@ -13,6 +13,9 @@
  *
  * This pack is NOT part of required CI. It is intended for local operator audits,
  * pre-release sanity checks, and visual debugging sessions.
+ *
+ * Gated behind TASKDECK_RUN_AUDIT=1. The npm script sets this automatically:
+ *   npm run test:e2e:audit:headed
  */
 
 import { expect, test } from '@playwright/test'
@@ -26,6 +29,8 @@ import {
   waitForProposalCreated,
 } from './support/captureFlow'
 
+const runAudit = parseTrueishEnv(process.env.TASKDECK_RUN_AUDIT)
+
 test.use({
   screenshot: 'on',
   trace: 'retain-on-failure',
@@ -41,6 +46,7 @@ test.beforeEach(async ({ page, request }) => {
 })
 
 test.describe('Core loop: Home -> Inbox/Capture -> Review -> Board', () => {
+  test.skip(!runAudit, 'Set TASKDECK_RUN_AUDIT=1 or use npm run test:e2e:audit:headed')
   test('full capture-triage-review-apply loop with screenshots', async ({ page, request }, testInfo) => {
     // Step 1: Home landing
     await page.goto('/workspace/home')
@@ -131,6 +137,8 @@ test.describe('Core loop: Home -> Inbox/Capture -> Review -> Board', () => {
 })
 
 test.describe('Advanced checks', () => {
+  test.skip(!runAudit, 'Set TASKDECK_RUN_AUDIT=1 or use npm run test:e2e:audit:headed')
+
   test('command palette search navigates to inbox', async ({ page }, testInfo) => {
     await page.goto('/workspace/boards')
     await expect(page.getByRole('button', { name: '+ New Board' })).toBeVisible()
@@ -218,6 +226,7 @@ test.describe('Advanced checks', () => {
 })
 
 test.describe('Live LLM provider probe', () => {
+  test.skip(!runAudit, 'Set TASKDECK_RUN_AUDIT=1 or use npm run test:e2e:audit:headed')
   test.skip(
     !parseTrueishEnv(process.env.TASKDECK_RUN_LIVE_LLM_TESTS),
     'Set TASKDECK_RUN_LIVE_LLM_TESTS=1 to run the opt-in live-provider probe.',