From 3c28cb3428dfa6b267a6df85d91673acb1e0cd03 Mon Sep 17 00:00:00 2001
From: Nicholas Karlson <nicholaskarlson@gmail.com>
Date: Mon, 19 Jan 2026 15:34:10 -0800
Subject: [PATCH] Feat: Track D mini-library: schema primitives (keep shims)

---
 scripts/_business_schema.py                   | 207 ++--------
 src/pystatsv1/assets/workbook_track_d.zip     | Bin 162838 -> 161705 bytes
 src/pystatsv1/trackd/__init__.py              |  12 +
 src/pystatsv1/trackd/schema.py                | 362 ++++++++++++++++++
 tests/test_trackd_schema_required_columns.py  |  53 +++
 .../scripts/_business_schema.py               | 207 ++--------
 6 files changed, 472 insertions(+), 369 deletions(-)
 create mode 100644 src/pystatsv1/trackd/schema.py
 create mode 100644 tests/test_trackd_schema_required_columns.py

diff --git a/scripts/_business_schema.py b/scripts/_business_schema.py
index 16a58d8..d5b0002 100644
--- a/scripts/_business_schema.py
+++ b/scripts/_business_schema.py
@@ -1,190 +1,29 @@
-# SPDX-License-Identifier: MIT
-"""Schema contracts for Track D business datasets."""
+"""Backwards-compatible shim for Track D schema helpers.
 
-from __future__ import annotations
-
-from dataclasses import dataclass
-from pathlib import Path
-from typing import Any
-
-import pandas as pd
-
-DATASET_NSO_V1 = "nso_v1"
+The Track D workbook template (and legacy scripts) historically imported
+``scripts._business_schema``.
 
+As of PR-1.2b, the canonical implementation lives in
+``pystatsv1.trackd.schema`` so it can be reused by chapter runners and future
+"bring-your-own data" pipelines.
+"""
 
-@dataclass(frozen=True)
-class TableSchema:
-    name: str
-    required_columns: tuple[str, ...]
-
-
-CONTRACT_TABLES: dict[str, TableSchema] = {
-    "chart_of_accounts": TableSchema(
-        name="chart_of_accounts.csv",
-        required_columns=("account_id", "account_name", "account_type", "normal_side"),
-    ),
-    "gl_journal": TableSchema(
-        name="gl_journal.csv",
-        required_columns=("txn_id", "date", "doc_id", "description", "account_id", "debit", "credit"),
-    ),
-    "trial_balance_monthly": TableSchema(
-        name="trial_balance_monthly.csv",
-        required_columns=(
-            "month",
-            "account_id",
-            "account_name",
-            "account_type",
-            "normal_side",
-            "debit",
-            "credit",
-            "ending_side",
-            "ending_balance",
-        ),
-    ),
-    "statements_is_monthly": TableSchema(
-        name="statements_is_monthly.csv",
-        required_columns=("month", "line", "amount"),
-    ),
-    "statements_bs_monthly": TableSchema(
-        name="statements_bs_monthly.csv",
-        required_columns=("month", "line", "amount"),
-    ),
-    "statements_cf_monthly": TableSchema(
-        name="statements_cf_monthly.csv",
-        required_columns=("month", "line", "amount"),
-    ),
-    "inventory_movements": TableSchema(
-        name="inventory_movements.csv",
-        required_columns=("month", "txn_id", "date", "sku", "movement_type", "qty", "unit_cost", "amount"),
-    ),
-    "fixed_assets": TableSchema(
-        name="fixed_assets.csv",
-        required_columns=(
-            "asset_id",
-            "asset_name",
-            "in_service_month",
-            "cost",
-            "useful_life_months",
-            "salvage_value",
-            "method",
-        ),
-    ),
-    "depreciation_schedule": TableSchema(
-        name="depreciation_schedule.csv",
-        required_columns=("month", "asset_id", "dep_expense", "accum_dep", "net_book_value"),
-    ),
-    # Chapter 5
-    "payroll_events": TableSchema(
-        name="payroll_events.csv",
-        required_columns=(
-            "month",
-            "txn_id",
-            "date",
-            "event_type",
-            "gross_wages",
-            "employee_withholding",
-            "employer_tax",
-            "cash_paid",
-            "wages_payable_delta",
-            "payroll_taxes_payable_delta",
-        ),
-    ),
-    "sales_tax_events": TableSchema(
-        name="sales_tax_events.csv",
-        required_columns=(
-            "month",
-            "txn_id",
-            "date",
-            "event_type",
-            "taxable_sales",
-            "tax_amount",
-            "cash_paid",
-            "sales_tax_payable_delta",
-        ),
-    ),
-    "debt_schedule": TableSchema(
-        name="debt_schedule.csv",
-        required_columns=("month", "loan_id", "txn_id", "beginning_balance", "payment", "interest", "principal", "ending_balance"),
-    ),
-    "equity_events": TableSchema(
-        name="equity_events.csv",
-        required_columns=("month", "txn_id", "date", "event_type", "amount"),
-    ),
-    "ap_events": TableSchema(
-        name="ap_events.csv",
-        required_columns=("month", "txn_id", "date", "vendor", "invoice_id", "event_type", "amount", "ap_delta", "cash_paid"),
-    ),
-    # Chapter 6
-    "ar_events": TableSchema(
-        name="ar_events.csv",
-        required_columns=("month", "txn_id", "date", "customer", "invoice_id", "event_type", "amount", "ar_delta", "cash_received"),
-    ),
-    "bank_statement": TableSchema(
-        name="bank_statement.csv",
-        required_columns=("month", "bank_txn_id", "posted_date", "description", "amount", "gl_txn_id"),
-    ),
-}
+from __future__ import annotations
 
-NSO_V1_TABLE_ORDER: tuple[str, ...] = (
-    "chart_of_accounts",
-    "gl_journal",
-    "trial_balance_monthly",
-    "statements_is_monthly",
-    "statements_bs_monthly",
-    "statements_cf_monthly",
-    "inventory_movements",
-    "fixed_assets",
-    "depreciation_schedule",
-    # Chapter 5
-    "payroll_events",
-    "sales_tax_events",
-    "debt_schedule",
-    "equity_events",
-    "ap_events",
-    # Chapter 6
-    "ar_events",
-    "bank_statement",
+from pystatsv1.trackd.schema import (
+    DATASET_NSO_V1,
+    NSO_V1,
+    TableSchema,
+    assert_schema,
+    validate_schema,
+    validate_table_map,
 )
 
-NSO_V1_TABLES: tuple[TableSchema, ...] = tuple(CONTRACT_TABLES[k] for k in NSO_V1_TABLE_ORDER)
-
-
-def schemas_for_dataset(dataset: str) -> tuple[TableSchema, ...]:
-    if dataset == DATASET_NSO_V1:
-        return NSO_V1_TABLES
-    raise ValueError(f"Unknown dataset: {dataset}")
-
-
-def validate_schema(datadir: Path, dataset: str) -> dict[str, Any]:
-    """Validate presence + required columns. Returns a report dict."""
-    report: dict[str, Any] = {
-        "dataset": dataset,
-        "datadir": str(datadir),
-        "missing_tables": [],
-        "tables": {},
-        "ok": True,
-    }
-
-    for schema in schemas_for_dataset(dataset):
-        table_path = datadir / schema.name
-        if not table_path.exists():
-            report["missing_tables"].append(schema.name)
-            report["tables"][schema.name] = {
-                "exists": False,
-                "missing_columns": list(schema.required_columns),
-            }
-            report["ok"] = False
-            continue
-
-        df = pd.read_csv(table_path)
-        cols = set(map(str, df.columns))
-        missing = [c for c in schema.required_columns if c not in cols]
-        report["tables"][schema.name] = {
-            "exists": True,
-            "n_rows": int(df.shape[0]),
-            "missing_columns": missing,
-        }
-        if missing:
-            report["ok"] = False
-
-    return report
+__all__ = [
+    "DATASET_NSO_V1",
+    "NSO_V1",
+    "TableSchema",
+    "validate_schema",
+    "validate_table_map",
+    "assert_schema",
+]
diff --git a/src/pystatsv1/assets/workbook_track_d.zip b/src/pystatsv1/assets/workbook_track_d.zip
index 1580ad5a5b4a7650df4f04f8cc4e90c6b13e4eb9..de3c49cacc74172b9e1ca1e17dc7116d57f9abed 100644
GIT binary patch
delta 2109
zcmY*a4NOy4811`QY^Ap4ui}GJdB7N;P*7lQ5X4b+Fcguv$-<=kh0=m8P>=$Ft+5)#
zY4;MYPEne;O<cfCx2jRLxtN)VPW;P^+ni*Zi#o->Wq<>AdoRyknlvvx=R4<o_j}*#
z>l&5zj!5}dG0SfhAN^9U6CaoR4yfk3b<e+F!H7gQAQFZ0cLIX>hhfrot8=i{u2t&(
zo!stxr!U+2lqo)xbK)U)c;As^Uq|T&nx`_?#EaLJR}U%H-@SNo;HR?KKkfZ5-a7Ai
zRK3Ywxo)oH`h35>UHRt<9qRmFT{nh?mD+-Y>?@awBTDLPKWY6tex#-3EB#PsiRrOZ
zdg0^yRbXBJ5ohO{+}EqRDiYe~C^AY#8L|$I<L1ex!*8fVBF|kpRlanGW~}_=vq+y*
zN372yS(dTj?w;$Nk*?UYH`uDqzWyY8+@<}a9V+$bU)W~<xJJ9jCm<x|LUL<C+>oAs
z_M{+hvb!KBHam1c{OK*{`E5CU3AdJhE4kYHm&RqivtrqJ<Ikn1+ZSHHHo0oUfa%!Y
z;sbu&;bobMgk^#HKd#+ZH4NDeSNo?Nt%dpPx4!+$99LnHC8tesw0_?i`2whKo@nwf
z)n%r)4<CO}bm~I)oqeOg-pg(6<(Lz_92nFwBECbcf}>SH=Ho^`O2n*hel7!oJUA;8
zO@G`>nh53@z#>ww3>OG=bu(=u=rVw4Mg*-@fD3XnrxBc|H&#>{Ocm2^I~i6jh}=vz
zy0Znktn55pLQOfTfaeW>W8Cn*0k9}#!k2}bY9N{AX2yK^;ea5RSq=P9L~b=MtE~o6
zF`^)3DM8<e{24nV1fi>&83@DjOVvP*eET>yQlQ;TIyy*wS)IY$P@lN5%w$L~H&6Fl
z6h)u@o(5(bff~gZ8v%!UN{QgViB`iNBM>9-GXgp|IBWtcJ~}2;7@~3s3)LokjDv}o
zg_$Og5nsEU4w%Rw(*4WBrls(-2`AZBdzcKAqN%~ajUwXnUJZytK5Hy2?5V*Cw@t*P
z%@QT#>l^8m#}-nst1(_k*-#5ObmwEBe=V5D|6ofJlvj4s%92i^oZ77xl<}KzJ6n3-
z+D$-<`umUol9RmiOom|d-!<B1$7Sem2I;7HwHd1&_fWA4Za0He1fC^e*%$^V%peMZ
zoCQ}tmqJS&P{H>tAOfKs1U(Q&(2NL1SX?-j%Fvk~C6kgxY0M&__uM+{sbA}%)_9T$
zz!^#HL>)*$=;C@@_GF6(4Tih6dmUVax_ppOHHVlu!CcmWRTbY6YGngRL|#n<wcjM@
zu?7&2(AxwZ9PyxmaGn)}AXIC`4tb++y%lH>(1-xBn<<=R;B5e2o^$}gteY7J;N=#V
zYm;6sF&ra4t7bt>BM3%5DUDcgSWF8Rdj%H4OJ~#k5-<Nq23XGf__Rsrx)g7nQ4Z)^
zFfN6PCfq=D6K>#LKU$dP73vA!C!_h-ynHv|L*+ET)XP5zoDpnOz$p@(9t>ERxEV;$
zyatt&I*FRs+ReDTg#k35>~-Hscs`KksqvZS&q#j}1V=XGV~d-yag2%<QuE3peEvL|
zPxS`35xzNu=BcsugwF_0WZ`ekIQSnT{5_NwQu9i(;l`|Lici*hgKG#s9!~Sr#Cj2r
z{toR6;AI;QY<~sKdCG?8EazwyHK&Lctg=PIl`Y^^w3lWARHebL7W^XVs08d>@1iM6
T0o+>&)LpGW=?luy+e7p}j=^qO

delta 3391
zcmY+F2Ut^Q8-{ZZ2H8SL0z`<608(byvPHrWP(VRY5!nPn5{6I&iHMBiV1#;r@)yyF
zpjI|o5L2o_t;GRa6f2a1l`10+EVhFG;e?n&a^*_$-1qms-}mO6D@}8<rxs*edv;*U
zm3rEhq<e{q-}xKh+OZf+BoTvI&;0{OfcD3MvYdg?J*;Q8_}t-U?MG_s(|YG4vn|RZ
z!?*ypyQ{c2>TslThlik6KS<xmkXiQm`i*0=ZBb{nEN&d8d|z5L_M=evR?gJ*`KQHy
zosVtY^?tsmDs=$o`2t-0$Rr$%ym~ytT5lt6uP=^XfYW&>x9^`R>126<eXyLsLzUK9
zv!#@y?ajNb-0xE_??d%8xm)n4m~CeL(2xCs+OVe*cdqfP&B5F)lOA(HU8d*i{uq*d
zPmTX{ox%U>mbP$i(>OIyW+_W^jot9Y*Dq$|IH9>W>&8wS<5Ts8<BAUyaxY4Mclcg&
zWyB9Lo6qMZyBoLpH(7C1v=>q;9%6%bkC^-L@f^QFbuV30%gaP>wXChf+I96GbFSwB
zqq(12x_feae!lp6Y;4R-ZDU+{MseW>#g>C@4mT3Kc>TJ4loF4=PB}II$(v`kn(aEY
z;1pEE4yo_fY&NL(iXs+S?L4G$V1OmOy!e-U97Rwfu&#CJT~Zl6zpx?Dd)r{jNt@Z&
z)PKu4*-^?GzS_jVr|!X&Fy`R-I~{mtwXM0z#-mr1cA08~w(1*=s|YkE-<mm}93oG@
zJ%j!Bwo+2Ijj*fLCnxmJBUF>LJo??5&992DMU0#n_4;4PFVR&2`Ma;(c08*yb2Y4Q
zx<R8-xuDwN{y={CzHRuqFnmJ*hv5*@@BI9#T?dC{ZrHK7U6yu7aP*bg*a_u{wE?D+
zD%Kl*x0pzmcG&CI;M({2x<zSFSa8<$sk2%5T6zHQJzW*|K_<VNHmN`BKUuKjX$GmL
zz3WgyzvW57w`)T}N=HpPJUgGs(YU$-Bi|gu$Fz+V<lD}IwH3r(9jgnOx-QPH(KWs#
zYR?)@G}f%-SmntcM$26+(7YH|bn89U&QUR<@0h}tv*8JtPD0e2Vv;JSV06~|a+8Ov
z<CfIaN?m`d^R?QR<mrDJ|A@t9ZvDZ3YTLNe167;<_Q{<SN*!%ei>i6iWFJ(rp=xx-
zBQbGK_V~>jrw_Pejav77>gu%=DP9vM?3@ceYMdYk`9~++dT1wjm_oC7!P#R=e2+Ei
zVbP|1K<C5bmwQ>m8Q=fy8G3R4X?q*c8)K@>yTm`BKRTG*pOut%<(vJ#v}VO>#*q&Y
z?4jdcCPmI;m#&yjRYfOEO@tXeJd!(<IH)k!G=F3=zWl=eF%KE*o9+&F<fCB<wK-)|
zzgE2C&<Fi~*zrQB#wvHZulv#2q(tr<&C|TqCxdZ>P|zkdGeTg>j!h);t(bo6v-4<O
z(a9l7cP%g%-+8{Q4AcN_sgE@oENZTq4gLFG=EB7Dftm0*O_}pOcbbO6KbzPbjM8`>
zUpkxR^-rB%c3-{oZ&S=auMz%x^b0jqZms-QmL-R8Z&%1=5dEG7?mY!CC=mp2<LdO2
z^RE~CM@yzvCK~IMPrDY=k5mSqvv6zWn^!NK?+vaxGtB><G!pLC!n>BRdDpJSL+z~z
z6n^2(M3u1a_3}UCX>|kAuS2%#82T)zjitT$DNrzRhwogZpZuhZYUS86!7{q#XEq)F
ztHM0Tq_Nrl^2dj&>uw0!cjar-@dZ3j*PTQ7k8}sG%u_w?Yhq>{WICSu>c>~p_oNp#
zGPm!2W$zN;^y%3pQ>j<=`g=&0$r#Iq%CNzXH~glC*Zx~}ce*&+?G}vUzX}T&mbU40
z@^i5-s^+Q7E_Nu@J}w<Np;k5dw0^^(mp>Y16F7LwJo)ES)bpi&bQ^l(Mdz+rQdc!s
z^TYTXUVXO1lh)}LruH*(v*x(^VXGzWrZep>rzzuS6>sAYR%&+JWRLtNbn;$T%X;!e
zWe+AT;?CEb^Do$J!&Kd}P|Bk|iVSjWw$<tn!C1Yy<L%PAiD>w)B1rLl7bZjN>3**R
zwb>0WRcxB={=?KQ3=(%9=Q`|iS@m*7iise<yst1B<Pq@h-AnYLlu0-B9N!b!OoJLo
z$uPtilUp(Jb^_DK&vzmhIgx=YPGs;d4Uj75lQc0a4<4}m!9Ox7Hjd7S4e$j(ycDDt
z3+fVhz&9`pqHXr@r<o<kh){VR5hBNc3Tt=(4GWpYfMmE_9#PpqTn~Qd0XbMGEe13N
zq@em3P#1Q8#+FxWORrSl4Oa(v(4kn61W0igrAZ3n#XR7nG<O__SBOn#n6a}~{85n)
z#DNq;DLm}Tz%QMERsU4t3h+A*=+#^<vi!%T1UGOalk~)x2Q=woFlo`Lbar~0c|<gW
z{-q6fW&`Ofi5EgadC6=>L^Laz9hv?`hlFv+$<F9=19h}kj>av~MIYv!0r$;rBKNB9
zdZ;WO#KPk^6^|@ZuwDkxU_7V=ZxC=nFG_Sr7MZ(fis!X00a^4i2mzP2>54&{2)IYU
zz)>7(&=K1=1+kTrDPq8ZffNr2hg1?lHK>OUTEH8c7TJ{t5j!k{Dz+mMkun2i%K-Wg
z{s!CEMd4c>xBj#-v@U7+Ok9PlB*;7ol!1Td1J__c<T_k6Tq(mXy^lWI!VtoH@9T)$
zj3*&&-pwonNQ(j5!fkdkknq7G5|%MQ3LJLAA(jV3Dgls+9PnkIs>w(!uY<${=z%6c
z5*KHQ*nhSw>?cdWRLn+2>|XE+BQe2E%dMG6xl-0jT*d@#;J6=-;q&b)fh^b{5z;FJ
zOvHt(SqO6Ci4dCwn!yX|MCss7QTj}j%CQkw`1^9|25Tvz!2Uf1u|Z=v2wVV2&~r92
z&F)Xo-)wLLoXVykyXpf$C}l}<z5qBT@qqZX;Fn7}#)2xjM30Mjrwp1~O86x#NP=$%
z(SrvN<j|g##8X@gk|1&_C<8akkVi|_5-Cq+Rk2qJXwOFCEy=F(;+4>zt;E|azseJ=
zLwj}-uT=rwoKhOHIg$!mvX@8}X~?9CacI6t!gJTHYW7kU<xwpp-hJg&o;?BWp(byE
zgEzG#+Eg_WEuqG*osMh@qmJgNv46&|YL=jZ_E3{ICa&@-NoWr>`A4FDz3b5&HF4zw
z$bSCPM03=n{Y1Q$jOM5z7mIj+HkzY`d{e~#)Io7e$#73)h^}TmG)B$TNyLQ|G)Il|
zYZ1>jKy%bMbM@fg<X#4HYrQmtMl!&S@U6wLgHx?cBz^1%8D)a{aJoGcx#4o+K*%Ht
Z)FKA>Vx^aF6F2x-u8P615<vLd{{gFur+@$e

diff --git a/src/pystatsv1/trackd/__init__.py b/src/pystatsv1/trackd/__init__.py
index 4bb3226..e38722f 100644
--- a/src/pystatsv1/trackd/__init__.py
+++ b/src/pystatsv1/trackd/__init__.py
@@ -10,12 +10,24 @@
 from ._errors import TrackDDataError, TrackDSchemaError  # noqa: F401
 from ._types import DataFrame, DataFrames, PathLike  # noqa: F401
 from .csvio import read_csv_required  # noqa: F401
+from .schema import (  # noqa: F401
+    DATASET_NSO_V1,
+    NSO_V1,
+    TableSchema,
+    assert_schema,
+    validate_schema,
+)
 
 __all__ = [
     "DataFrame",
     "DataFrames",
     "PathLike",
+    "DATASET_NSO_V1",
+    "NSO_V1",
+    "TableSchema",
+    "assert_schema",
     "TrackDDataError",
     "TrackDSchemaError",
     "read_csv_required",
+    "validate_schema",
 ]
diff --git a/src/pystatsv1/trackd/schema.py b/src/pystatsv1/trackd/schema.py
new file mode 100644
index 0000000..c8fdace
--- /dev/null
+++ b/src/pystatsv1/trackd/schema.py
@@ -0,0 +1,362 @@
+# SPDX-License-Identifier: MIT
+"""Schema contracts for Track D business datasets.
+
+This module centralizes the Track D CSV contracts so both:
+- the workbook template scripts, and
+- future BYOD adapters
+can validate datasets with consistent, friendly errors.
+
+Design notes
+- Keep the existing workbook behavior: validate_schema(...) returns a report dict.
+- Provide assert_schema(...) for fail-fast workflows.
+"""
+
+from __future__ import annotations
+
+from dataclasses import dataclass
+from pathlib import Path
+from typing import Any, Mapping
+
+import pandas as pd
+
+from ._errors import TrackDSchemaError
+
+DATASET_NSO_V1 = "nso_v1"
+
+
+@dataclass(frozen=True)
+class TableSchema:
+    """A simple contract for one required CSV table."""
+
+    # Filename on disk, including .csv
+    name: str
+    # Required column headers that must appear in the CSV
+    required_columns: tuple[str, ...]
+
+
+# Canonical contract table definitions.
+# Keys are "logical" table identifiers used for ordering / grouping.
+CONTRACT_TABLES: dict[str, TableSchema] = {
+    "chart_of_accounts": TableSchema(
+        name="chart_of_accounts.csv",
+        required_columns=("account_id", "account_name", "account_type", "normal_side"),
+    ),
+    "gl_journal": TableSchema(
+        name="gl_journal.csv",
+        required_columns=(
+            "txn_id",
+            "date",
+            "doc_id",
+            "description",
+            "account_id",
+            "debit",
+            "credit",
+        ),
+    ),
+    "trial_balance_monthly": TableSchema(
+        name="trial_balance_monthly.csv",
+        required_columns=(
+            "month",
+            "account_id",
+            "account_name",
+            "account_type",
+            "normal_side",
+            "debit",
+            "credit",
+            "ending_side",
+            "ending_balance",
+        ),
+    ),
+    "statements_is_monthly": TableSchema(
+        name="statements_is_monthly.csv",
+        required_columns=("month", "line", "amount"),
+    ),
+    "statements_bs_monthly": TableSchema(
+        name="statements_bs_monthly.csv",
+        required_columns=("month", "line", "amount"),
+    ),
+    "statements_cf_monthly": TableSchema(
+        name="statements_cf_monthly.csv",
+        required_columns=("month", "line", "amount"),
+    ),
+    "inventory_movements": TableSchema(
+        name="inventory_movements.csv",
+        required_columns=(
+            "month",
+            "txn_id",
+            "date",
+            "sku",
+            "movement_type",
+            "qty",
+            "unit_cost",
+            "amount",
+        ),
+    ),
+    "fixed_assets": TableSchema(
+        name="fixed_assets.csv",
+        required_columns=(
+            "asset_id",
+            "asset_name",
+            "in_service_month",
+            "cost",
+            "useful_life_months",
+            "salvage_value",
+            "method",
+        ),
+    ),
+    "depreciation_schedule": TableSchema(
+        name="depreciation_schedule.csv",
+        required_columns=("month", "asset_id", "dep_expense", "accum_dep", "net_book_value"),
+    ),
+    # Chapter 5
+    "payroll_events": TableSchema(
+        name="payroll_events.csv",
+        required_columns=(
+            "month",
+            "txn_id",
+            "date",
+            "event_type",
+            "gross_wages",
+            "employee_withholding",
+            "employer_tax",
+            "cash_paid",
+            "wages_payable_delta",
+            "payroll_taxes_payable_delta",
+        ),
+    ),
+    "sales_tax_events": TableSchema(
+        name="sales_tax_events.csv",
+        required_columns=(
+            "month",
+            "txn_id",
+            "date",
+            "event_type",
+            "taxable_sales",
+            "tax_amount",
+            "cash_paid",
+            "sales_tax_payable_delta",
+        ),
+    ),
+    "debt_schedule": TableSchema(
+        name="debt_schedule.csv",
+        required_columns=(
+            "month",
+            "loan_id",
+            "txn_id",
+            "beginning_balance",
+            "payment",
+            "interest",
+            "principal",
+            "ending_balance",
+        ),
+    ),
+    "equity_events": TableSchema(
+        name="equity_events.csv",
+        required_columns=("month", "txn_id", "date", "event_type", "amount"),
+    ),
+    "ap_events": TableSchema(
+        name="ap_events.csv",
+        required_columns=(
+            "month",
+            "txn_id",
+            "date",
+            "vendor",
+            "invoice_id",
+            "event_type",
+            "amount",
+            "ap_delta",
+            "cash_paid",
+        ),
+    ),
+    # Chapter 6
+    "ar_events": TableSchema(
+        name="ar_events.csv",
+        required_columns=(
+            "month",
+            "txn_id",
+            "date",
+            "customer",
+            "invoice_id",
+            "event_type",
+            "amount",
+            "ar_delta",
+            "cash_received",
+        ),
+    ),
+    "bank_statement": TableSchema(
+        name="bank_statement.csv",
+        required_columns=("month", "bank_txn_id", "posted_date", "description", "amount", "gl_txn_id"),
+    ),
+}
+
+
+NSO_V1_TABLE_ORDER: tuple[str, ...] = (
+    "chart_of_accounts",
+    "gl_journal",
+    "trial_balance_monthly",
+    "statements_is_monthly",
+    "statements_bs_monthly",
+    "statements_cf_monthly",
+    "inventory_movements",
+    "fixed_assets",
+    "depreciation_schedule",
+    # Chapter 5
+    "payroll_events",
+    "sales_tax_events",
+    "debt_schedule",
+    "equity_events",
+    "ap_events",
+    # Chapter 6
+    "ar_events",
+    "bank_statement",
+)
+
+NSO_V1_TABLES: tuple[TableSchema, ...] = tuple(CONTRACT_TABLES[k] for k in NSO_V1_TABLE_ORDER)
+
+# Convenience alias used by some internal helpers/tests.
+NSO_V1: dict[str, TableSchema] = {k: CONTRACT_TABLES[k] for k in NSO_V1_TABLE_ORDER}
+
+
+def schemas_for_dataset(dataset: str) -> tuple[TableSchema, ...]:
+    if dataset == DATASET_NSO_V1:
+        return NSO_V1_TABLES
+    raise ValueError(f"Unknown dataset: {dataset}")
+
+
+def _read_header(path: Path) -> list[str]:
+    # Small helper to keep schema checks cheap.
+    # We only need headers for required-column validation.
+    df = pd.read_csv(path, nrows=0)
+    return [str(c) for c in df.columns]
+
+
+def validate_schema(datadir: Path, dataset: str) -> dict[str, Any]:
+    """Validate presence + required columns.
+
+    Returns a report dict (workbook-friendly), e.g.:
+    {
+      "ok": bool,
+      "dataset": "nso_v1",
+      "datadir": "...",
+      "missing_tables": [...],
+      "tables": {
+          "chart_of_accounts.csv": {"exists": bool, "missing_columns": [...], "n_rows": int?},
+          ...
+      }
+    }
+    """
+
+    report: dict[str, Any] = {
+        "dataset": dataset,
+        "datadir": str(datadir),
+        "missing_tables": [],
+        "tables": {},
+        "ok": True,
+    }
+
+    for schema in schemas_for_dataset(dataset):
+        table_path = datadir / schema.name
+        if not table_path.exists():
+            report["missing_tables"].append(schema.name)
+            report["tables"][schema.name] = {
+                "exists": False,
+                "missing_columns": list(schema.required_columns),
+            }
+            report["ok"] = False
+            continue
+
+        cols = set(_read_header(table_path))
+        missing = [c for c in schema.required_columns if c not in cols]
+
+        # Optional: if the file is big, avoid reading it all just for row count.
+        # For now, keep it simple: an approximate count is not worth it.
+        df = pd.read_csv(table_path)
+
+        report["tables"][schema.name] = {
+            "exists": True,
+            "n_rows": int(df.shape[0]),
+            "missing_columns": missing,
+        }
+
+        if missing:
+            report["ok"] = False
+
+    return report
+
+
+def validate_table_map(table_map: Mapping[str, Path], schemas: Mapping[str, TableSchema]) -> dict[str, Any]:
+    """Validate a provided mapping of logical table keys -> CSV paths.
+
+    This is useful for future BYOD adapters where files may not live in a single directory.
+    The report format matches validate_schema(...), but keys are schema.name (filename).
+    """
+
+    report: dict[str, Any] = {
+        "missing_tables": [],
+        "tables": {},
+        "ok": True,
+    }
+
+    for key, schema in schemas.items():
+        path = table_map.get(key)
+        if path is None or not Path(path).exists():
+            report["missing_tables"].append(schema.name)
+            report["tables"][schema.name] = {
+                "exists": False,
+                "missing_columns": list(schema.required_columns),
+            }
+            report["ok"] = False
+            continue
+
+        cols = set(_read_header(Path(path)))
+        missing = [c for c in schema.required_columns if c not in cols]
+        report["tables"][schema.name] = {
+            "exists": True,
+            "missing_columns": missing,
+        }
+        if missing:
+            report["ok"] = False
+
+    return report
+
+
+def assert_schema(datadir: Path, dataset: str) -> None:
+    """Fail-fast wrapper around validate_schema(...).
+
+    Raises TrackDSchemaError with one friendly summary message if invalid.
+    """
+
+    report = validate_schema(datadir=datadir, dataset=dataset)
+    if report.get("ok"):
+        return
+
+    missing_tables: list[str] = list(report.get("missing_tables", []))
+    tables: dict[str, Any] = dict(report.get("tables", {}))
+    missing_cols = {
+        name: info.get("missing_columns", [])
+        for name, info in tables.items()
+        if info.get("exists") and info.get("missing_columns")
+    }
+
+    lines: list[str] = [
+        "Track D dataset schema check failed.",
+        f"Dataset: {dataset}",
+        f"Data directory: {datadir}",
+        "",
+    ]
+
+    if missing_tables:
+        lines += ["Missing CSV files:", *[f"  - {n}" for n in missing_tables], ""]
+
+    if missing_cols:
+        lines += ["CSV files with missing required columns:"]
+        for name, cols in sorted(missing_cols.items()):
+            lines.append(f"  - {name}: missing {', '.join(map(str, cols))}")
+        lines.append("")
+
+    lines += [
+        "Fix: ensure the required CSVs exist and match the Track D headers.",
+        "Tip: compare your exported CSV headers against the downloads in the workbook docs.",
+    ]
+
+    raise TrackDSchemaError("\n".join(lines))
diff --git a/tests/test_trackd_schema_required_columns.py b/tests/test_trackd_schema_required_columns.py
new file mode 100644
index 0000000..51f2cd8
--- /dev/null
+++ b/tests/test_trackd_schema_required_columns.py
@@ -0,0 +1,53 @@
+from __future__ import annotations
+
+from pathlib import Path
+
+import pytest
+
+from pystatsv1.trackd._errors import TrackDSchemaError
+from pystatsv1.trackd.schema import CONTRACT_TABLES, DATASET_NSO_V1, assert_schema, validate_schema
+
+
+def _write_csv(path: Path, header: list[str]) -> None:
+    path.write_text(",".join(header) + "\n", encoding="utf-8")
+
+
+def test_validate_schema_reports_missing_tables_and_columns(tmp_path: Path) -> None:
+    # Create one required file but with missing required columns.
+    # chart_of_accounts requires: account_id, account_name, account_type, normal_side
+    _write_csv(
+        tmp_path / "chart_of_accounts.csv",
+        header=["account_id", "account_name", "account_type"],
+    )
+
+    # Create another file that is OK.
+    _write_csv(
+        tmp_path / "gl_journal.csv",
+        header=list(CONTRACT_TABLES["gl_journal"].required_columns),
+    )
+
+    report = validate_schema(tmp_path, dataset=DATASET_NSO_V1)
+
+    assert report["ok"] is False
+
+    # Missing file list should include at least one known table.
+    assert "trial_balance_monthly.csv" in report["missing_tables"]
+
+    chart = report["tables"]["chart_of_accounts.csv"]
+    assert chart["exists"] is True
+    assert "normal_side" in chart["missing_columns"]
+
+    gl = report["tables"]["gl_journal.csv"]
+    assert gl["exists"] is True
+    assert gl["missing_columns"] == []
+
+
+def test_assert_schema_raises_single_friendly_error(tmp_path: Path) -> None:
+    # Leave datadir empty so we get missing-table errors.
+    with pytest.raises(TrackDSchemaError) as ei:
+        assert_schema(tmp_path, dataset=DATASET_NSO_V1)
+
+    msg = str(ei.value)
+    assert "Missing CSV files" in msg
+    assert "chart_of_accounts.csv" in msg
+    assert "Dataset: nso_v1" in msg
diff --git a/workbooks/track_d_template/scripts/_business_schema.py b/workbooks/track_d_template/scripts/_business_schema.py
index 16a58d8..d40c61c 100644
--- a/workbooks/track_d_template/scripts/_business_schema.py
+++ b/workbooks/track_d_template/scripts/_business_schema.py
@@ -1,190 +1,27 @@
-# SPDX-License-Identifier: MIT
-"""Schema contracts for Track D business datasets."""
+"""Backwards-compatible shim for Track D schema helpers.
 
-from __future__ import annotations
-
-from dataclasses import dataclass
-from pathlib import Path
-from typing import Any
-
-import pandas as pd
-
-DATASET_NSO_V1 = "nso_v1"
+The shipped Track D workbook template imports ``scripts._business_schema``.
+To keep all existing chapter runners working without edits, this file remains
+as the import surface, but the implementation now lives in
+``pystatsv1.trackd.schema``.
+"""
 
+from __future__ import annotations
 
-@dataclass(frozen=True)
-class TableSchema:
-    name: str
-    required_columns: tuple[str, ...]
-
-
-CONTRACT_TABLES: dict[str, TableSchema] = {
-    "chart_of_accounts": TableSchema(
-        name="chart_of_accounts.csv",
-        required_columns=("account_id", "account_name", "account_type", "normal_side"),
-    ),
-    "gl_journal": TableSchema(
-        name="gl_journal.csv",
-        required_columns=("txn_id", "date", "doc_id", "description", "account_id", "debit", "credit"),
-    ),
-    "trial_balance_monthly": TableSchema(
-        name="trial_balance_monthly.csv",
-        required_columns=(
-            "month",
-            "account_id",
-            "account_name",
-            "account_type",
-            "normal_side",
-            "debit",
-            "credit",
-            "ending_side",
-            "ending_balance",
-        ),
-    ),
-    "statements_is_monthly": TableSchema(
-        name="statements_is_monthly.csv",
-        required_columns=("month", "line", "amount"),
-    ),
-    "statements_bs_monthly": TableSchema(
-        name="statements_bs_monthly.csv",
-        required_columns=("month", "line", "amount"),
-    ),
-    "statements_cf_monthly": TableSchema(
-        name="statements_cf_monthly.csv",
-        required_columns=("month", "line", "amount"),
-    ),
-    "inventory_movements": TableSchema(
-        name="inventory_movements.csv",
-        required_columns=("month", "txn_id", "date", "sku", "movement_type", "qty", "unit_cost", "amount"),
-    ),
-    "fixed_assets": TableSchema(
-        name="fixed_assets.csv",
-        required_columns=(
-            "asset_id",
-            "asset_name",
-            "in_service_month",
-            "cost",
-            "useful_life_months",
-            "salvage_value",
-            "method",
-        ),
-    ),
-    "depreciation_schedule": TableSchema(
-        name="depreciation_schedule.csv",
-        required_columns=("month", "asset_id", "dep_expense", "accum_dep", "net_book_value"),
-    ),
-    # Chapter 5
-    "payroll_events": TableSchema(
-        name="payroll_events.csv",
-        required_columns=(
-            "month",
-            "txn_id",
-            "date",
-            "event_type",
-            "gross_wages",
-            "employee_withholding",
-            "employer_tax",
-            "cash_paid",
-            "wages_payable_delta",
-            "payroll_taxes_payable_delta",
-        ),
-    ),
-    "sales_tax_events": TableSchema(
-        name="sales_tax_events.csv",
-        required_columns=(
-            "month",
-            "txn_id",
-            "date",
-            "event_type",
-            "taxable_sales",
-            "tax_amount",
-            "cash_paid",
-            "sales_tax_payable_delta",
-        ),
-    ),
-    "debt_schedule": TableSchema(
-        name="debt_schedule.csv",
-        required_columns=("month", "loan_id", "txn_id", "beginning_balance", "payment", "interest", "principal", "ending_balance"),
-    ),
-    "equity_events": TableSchema(
-        name="equity_events.csv",
-        required_columns=("month", "txn_id", "date", "event_type", "amount"),
-    ),
-    "ap_events": TableSchema(
-        name="ap_events.csv",
-        required_columns=("month", "txn_id", "date", "vendor", "invoice_id", "event_type", "amount", "ap_delta", "cash_paid"),
-    ),
-    # Chapter 6
-    "ar_events": TableSchema(
-        name="ar_events.csv",
-        required_columns=("month", "txn_id", "date", "customer", "invoice_id", "event_type", "amount", "ar_delta", "cash_received"),
-    ),
-    "bank_statement": TableSchema(
-        name="bank_statement.csv",
-        required_columns=("month", "bank_txn_id", "posted_date", "description", "amount", "gl_txn_id"),
-    ),
-}
-
-NSO_V1_TABLE_ORDER: tuple[str, ...] = (
-    "chart_of_accounts",
-    "gl_journal",
-    "trial_balance_monthly",
-    "statements_is_monthly",
-    "statements_bs_monthly",
-    "statements_cf_monthly",
-    "inventory_movements",
-    "fixed_assets",
-    "depreciation_schedule",
-    # Chapter 5
-    "payroll_events",
-    "sales_tax_events",
-    "debt_schedule",
-    "equity_events",
-    "ap_events",
-    # Chapter 6
-    "ar_events",
-    "bank_statement",
+from pystatsv1.trackd.schema import (
+    DATASET_NSO_V1,
+    NSO_V1,
+    TableSchema,
+    assert_schema,
+    validate_schema,
+    validate_table_map,
 )
 
-NSO_V1_TABLES: tuple[TableSchema, ...] = tuple(CONTRACT_TABLES[k] for k in NSO_V1_TABLE_ORDER)
-
-
-def schemas_for_dataset(dataset: str) -> tuple[TableSchema, ...]:
-    if dataset == DATASET_NSO_V1:
-        return NSO_V1_TABLES
-    raise ValueError(f"Unknown dataset: {dataset}")
-
-
-def validate_schema(datadir: Path, dataset: str) -> dict[str, Any]:
-    """Validate presence + required columns. Returns a report dict."""
-    report: dict[str, Any] = {
-        "dataset": dataset,
-        "datadir": str(datadir),
-        "missing_tables": [],
-        "tables": {},
-        "ok": True,
-    }
-
-    for schema in schemas_for_dataset(dataset):
-        table_path = datadir / schema.name
-        if not table_path.exists():
-            report["missing_tables"].append(schema.name)
-            report["tables"][schema.name] = {
-                "exists": False,
-                "missing_columns": list(schema.required_columns),
-            }
-            report["ok"] = False
-            continue
-
-        df = pd.read_csv(table_path)
-        cols = set(map(str, df.columns))
-        missing = [c for c in schema.required_columns if c not in cols]
-        report["tables"][schema.name] = {
-            "exists": True,
-            "n_rows": int(df.shape[0]),
-            "missing_columns": missing,
-        }
-        if missing:
-            report["ok"] = False
-
-    return report
+__all__ = [
+    "DATASET_NSO_V1",
+    "NSO_V1",
+    "TableSchema",
+    "validate_schema",
+    "validate_table_map",
+    "assert_schema",
+]