Fix QMoE blockwise quantization support for TRT-RTX execution provider #1926

anujj · 2025-12-19T13:35:19Z

Add QMoE and BF16 support for TRT-RTX execution provider

anujj · 2026-01-06T08:35:51Z

…quantization

anujj marked this pull request as draft December 19, 2025 13:35

anujj marked this pull request as ready for review January 6, 2026 08:37

anujj added 2 commits January 6, 2026 17:01

Fix QMoE blockwise quantization support for TRT-RTX execution provider

581a564

remvoed madding

9f88bcd

anujj force-pushed the gpt_oss_trt_rtx branch from b9d8d44 to 9f88bcd Compare January 6, 2026 11:33

anujj added 2 commits January 6, 2026 17:39

trt-rtx guarg

9ae34f6

Only add zero_points inputs to QMoE when needed for Quark asymmetric …

6d4ebca

…quantization

Provide feedback