From ef0e93c4b4aa7c34b05a5be3a1a5212a7e0969c5 Mon Sep 17 00:00:00 2001
From: charles <rxxtmail@gmail.com>
Date: Sat, 23 Aug 2025 21:32:12 -0700
Subject: [PATCH] Fix the token tracking

---
 app/services/provider_service.py | 26 ++++++++------------------
 1 file changed, 8 insertions(+), 18 deletions(-)

diff --git a/app/services/provider_service.py b/app/services/provider_service.py
index 7c74622..ef50406 100644
--- a/app/services/provider_service.py
+++ b/app/services/provider_service.py
@@ -675,12 +675,10 @@ async def process_request(
                 usage = result.get("usage", {})
                 input_tokens = usage.get("prompt_tokens", 0)
                 output_tokens = usage.get("completion_tokens", 0)
-                cached_tokens = usage.get("prompt_tokens_details", {}).get(
-                    "cached_tokens", 0
-                )
-                reasoning_tokens = usage.get("completion_tokens_details", {}).get(
-                    "reasoning_tokens", 0
-                )
+                prompt_tokens_details = usage.get("prompt_tokens_details", {}) or {}
+                completion_tokens_details = usage.get("completion_tokens_details", {}) or {}
+                cached_tokens = prompt_tokens_details.get("cached_tokens", 0)
+                reasoning_tokens = completion_tokens_details.get("reasoning_tokens", 0)
 
             asyncio.create_task(
                 update_usage_in_background(
@@ -750,18 +748,10 @@ async def token_counting_stream() -> AsyncGenerator[bytes, None]:
                                         output_tokens += (
                                             usage.get("completion_tokens", 0) or 0
                                         )
-                                        cached_tokens += (
-                                            usage.get("prompt_tokens_details", {}).get(
-                                                "cached_tokens", 0
-                                            )
-                                            or 0
-                                        )
-                                        reasoning_tokens += (
-                                            usage.get(
-                                                "completion_tokens_details", {}
-                                            ).get("reasoning_tokens", 0)
-                                            or 0
-                                        )
+                                        prompt_tokens_details = usage.get("prompt_tokens_details", {}) or {}
+                                        completion_tokens_details = usage.get("completion_tokens_details", {}) or {}
+                                        cached_tokens += prompt_tokens_details.get("cached_tokens", 0)
+                                        reasoning_tokens += completion_tokens_details.get("reasoning_tokens", 0)
 
                                     # Extract content from the chunk based on OpenAI format
                                     if "choices" in data: