improve simple_rag

lucebert · lucebert · commit 8145afcbcda2 · 2025-03-04T10:39:04.000+01:00
diff --git a/.env.example b/.env.example
@@ -1,30 +1,11 @@
 # To separate your traces from other application
 LANGSMITH_PROJECT=rag-research-agent
 
-# The following depend on your selected configuration
-
-# LLM choice:
-ANTHROPIC_API_KEY=....
-FIREWORKS_API_KEY=...
 OPENAI_API_KEY=...
 
-# Retrieval provider
-
-## Elastic cloud:
-ELASTICSEARCH_URL=...
-ELASTICSEARCH_API_KEY=...
-
-## Elastic local:
-ELASTICSEARCH_URL=http://host.docker.internal:9200
-ELASTICSEARCH_USER=elastic
-ELASTICSEARCH_PASSWORD=changeme
-
 ## Pinecone
 PINECONE_API_KEY=...
 PINECONE_INDEX_NAME=...
 
-## Mongo Atlas
-MONGODB_URI=... # Full connection string
-
 ## Index API key
 INDEX_API_KEY=...
diff --git a/src/simple_rag/configuration.py b/src/simple_rag/configuration.py
@@ -0,0 +1,21 @@
+"""Define the configurable parameters for the agent."""
+
+from __future__ import annotations
+
+from dataclasses import dataclass, field
+from typing import Annotated
+
+from shared.configuration import BaseConfiguration
+
+
+@dataclass(kw_only=True)
+class RagConfiguration(BaseConfiguration):
+    """The configuration for the agent."""
+
+    # models
+    model: Annotated[str, {"__template_metadata__": {"kind": "llm"}}] = field(
+        default="openai/gpt-4o-mini",
+        metadata={
+            "description": "The language model used for processing and refining queries. Should be in the form: provider/model-name."
+        },
+    )
diff --git a/src/simple_rag/graph.py b/src/simple_rag/graph.py
@@ -2,15 +2,15 @@
 
 from langchain import hub
 from langchain_core.messages import HumanMessage
-from langchain_openai import ChatOpenAI
 from langgraph.graph import END, START, StateGraph
 
 from shared import retrieval
-from shared.configuration import BaseConfiguration
+from shared.utils import load_chat_model
+from simple_rag.configuration import RagConfiguration
 from simple_rag.state import GraphState, InputState
 
 
-def retrieve(state: GraphState, *, config) -> dict[str, list[str] | str]: 
+def retrieve(state: GraphState, *, config: RagConfiguration) -> dict[str, list[str] | str]: 
     """Retrieve documents
 
     Args:
@@ -29,7 +29,7 @@ def retrieve(state: GraphState, *, config) -> dict[str, list[str] | str]:
         return {"documents": documents, "message": state.messages}
 
 
-async def generate(state: GraphState):
+async def generate(state: GraphState, *, config: RagConfiguration):
     """
     Generate answer
 
@@ -43,21 +43,18 @@ async def generate(state: GraphState):
     messages = state.messages
     documents = state.documents
 
-    # RAG generation
-    # Prompt
     prompt = hub.pull("langchaindoc/simple-rag")
-
-    # LLM
-    llm = ChatOpenAI(model_name="gpt-4o-mini", temperature=0)
     
+    configuration = RagConfiguration.from_runnable_config(config)
+    model = load_chat_model(configuration.model)
 
     # Chain
-    rag_chain = prompt + messages | llm
+    rag_chain = prompt + messages | model
     response = await rag_chain.ainvoke({"context" : documents})
     return {"messages": [response], "documents": documents}
 
 
-workflow = StateGraph(GraphState, input=InputState, config_schema=BaseConfiguration)
+workflow = StateGraph(GraphState, input=InputState, config_schema=RagConfiguration)
 
 # Define the nodes
 workflow.add_node("retrieve", retrieve)