Spaces:

bhuvanpatil24
/

SentinelAI

Running

App Files Files Community

SentinelAI / create_rag.py

bhuvanpatil24

Dockerized deployment

13ab844 2 months ago

raw

history blame contribute delete

3.63 kB

	"""
	Complete Application Initialization
	Initializes Complete RAG Pipeline (Retrieval + LLM)
	"""

	import chromadb
	import numpy as np
	import json
	from config.config import Config

	# RAG Pipeline Components
	from services.QueryNormalizer import QueryNormalizer
	from rbac.RBACEngine import RBACEngine
	from rbac.VectorRetriever import VectorRetriever
	from services.ReRanker import ReRanker
	from rag.llm_service import LLMService
	from rag.prompt_builder import PromptBuilder
	from rag.RAGPipeline import CompleteRAGPipeline


	def create_complete_rag_pipeline(
	chroma_client,
	chunks,
	metadata,
	embeddings,
	rbac_config,
	abbreviations,
	audit_logger
	):
	"""
	Create and configure the complete RAG pipeline with LLM integration

	Args:
	chroma_client: ChromaDB client instance
	chunks: List of document chunks
	metadata: List of chunk metadata
	embeddings: Numpy array of embeddings
	rbac_config: RBAC configuration dictionary
	audit_logger: AuditLogger instance

	Returns:
	Initialized CompleteRAGPipeline instance
	"""

	# Initialize query normalizer

	normalizer = QueryNormalizer(abbreviations)

	# Initialize RBAC with default admin role (will be overridden per request)
	rbac = RBACEngine(
	user_roles=[],
	rbac_config=rbac_config,
	audit_logger=audit_logger
	)

	# Initialize vector retriever
	retriever = VectorRetriever(
	chroma_client=chroma_client,
	chunks=chunks,
	metadata=metadata,
	embeddings=embeddings,
	model_name="all-MiniLM-L6-v2",
	audit_logger=audit_logger
	)

	# Initialize re-ranker
	ranker = ReRanker(
	similarity_threshold=0.3,
	audit_logger=audit_logger
	)

	# Initialize LLM service
	llm_service = LLMService(audit_logger=audit_logger)

	# Initialize prompt builder
	prompt_builder = PromptBuilder()

	# Create complete pipeline
	pipeline = CompleteRAGPipeline(
	normalizer=normalizer,
	retriever=retriever,
	rbac=rbac,
	ranker=ranker,
	llm_service=llm_service,
	prompt_builder=prompt_builder,
	audit_logger=audit_logger
	)

	assert pipeline.validate_pipeline(), "Pipeline validation failed"

	return pipeline

	def load_real_data():
	"""
	Load chunks, metadata, embeddings, and vector DB from disk
	"""
	with open(Config.CHUNKS_PATH, "r", encoding="utf-8") as f:
	chunks = json.load(f)

	with open(Config.METADATA_PATH, "r", encoding="utf-8") as f:
	metadata = json.load(f)

	with open(Config.RBAC_PERMISSIONS_PATH, "r", encoding="utf-8") as f:
	rbac_config = json.load(f)

	with open(Config.ABBREVIATIONS_PATH, "r", encoding="utf-8") as f:
	abbreviations = json.load(f)

	embeddings = np.load(Config.EMBEDDINGS_PATH)

	chroma_client = chromadb.PersistentClient(
	path=Config.VECTOR_DB_PATH,
	)

	return chroma_client, chunks, metadata, embeddings, rbac_config, abbreviations

	from functools import lru_cache
	@lru_cache(maxsize=1)
	def bootstrap_application(audit_logger):

	audit_logger.log_info("Loading real document data...")
	chroma_client, chunks, metadata, embeddings, rbac_config, abbreviations = load_real_data()

	audit_logger.log_info("Initializing RAG pipeline...")
	rag_pipeline = create_complete_rag_pipeline(
	chroma_client,
	chunks,
	metadata,
	embeddings,
	rbac_config,
	abbreviations,
	audit_logger
	)
	return rag_pipeline