Spaces:

n-sudheer
/

lora-gpt2-docker-space

Sleeping

Sudheer-N commited on Sep 25

Commit

795fd05

1 Parent(s): ab642aa

Fix: set HF cache to /app/cache to avoid permission error

Files changed (2) hide show

Dockerfile CHANGED Viewed

@@ -5,8 +5,10 @@ RUN pip install --no-cache-dir -r requirements.txt
 COPY app.py .
-# Hugging Face model cache
 RUN mkdir -p /app/cache
 ENV TRANSFORMERS_CACHE=/app/cache
 EXPOSE 7860

 COPY app.py .
+# Create cache dir and set env vars so HF/Transformers don't use `/`
 RUN mkdir -p /app/cache
+ENV HF_HOME=/app/cache
 ENV TRANSFORMERS_CACHE=/app/cache
 EXPOSE 7860

app.py CHANGED Viewed

@@ -3,6 +3,9 @@ from transformers import AutoTokenizer, AutoModelForCausalLM
 from peft import PeftModel
 import torch
 from pydantic import BaseModel
 app = FastAPI()
@@ -23,6 +26,8 @@ def generate_text(request: GenerationRequest):
     inputs = tokenizer(request.prompt, return_tensors="pt")
     outputs = model.generate(**inputs, max_length=request.max_length)
     text = tokenizer.decode(outputs[0], skip_special_tokens=True, do_sample=True, top_k=20)
     return {"generated_text": text}

 from peft import PeftModel
 import torch
 from pydantic import BaseModel
+import os
+os.environ["HF_HOME"] = "/app/cache"
+os.environ["TRANSFORMERS_CACHE"] = "/app/cache"
 app = FastAPI()
     inputs = tokenizer(request.prompt, return_tensors="pt")
     outputs = model.generate(**inputs, max_length=request.max_length)
     text = tokenizer.decode(outputs[0], skip_special_tokens=True, do_sample=True, top_k=20)
+    print("Input Prompt:", request.prompt)
+    print("Generated Text:", text)
     return {"generated_text": text}