video-ffmpeg

Running

App Files Files Community

Tim13ekd commited on 6 days ago

Commit

6dc3853

verified ·

1 Parent(s): ffc2502

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -17

app.py CHANGED Viewed

@@ -7,7 +7,7 @@ import requests
 import base64
 import math
 import shutil
-import shlex  # für sicheres Escapen von Text
 # Erlaubte Dateiformate
 allowed_medias = [".png", ".jpg", ".jpeg", ".bmp", ".gif", ".tiff"]
@@ -19,8 +19,18 @@ def save_temp_audio(audio_file):
     """
     Speichert die hochgeladene Datei sicher mit korrekter Endung in einem temporären Verzeichnis.
     """
-    # Prüfen, ob die Datei ein NamedTemporaryFile ist (was normalerweise erwartet wird)
-    if hasattr(audio_file, 'name'):  # Sicherstellen, dass es eine Datei ist
         ext = Path(audio_file.name).suffix
         if ext.lower() not in allowed_audios:
             ext = ".mp3"  # Standard, falls Endung fehlt
@@ -30,7 +40,7 @@ def save_temp_audio(audio_file):
             shutil.copyfileobj(audio_file, f)  # Kopiere den Inhalt der Datei
         return temp_audio
     else:
-        raise ValueError("Das übergebene Audio ist kein gültiges Dateiformat")
 def convert_to_wav(audio_path):
     wav_path = Path(audio_path).with_suffix(".wav")
@@ -181,16 +191,4 @@ with gr.Blocks() as demo:
     )
     duration_input = gr.Number(value=3, label="Dauer pro Bild in Sekunden", precision=1)
     fade_input = gr.Number(value=0.7, label="Fade Dauer in Sekunden", precision=1)
-    ypos_input = gr.Slider(minimum=0.0, maximum=0.9, step=0.01, value=0.5, label="Y-Position für alle Texte (0=oben, 0.5=mitte, 0.9=unten)")
-    font_size_input = gr.Number(value=60, label="Textgröße (px)")
-    out_video = gr.Video(interactive=False, label="Generiertes Video")
-    status = gr.Textbox(interactive=False, label="Status")
-    btn = gr.Button("Video erstellen")
-    btn.click(
-        fn=generate_slideshow_with_audio,
-        inputs=[img_input, audio_input, duration_input, ypos_input, fade_input, font_size_input],
-        outputs=[out_video, status]
-    )
-demo.launch()

 import base64
 import math
 import shutil
+import io  # Für NamedString-Handling
 # Erlaubte Dateiformate
 allowed_medias = [".png", ".jpg", ".jpeg", ".bmp", ".gif", ".tiff"]
     """
     Speichert die hochgeladene Datei sicher mit korrekter Endung in einem temporären Verzeichnis.
     """
+    # Wenn audio_file ein NamedString (Byte-Inhalt) ist
+    if isinstance(audio_file, str):  # Gradio gibt es als NamedString zurück, wenn es sich um einen String handelt
+        # Hier können wir die Datei als binären Inhalt behandeln
+        ext = Path(audio_file).suffix
+        if ext.lower() not in allowed_audios:
+            ext = ".mp3"  # Standard, falls Endung fehlt
+        temp_audio = Path(tempfile.mkdtemp()) / f"input{ext}"
+        with open(temp_audio, "wb") as f:
+            f.write(audio_file.encode())  # Binäre Datei schreiben
+        return temp_audio
+    elif hasattr(audio_file, 'name'):  # Wenn es sich um eine echte Datei handelt
         ext = Path(audio_file.name).suffix
         if ext.lower() not in allowed_audios:
             ext = ".mp3"  # Standard, falls Endung fehlt
             shutil.copyfileobj(audio_file, f)  # Kopiere den Inhalt der Datei
         return temp_audio
     else:
+        raise ValueError("Das übergebene Audio ist kein gültiges Dateiformat oder NamedString.")
 def convert_to_wav(audio_path):
     wav_path = Path(audio_path).with_suffix(".wav")
     )
     duration_input = gr.Number(value=3, label="Dauer pro Bild in Sekunden", precision=1)
     fade_input = gr.Number(value=0.7, label="Fade Dauer in Sekunden", precision=1)
+    ypos_input = gr.Slider(minimum=0.0, maximum=0.9, step=0.01, value=0.5, label="Y-Position für alle Texte (0=oben, 0