video-ffmpeg

Sleeping

App Files Files Community

Tim13ekd commited on Dec 14, 2025

Commit

bbb5565

verified ·

1 Parent(s): 2f3dcbb

Update app.py

Browse files

Files changed (1) hide show

app.py +12 -17

app.py CHANGED Viewed

@@ -34,11 +34,10 @@ def save_temp_audio(audio_file):
     else:
         raise ValueError("Das übergebene Audio ist kein gültiges Dateiformat oder NamedString.")
-def generate_slideshow_with_audio(images, input_text, duration_per_word=0.5, duration_per_image=3, y_pos=0.5, fade_duration=0.7, font_size=60, audio_file=None):
     if not images:
         return None, "❌ Keine Bilder ausgewählt"
-    y_pos = min(max(0.0, y_pos), 0.9)
     temp_dir = tempfile.mkdtemp()
     clips = []
@@ -55,10 +54,6 @@ def generate_slideshow_with_audio(images, input_text, duration_per_word=0.5, dur
     for i, img_path in enumerate(images):
         img_path = Path(img_path.name)  # Sicherstellen, dass es den richtigen Pfad hat
         clip_path = Path(temp_dir) / f"clip_{i}.mp4"
-        # Berechnen der Dauer für das aktuelle Wort
-        word = words[i % total_words]  # Wenn weniger Wörter als Bilder, wiederholen wir den Text
-        text = word
         vf_filters = (
             "scale=w=1280:h=720:force_original_aspect_ratio=decrease,"
@@ -66,16 +61,7 @@ def generate_slideshow_with_audio(images, input_text, duration_per_word=0.5, dur
             "fps=25,format=yuv420p"
         )
-        if text:
-            # Sichere Textverarbeitung (Escape von Sonderzeichen)
-            safe_text = shlex.quote(text)
-            drawtext_filter = (
-                f",drawtext=text={safe_text}:fontcolor=white:fontsize={font_size}:borderw=2:"
-                f"x=(w-text_w)/2:y=(h-text_h)*{y_pos}:"
-                f"alpha='if(lt(t,{fade_duration}), t/{fade_duration}, if(lt(t,{duration_per_word}-{fade_duration}), 1, ({duration_per_word}-t)/{fade_duration}))'"
-            )
-            vf_filters += drawtext_filter
         cmd = [
             "ffmpeg",
             "-y",
@@ -114,6 +100,15 @@ def generate_slideshow_with_audio(images, input_text, duration_per_word=0.5, dur
     except subprocess.CalledProcessError as e:
         return None, f"❌ FFmpeg Concat Fehler:\n{e.stderr}"
     # Audio hinzufügen, falls vorhanden
     if temp_audio_file:
         final_output = Path(temp_dir) / f"slideshow_audio_{uuid.uuid4().hex}.mp4"
@@ -137,7 +132,7 @@ def generate_slideshow_with_audio(images, input_text, duration_per_word=0.5, dur
 # Gradio UI
 with gr.Blocks() as demo:
-    gr.Markdown("# Slideshow mit Audio und Wort-Text")
     img_input = gr.Files(label="Bilder auswählen (mehrere)", file_types=allowed_medias)
     text_input = gr.Textbox(

     else:
         raise ValueError("Das übergebene Audio ist kein gültiges Dateiformat oder NamedString.")
+def generate_slideshow_with_audio(images, input_text, duration_per_word=0.5, duration_per_image=3, fade_duration=0.7, font_size=60, y_pos=0.5, audio_file=None):
     if not images:
         return None, "❌ Keine Bilder ausgewählt"
     temp_dir = tempfile.mkdtemp()
     clips = []
     for i, img_path in enumerate(images):
         img_path = Path(img_path.name)  # Sicherstellen, dass es den richtigen Pfad hat
         clip_path = Path(temp_dir) / f"clip_{i}.mp4"
         vf_filters = (
             "scale=w=1280:h=720:force_original_aspect_ratio=decrease,"
             "fps=25,format=yuv420p"
         )
+        # Clips für jedes Bild erstellen (ohne Text auf Bild)
         cmd = [
             "ffmpeg",
             "-y",
     except subprocess.CalledProcessError as e:
         return None, f"❌ FFmpeg Concat Fehler:\n{e.stderr}"
+    # Text separat anzeigen
+    # Berechnung der Zeiten für jedes Wort
+    temp_text_file = Path(temp_dir) / "text.txt"
+    with open(temp_text_file, "w") as f:
+        for i, word in enumerate(words):
+            f.write(f"file '{str(output_file)}'\n")
+            f.write(f"duration {duration_per_word}\n")
+            f.write(f"word {word}\n")
     # Audio hinzufügen, falls vorhanden
     if temp_audio_file:
         final_output = Path(temp_dir) / f"slideshow_audio_{uuid.uuid4().hex}.mp4"
 # Gradio UI
 with gr.Blocks() as demo:
+    gr.Markdown("# Slideshow mit Audio und separatem Text")
     img_input = gr.Files(label="Bilder auswählen (mehrere)", file_types=allowed_medias)
     text_input = gr.Textbox(