Spaces:

Politrees
/

Steganography

Running

App Files Files Community

Politrees commited on Dec 9, 2024

Commit

2b77930

verified ·

1 Parent(s): af70f43

Update steganography.py

Browse files

Files changed (1) hide show

steganography.py +3 -9

steganography.py CHANGED Viewed

@@ -10,8 +10,6 @@ from PIL import Image, ImageDraw, ImageFont
 DEFAULT_FONT_PATH = "/usr/share/fonts/truetype/dejavu/DejaVuSans-Bold.ttf"
 DEFAULT_SAMPLE_RATE = 22050
-N_MELS = 128  # Количество мел-частотных полос
-N_FFT = 2048  # Длина окна FFT
 logging.basicConfig(level=logging.INFO)
@@ -56,11 +54,7 @@ def create_text_image(text, font, base_width=512, height=256, margin=10, letter_
 def spectrogram_image_to_audio(image, sr=DEFAULT_SAMPLE_RATE):
     flipped_image = np.flipud(image)
     S = flipped_image.astype(np.float32) / 255.0 * 100.0
-    # Ensure the spectrogram has the correct shape
-    S = librosa.util.fix_length(S, size=N_MELS)
-    y = librosa.griffinlim(S, n_iter=60, window='hann', n_fft=N_FFT, hop_length=N_FFT//4)
     return y
 def create_audio_with_spectrogram(text, base_width, height, max_font_size, margin, letter_spacing):
@@ -72,7 +66,7 @@ def create_audio_with_spectrogram(text, base_width, height, max_font_size, margi
         audio_path = temp_audio.name
         sf.write(audio_path, y, DEFAULT_SAMPLE_RATE)
-    S = librosa.feature.melspectrogram(y=y, sr=DEFAULT_SAMPLE_RATE, n_mels=N_MELS, n_fft=N_FFT)
     S_dB = librosa.power_to_db(S, ref=np.max)
     plt.figure(figsize=(10, 4))
     librosa.display.specshow(S_dB, sr=DEFAULT_SAMPLE_RATE, x_axis="time", y_axis="mel")
@@ -88,7 +82,7 @@ def create_audio_with_spectrogram(text, base_width, height, max_font_size, margi
 def display_audio_spectrogram(audio_path):
     y, sr = librosa.load(audio_path, sr=None)
-    S = librosa.feature.melspectrogram(y=y, sr=sr, n_mels=N_MELS, n_fft=N_FFT)
     S_dB = librosa.power_to_db(S, ref=np.max)
     plt.figure(figsize=(10, 4))

 DEFAULT_FONT_PATH = "/usr/share/fonts/truetype/dejavu/DejaVuSans-Bold.ttf"
 DEFAULT_SAMPLE_RATE = 22050
 logging.basicConfig(level=logging.INFO)
 def spectrogram_image_to_audio(image, sr=DEFAULT_SAMPLE_RATE):
     flipped_image = np.flipud(image)
     S = flipped_image.astype(np.float32) / 255.0 * 100.0
+    y = librosa.griffinlim(S)
     return y
 def create_audio_with_spectrogram(text, base_width, height, max_font_size, margin, letter_spacing):
         audio_path = temp_audio.name
         sf.write(audio_path, y, DEFAULT_SAMPLE_RATE)
+    S = librosa.feature.melspectrogram(y=y, sr=DEFAULT_SAMPLE_RATE)
     S_dB = librosa.power_to_db(S, ref=np.max)
     plt.figure(figsize=(10, 4))
     librosa.display.specshow(S_dB, sr=DEFAULT_SAMPLE_RATE, x_axis="time", y_axis="mel")
 def display_audio_spectrogram(audio_path):
     y, sr = librosa.load(audio_path, sr=None)
+    S = librosa.feature.melspectrogram(y=y, sr=sr)
     S_dB = librosa.power_to_db(S, ref=np.max)
     plt.figure(figsize=(10, 4))