Spaces:

kurianbenoy
/

audioclassification

Runtime error

App Files Files Community

kurianbenoy commited on May 2, 2022

Commit

ef173f1

1 Parent(s): ffada9a

Update nbs

Browse files

Files changed (2) hide show

nbs/PytorchAudioInference.ipynb +18 -19
requirements.txt +3 -2

nbs/PytorchAudioInference.ipynb CHANGED Viewed

@@ -87,9 +87,9 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "base_folder = Path('../input/kaggle-pog-series-s01e02')\n",
     "\n",
-    "items = get_files(base_folder, extensions='.ogg')"
    ]
   },
   {
@@ -110,7 +110,7 @@
     }
    ],
    "source": [
-    "items\n"
    ]
   },
   {
@@ -126,24 +126,23 @@
     "\n",
     "def create_spectrogram(filename):\n",
     "    audio, sr = torchaudio.load(filename)\n",
-    "    specgram = torchaudio.transforms.MelSpectrogram(sample_rate=sr, \n",
-    "                                                    n_fft=N_FFT, \n",
-    "                                                    win_length=N_FFT, \n",
-    "                                                    hop_length=HOP_LEN\n",
-    "                                                    ,\n",
-    "                                                    center=True,\n",
-    "                                                    pad_mode=\"reflect\",\n",
-    "                                                    power=2.0,\n",
-    "                                                    norm='slaney',\n",
-    "                                                    onesided=True,\n",
-    "                                                    n_mels=224,\n",
-    "                                                    mel_scale=\"htk\"\n",
-    "                                                   )(audio).mean(axis=0)\n",
     "    specgram = torchaudio.transforms.AmplitudeToDB()(specgram)\n",
     "    specgram = specgram - specgram.min()\n",
-    "    specgram = specgram/specgram.max()\n",
-    "    \n",
-    "    \n",
     "    return specgram"
    ]
   },

    "metadata": {},
    "outputs": [],
    "source": [
+    "base_folder = Path(\"../input/kaggle-pog-series-s01e02\")\n",
     "\n",
+    "items = get_files(base_folder, extensions=\".ogg\")"
    ]
   },
   {
     }
    ],
    "source": [
+    "items"
    ]
   },
   {
     "\n",
     "def create_spectrogram(filename):\n",
     "    audio, sr = torchaudio.load(filename)\n",
+    "    specgram = torchaudio.transforms.MelSpectrogram(\n",
+    "        sample_rate=sr,\n",
+    "        n_fft=N_FFT,\n",
+    "        win_length=N_FFT,\n",
+    "        hop_length=HOP_LEN,\n",
+    "        center=True,\n",
+    "        pad_mode=\"reflect\",\n",
+    "        power=2.0,\n",
+    "        norm=\"slaney\",\n",
+    "        onesided=True,\n",
+    "        n_mels=224,\n",
+    "        mel_scale=\"htk\",\n",
+    "    )(audio).mean(axis=0)\n",
     "    specgram = torchaudio.transforms.AmplitudeToDB()(specgram)\n",
     "    specgram = specgram - specgram.min()\n",
+    "    specgram = specgram / specgram.max()\n",
+    "\n",
     "    return specgram"
    ]
   },

requirements.txt CHANGED Viewed

@@ -1,3 +1,4 @@
-fastai
-huggingface_hub
 torchaudio

+fastai==2.6.0
+gradio==2.9.4
 torchaudio
+torchvision