billwuhao
diff --git a/‎DiffRhythmNode.py‎
Lines changed: 2 additions & 48 deletions b/‎DiffRhythmNode.py‎
Lines changed: 2 additions & 48 deletions
diff --git a/‎MWAudioRecorderDR.py‎
Lines changed: 5 additions & 6 deletions b/‎MWAudioRecorderDR.py‎
Lines changed: 5 additions & 6 deletions
diff --git a/‎dataset/__init__.py‎ ‎dr_dataset/__init__.py‎dataset/__init__.py renamed to dr_dataset/__init__.py b/‎dataset/__init__.py‎ ‎dr_dataset/__init__.py‎dataset/__init__.py renamed to dr_dataset/__init__.py
diff --git a/‎dataset/dataset.py‎ ‎dr_dataset/dataset.py‎dataset/dataset.py renamed to dr_dataset/dataset.py b/‎dataset/dataset.py‎ ‎dr_dataset/dataset.py‎dataset/dataset.py renamed to dr_dataset/dataset.py
diff --git a/‎dataset/latent/2626046476.pt‎ ‎dr_dataset/latent/2626046476.pt‎dataset/latent/2626046476.pt renamed to dr_dataset/latent/2626046476.pt b/‎dataset/latent/2626046476.pt‎ ‎dr_dataset/latent/2626046476.pt‎dataset/latent/2626046476.pt renamed to dr_dataset/latent/2626046476.pt
diff --git a/‎dataset/latent/28528706.pt‎ ‎dr_dataset/latent/28528706.pt‎dataset/latent/28528706.pt renamed to dr_dataset/latent/28528706.pt b/‎dataset/latent/28528706.pt‎ ‎dr_dataset/latent/28528706.pt‎dataset/latent/28528706.pt renamed to dr_dataset/latent/28528706.pt
diff --git a/‎dataset/latent/547512549.pt‎ ‎dr_dataset/latent/547512549.pt‎dataset/latent/547512549.pt renamed to dr_dataset/latent/547512549.pt b/‎dataset/latent/547512549.pt‎ ‎dr_dataset/latent/547512549.pt‎dataset/latent/547512549.pt renamed to dr_dataset/latent/547512549.pt
diff --git a/‎dataset/latent/549162241.pt‎ ‎dr_dataset/latent/549162241.pt‎dataset/latent/549162241.pt renamed to dr_dataset/latent/549162241.pt b/‎dataset/latent/549162241.pt‎ ‎dr_dataset/latent/549162241.pt‎dataset/latent/549162241.pt renamed to dr_dataset/latent/549162241.pt
diff --git a/‎dataset/lrc/2626046476.pt‎ ‎dr_dataset/lrc/2626046476.pt‎dataset/lrc/2626046476.pt renamed to dr_dataset/lrc/2626046476.pt b/‎dataset/lrc/2626046476.pt‎ ‎dr_dataset/lrc/2626046476.pt‎dataset/lrc/2626046476.pt renamed to dr_dataset/lrc/2626046476.pt
diff --git a/‎dataset/lrc/28528706.pt‎ ‎dr_dataset/lrc/28528706.pt‎dataset/lrc/28528706.pt renamed to dr_dataset/lrc/28528706.pt b/‎dataset/lrc/28528706.pt‎ ‎dr_dataset/lrc/28528706.pt‎dataset/lrc/28528706.pt renamed to dr_dataset/lrc/28528706.pt
@@ -122,7 +122,7 @@ def INPUT_TYPES(cls):
                 },
         }
 
-    CATEGORY = "MW/MW-DiffRhythm"
+    CATEGORY = "🎤MW/MW-DiffRhythm"
     RETURN_TYPES = ("STRING",)
     RETURN_NAMES = ("prompt",)
     FUNCTION = "promptgen"
@@ -166,7 +166,7 @@ def INPUT_TYPES(cls):
             },
         }
 
-    CATEGORY = "MW/MW-DiffRhythm"
+    CATEGORY = "🎤MW/MW-DiffRhythm"
     RETURN_TYPES = ("AUDIO",)
     RETURN_NAMES = ("audio",)
     FUNCTION = "diffrhythmgen"
@@ -295,52 +295,6 @@ def get_text_style_prompt(self, model, text_prompt):
 
         return text_emb
 
-
-    # @torch.no_grad()
-    # def get_style_prompt(self, model, audio=None, prompt=None):
-    #     mulan = model
-
-    #     if prompt is not None:
-    #         return mulan(texts=prompt).half()
-
-    #     if audio is None:
-    #         raise ValueError("Audio data or style prompt must be provided")
-
-    #     waveform = audio["waveform"]
-    #     sample_rate = audio["sample_rate"]
-        
-    #     # Ensure waveform has correct shape
-    #     if len(waveform.shape) == 3:  # [1, channels, samples]
-    #         waveform = waveform.squeeze(0)
-    #     if waveform.shape[0] > 1:  # If stereo, convert to mono
-    #         waveform = waveform.mean(0, keepdim=True)
-
-    #     # Calculate audio length (seconds)
-    #     audio_len = waveform.shape[-1] / sample_rate
-        
-    #     if audio_len < 10:
-    #         raise ValueError(f"Audio too short ({audio_len:.2f}s), minimum 10 seconds required.")
-
-    #     # Extract middle 10-second segment
-    #     mid_time = int((audio_len // 2) * sample_rate)
-    #     start_sample = mid_time - int(5 * sample_rate)
-    #     end_sample = start_sample + int(10 * sample_rate)
-    #     wav_segment = waveform[..., start_sample:end_sample]
-
-    #     # Resample to 24kHz
-    #     if sample_rate != 24000:
-    #         wav_segment = torchaudio.transforms.Resample(sample_rate, 24000)(wav_segment)
-
-    #     # Ensure correct shape and device
-    #     wav = wav_segment.to(model.device)
-    #     if len(wav.shape) == 1:
-    #         wav = wav.unsqueeze(0)
-
-    #     with torch.no_grad():
-    #         audio_emb = mulan(wavs=wav)  # [1, 512]
-
-    #     audio_emb = audio_emb.half()
-    #     return audio_emb
 
     def prepare_model(self, model, device, unload_model=False):
         # prepare tokenizer
 
@@ -17,7 +17,6 @@ def INPUT_TYPES(cls):
                 "record_sec": ("INT", {
                     "default": 5,
                     "min": 1,
-                    "max": 60,
                     "step": 1
                 }),
                 "sample_rate": (["16000", "44100", "48000"], {
@@ -31,14 +30,14 @@ def INPUT_TYPES(cls):
                 }),
                 "sensitivity": ("FLOAT", {
                     "default": 1.2,
-                    "min": 0.5,
+                    "min": 0.1,
                     "max": 3.0,
                     "step": 0.1
                 }),
                 "smooth": ("INT", {
-                    "default": 5,
-                    "min": 1,
-                    "max": 11,
+                    "default": 1,
+                    "min": 5,
+                    "max": 7,
                     "step": 2
                 }),
                 "seed": ("INT", {
@@ -52,7 +51,7 @@ def INPUT_TYPES(cls):
     RETURN_TYPES = ("AUDIO",)
     RETURN_NAMES = ("audio",)
     FUNCTION = "record_and_clean"
-    CATEGORY = "MW/MW-DiffRhythm"
+    CATEGORY = "🎤MW/MW-DiffRhythm"
 
     def _stft(self, y, n_fft):
         hop = n_fft // 4