-
Notifications
You must be signed in to change notification settings - Fork 2.1k
Update WAV File Naming and Dependencies 📝🔊 #1091
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Conversation
|
@danhtran2mind feel free to check if work, when available |
|
Hi @danhtran2mind have you checked if pr ready to merge? |
2025-06-24 14:45:40.941955: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:477] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
WARNING: All log messages before absl::InitializeLog() is called are written to STDERR
E0000 00:00:1750776340.962481 7940 cuda_dnn.cc:8310] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
E0000 00:00:1750776340.968713 7940 cuda_blas.cc:1418] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered
2025-06-24 14:45:40.989618: I tensorflow/core/platform/cpu_feature_guard.cc:210] This TensorFlow binary is optimized to use available CPU instructions in performance-critical operations.
To enable the following instructions: AVX2 AVX512F FMA, in other operations, rebuild TensorFlow with the appropriate compiler flags.
Download Vocos from huggingface charactr/vocos-mel-24khz
Using F5TTS_v1_Base...
vocab : ./ckpts/vocab.txt
token : custom
model : ./ckpts/ckpts/model_last.pt
Voice: main
ref_audio /content/viet_male_22.05k.mp3
Converting audio...
Using custom reference text...
ref_text nhưng mà, chủ đề hôm nay chúng tôi sẽ nói, trao đổi, bình luận và vẽ về cái chủ đề nó còn nóng hơn thời tiết Hà Nội thưa tất cả mọi người và đó chính là.
ref_audio_ /tmp/tmp21hppvm7.wav
No voice tag found, using main.
Voice: main
gen_text 0 Món ăn này nổi bật với thịt mán bản địa, được nướng vàng ươm, mềm ngọt tự nhiên. Những miếng thịt có da giòn rụm, kết hợp với phần thịt mọng nước, thơm lừng,
gen_text 1 trong khi riềng mang đến hương vị nhẹ nhàng mà không lấn át. Khi ăn kết hợp cùng rau thơm để cân bằng độ béo và mẻ để tăng chiều sâu.
gen_text 2 Các thẩm định viên Michelin đánh giá món ăn này mang đến sự hòa quyện tuyệt vời giữa vị khói, đậm đà và thơm lừng, chắc chắn sẽ khiến bạn nhớ mãi.
gen_text 3 Khó cưỡng cơm cháy bò kho ở quán Mậu Dịch
Cơm cháy chiên giòn rụm, vàng ươm, được tạo hình như một chiếc bát, mang vị ngọt tự nhiên từ gạo,
gen_text 4 đủ sức làm hài lòng thực khách ngay cả khi ăn riêng. Tuy nhiên theo các chuyên gia Michelin, khi kết hợp với món bò kho đậm đà, món này thực sự bùng nổ.
gen_text 5 Thịt bò và gân bò được hầm trong nồi đất với nước dùng từ cà chua, hòa quyện cùng lá nguyệt quế, hồi và các loại gia vị khác. Tất cả cộng hưởng,
gen_text 6 cho ra một loại nước xốt đậm đà, béo ngậy, ngấm trong từng miếng thịt bò mềm, mang lại cảm giác ngon miệng và khó cưỡng.
gen_text 7 Lý tưởng phở lõi gầu ở phở bò Lâm
Nếu hay ăn sáng, quán phở bò này chính là điểm đến lý tưởng ở Hà Nội. Nước dùng đậm đà với vị béo của mỡ xương bò,
gen_text 8 hòa quyện cùng vị ngọt tự nhiên từ hành lá và hành tây.Generating audio in 9 batches...
100% 9/9 [00:42<00:00, 4.72s/it]
Traceback (most recent call last):
File "/usr/local/bin/f5-tts_infer-cli", line 8, in <module>
sys.exit(main())
^^^^^^
File "/content/F5-TTS/src/f5_tts/infer/infer_cli.py", line 361, in main
sf.write(
File "/usr/local/lib/python3.11/dist-packages/soundfile.py", line 363, in write
with SoundFile(file, 'w', samplerate, channels,
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "/usr/local/lib/python3.11/dist-packages/soundfile.py", line 690, in __init__
self._file = self._open(file, mode_int, closefd)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "/usr/local/lib/python3.11/dist-packages/soundfile.py", line 1265, in _open
raise LibsndfileError(err, prefix="Error opening {0!r}: ".format(self.name))
soundfile.LibsndfileError: Error opening 'tests/infer_cli_basic_chunks/0_Món ăn này nổi bật với thịt mán bản địa, được nướng vàng ươm, mềm ngọt tự nhiên.\n\nNhững miếng thịt có da giòn rụm, kết hợp với phần thịt mọng nước, thơm lừng, trong khi riềng mang đến hương vị nhẹ nhà ... .wav': System error.Everything is ok.
|
Yes, I did it. |


Added
unidecodetopyproject.tomldependencies for ASCII text normalization 📚.Modified
infer_cli.pyto useunidecodefor WAV file names of audio chunks 🎵. Previously, rawgen_text_could include non-ASCII characters (e.g., "Téxt" → "Text", "こんにちは" → "konnichiha", or Vietnamese "Tiếng Việt" → "Tieng Viet"), risking file system errors 🚫. Now,unidecodeensures ASCII-compliant names, maintaining the formatindex_unidecoded_text.wav. This enhances cross-platform compatibility and prevents naming issues on systems with strict character restrictions 🌐.