Reconocimiento de Lengua de Señas Colombiana con MediaPipe + TensorFlow
- Extrae keypoints de video (MediaPipe)
- Predice palabras en tiempo real
- Valida las predicciones contra la transcripción (Whisper) y genera nuevos clips para re-entrenar
- Entrena un modelo LSTM con los clips validados
Grabaciones de noticieros o transmisiones en vivo donde un intérprete de LSM traduzca la voz en tiempo real.
El intérprete debe aparecer de medio cuerpo (de la cintura hacia arriba), de frente y sin cortes bruscos de cámara.
entre mejor sea la calidad del video mejor.
# 1. Clona
git clone https://github.com/WilliamDevUT/data_miner_lsc.git
cd data_miner_lsc
## 2. Crea y activa los ambientes
cd ai_trainer
py -3.10 -m venv venv_dm # data_miner
cd..
cd data_miner
py -3.10 -m venv venv_ai # ai_trainer
cd..
# 3. Instala dependencias para ambos ambientes
venv_dm\Scripts\activate # Linux/mac: source venv_dm/bin/activate
pip install -r requirements/data_miner.txt
venv_ai\Scripts\activate
pip install -r requirements/ai_trainer.txt
# 4. Crea un .env y añade tu GROQ_API_KEY
Regístrate en https://console.groq.com → API Keys
Crea .env en la carpeta de data_miner:
`GROQ_API_KEY=gsk_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx`
Mira setup.md para todos los pasos de instalación (ffmpeg, claves API, etc.).
(https://github.com/WilliamDevUT/data_miner_lsc/blob/main/docs/setup.md)
| Paso | Comando | Descripción |
|---|---|---|
| 1 | python data_miner/mining_data.py --url YOU_TUBE_URL |
Descarga → segmentos → keypoints |
| 2 | python ai_trainer/predicting_data.py --mode latest |
Predice último video |
| 3 | python ai_trainer/predicting_data.py --mode validate --full-pipeline |
Corta clips buenos/malos y actualiza dataset |
| 4 | python ai_trainer/training_model.py |
Entrena modelo (auto-guarda con fecha) |
- Python 3.10
- ffmpeg (en PATH)
- Groq API key (opcional, para transcripción rápida)