|
|
1 oră în urmă | |
|---|---|---|
| core | 17 ore în urmă | |
| static | 17 ore în urmă | |
| workers | 17 ore în urmă | |
| .gitignore | 17 ore în urmă | |
| README.md | 1 oră în urmă | |
| create_api_key.py | 17 ore în urmă | |
| create_user.py | 17 ore în urmă | |
| main.py | 17 ore în urmă | |
| requirements.txt | 17 ore în urmă |
API de transcripción de audio y video con identificación de hablantes (diarización).
Transcriptor es un servicio que convierte archivos de audio y video a texto utilizando Whisper (a través de faster-whisper) e identifica quién habla en cada momento mediante PyAnnote para diarización de hablantes.
pip install -r requirements.txt
Crear un archivo .env en la raíz del proyecto:
# Variables de entorno opcionales
uvicorn main:app --host 0.0.0.0 --port 8010 --reload
Accede a la interfaz web en: http://localhost:8010/
| Método | Endpoint | Descripción |
|---|---|---|
GET |
/auth/verify |
Verificar credenciales |
POST |
/auth/login |
Iniciar sesión |
POST |
/auth/logout |
Cerrar sesión |
POST |
/auth/change-password |
Cambiar contraseña |
| Método | Endpoint | Descripción |
|---|---|---|
POST |
/transcribe |
Enviar archivo para transcripción |
GET |
/jobs/{job_id} |
Consultar estado de un trabajo |
GET |
/jobs |
Listar trabajos del usuario |
GET |
/jobs/{job_id}/download/{fmt} |
Descargar resultado |
DELETE |
/jobs/{job_id} |
Eliminar un trabajo |
| Método | Endpoint | Descripción |
|---|---|---|
GET |
/admin/users |
Listar usuarios |
POST |
/admin/users |
Crear usuario |
DELETE |
/admin/users/{user_id} |
Eliminar usuario |
POST |
/admin/users/{user_id}/api-key |
Generar clave API |
GET |
/admin/metrics |
Métricas del sistema |
GET |
/admin/jobs |
Ver todos los trabajos |
| Modelo | Descripción |
|---|---|
large-v3 |
Mayor precisión (predeterminado) |
large-v2 |
Alta precisión |
medium |
Balance precisión/velocidad |
small |
Rápido |
base |
Más rápido |
srt — Subtítulos con marcas de tiempo y hablantestxt — Texto plano con etiquetas de hablantesrt_nh — Subtítulos sin identificación de hablantetxt_nh — Texto plano sin hablantesLos formatos sin hablante (_nh) omiten el paso de diarización y son más rápidos.
es, en, pt, fr, de, it, ja, zh, auto