📌 Articles épinglés

dimanche 16 février 2025

🚀 Génération de sous-titres avec Subtitle Edit : Guide des moteurs de reconnaissance vocale 🎙️📜

La génération automatique de sous-titres (SRT) à partir de fichiers audio a considérablement évolué dans Subtitle Edit. Examinons les différentes options disponibles et leurs caractéristiques.

🔥 Les trois principaux moteurs

1️⃣ Faster Whisper XXL (Perfview) ⚡

✨ Le choix optimal actuel
✅ Transcription très rapide : 10-15 min pour 3h d'audio
Qualité supérieure aux autres modèles
✅ Excellente gestion de la ponctuation et des noms propres
Optimisé pour GPU 🎮
Meilleur compromis performance/qualité 🏆

2️⃣ Whisper CPP 🏗️

🔹 Alternative solide
✅ Plus rapide que Whisper original
✅ Deux modèles principaux :

  • small/small.en : 15-20 min pour 3h d'audio
  • medium : 30-45 min pour 3h d'audio
    ✅ Bon compromis pour machines moins puissantes 🖥️

3️⃣ VOSK 🏗️

⚡ Option légère mais limitée
✅ Traitement proche du temps réel (3h pour 3h d'audio)
✅ Modèles légers (100-200MB) 📦
❌ Moins précis que les solutions Whisper 😕
✅ Utile sur configurations modestes 💻


⚙️ Paramètres recommandés

🔹 Configuration optimale
📏 Format : Gap minimum de 50ms entre sous-titres
Durée par ligne : 2-3 secondes maximum
🔠 Maximum 42 caractères par ligne
🛠️ Options post-traitement :
✅ Fusion des lignes courtes 🔄
✅ Correction des erreurs communes ✏️
✅ Nettoyage Unicode 🔍
✅ Découpage des lignes longues ✂️


⏳ Comparatif des temps de traitement (audio de 3h)

⚙️ Moteur ⏱️ Temps approx. 📊 Qualité
Faster Whisper XXL 🔥 10-15 min ⭐ Excellente
Whisper CPP (small) ⚡ 15-20 min 👍 Bonne
Whisper CPP (medium) 🕒 30-45 min 🔥 Très bonne
VOSK 🐢 180 min 😐 Moyenne

Voici quelques alternatives pour la transcription automatique :

  • Gladia 🎤 : Service de transcription basé sur l'IA. 10h gratuites par mois.
  • Otter.ai 🦦 : Offre 600 minutes gratuites par mois (soit environ 10 heures).
  • Sonix 🎵 : Propose 30 minutes gratuites pour les nouveaux utilisateurs.
  • Trint ✍️ : Offre 7 jours d'essai gratuit (le nombre d'heures dépend de l'utilisation).
  • Microsoft Copilot 🤖 et IBM Watson OpenScale 🏢 : Proposent des essais ou des versions limitées, mais sans quota gratuit précisé.

Le problème avec les solutions en ligne, c'est qu'on peut rencontrer des bugs en cours d'upload. 🚨📤


🔍 Principaux problèmes détectés par le Netflix QC dans Subtitle Edit :

Le Netflix Quality Check (QC) est un processus de contrôle qualité que Netflix applique aux sous-titres et aux vidéos avant leur mise en ligne sur la plateforme. Ce contrôle vise à s'assurer que les sous-titres respectent les standards techniques et linguistiques de Netflix.

Lorsque vous travaillez avec Subtitle Edit, certains messages d'erreur ou avertissements peuvent apparaître en lien avec le Netflix QC. Voici les problèmes les plus courants et comment les corriger :

📌 1. Timing incorrect (Overlapping, Gaps, CPS)

  • Chevauchement de sous-titres → Vérifiez qu’aucun sous-titre ne commence avant la fin du précédent.
    🔹 Correction : Menu Outils → Rechercher erreurs → Chevauchement de sous-titres
  • Gaps trop courts ou trop longs → Netflix recommande un certain délai minimum entre les sous-titres.
    🔹 Correction : Ajustez via Durée minimale entre les sous-titres dans Ajuster les sous-titres
  • Nombre de caractères par seconde (CPS) trop élevé → Netflix impose une limite de lecture pour éviter une surcharge d’informations.
    🔹 Correction : Vérifiez via Outils → Lire avec CPS, puis raccourcissez les textes ou ajustez le timing.

📌 2. Erreurs de format (ligne trop longue, mauvais encodage, balises)

  • Lignes dépassant 42 caractères (en général) → Netflix impose une limite de longueur par ligne.
    🔹 Correction : Activez le mode 2 lignes et coupez intelligemment.
  • Encodage incorrect (UTF-8 requis) → Le fichier doit être en UTF-8 sans BOM.
    🔹 Correction : Menu Fichier → Enregistrer sous... → Choisir UTF-8
  • Balises non autorisées → Netflix accepte uniquement certaines balises HTML ( pour l’italique par exemple).
    🔹 Correction : Nettoyez via Outils → Rechercher erreurs → Balises non valides

📌 3. Problèmes linguistiques (orthographe, grammaire, style)

  • Majuscules excessives, ponctuation incorrecte, fautes d’orthographe
    🔹 Correction : Activez Outils → Correcteur orthographique
  • Traduction trop littérale ou non naturelle
    🔹 Correction : Vérifiez avec un glossaire Netflix si disponible.

Dernière étape : Refaire un contrôle qualité

Une fois les corrections appliquées, relancez la vérification dans Subtitle Edit via Outils → Rechercher erreurs pour voir si tout est corrigé.


🏁 Conclusion

🎯 Pour un usage actuel, Faster Whisper XXL est la meilleure option en combinant vitesse et précision.
💡 Si les ressources sont limitées, Whisper CPP (small) est un excellent compromis.
🛠️ VOSK reste une solution de dernier recours pour les configurations très modestes.

🎬 Bon sous-titrage ! 🎶💬

Aucun commentaire:

Enregistrer un commentaire