Follow

🎧 vous voulez faire de la transcription audio de ou de sons avec le logicielLibre qui fonctionne hors ligne ?
essayez ceci forge.chapril.org/tykayn/trans

poke @aprilorg

· · Web · 7 · 16 · 10

nouvelle règle dans le readme

installez avec "make"
convertissez le fichier de démo avec "make convert file=input/demo.wav"

up: la transcription génère maintenant un vrai fichier sous titre .srt en plus du texte avec et sans précision de temps

@tykayn Merci \o/

NB : faudrait sauter à la ligne dans la partie Liens pour plus de lisibilité :-)

@Khrys oui on me l'a signalé aussi par ailleurs, j'ai clarifié les liens :)

@tykayn @aprilorg HĂ©las, cela demande un mot de passe pour avoir le droit de cloner...

@aprilorg @Khrys yup, j'ai modifié le readme pour utiliser le https et non ssh pour le git clone là ça devrait être bon sans mot de passe

@aprilorg @tykayn J'ai fait le git clone comme indiqué mais ça demande un mdp :

gitea@forge.chapril.org's password:

@tykayn
La sortie JSON de vosk est assez verbeuse, et pas directement exploitable.

J'ai fait un script perl de transformation que j'ai mis ici : paste.chapril.org/?4bdcfbb01ab

Ça prend le JSON en entrée, et ça sort les séquences de texte avec le timing de début du premier mot : "[23'12] ceci est un texte"

@aprilorg

=========
Note pour les puristes : oui, ça parse du JSON avec des regex et c'est MAL. Mais au moins, pas de problèmes de dépendances ^^

@r_a
cool merci je vais tester ça.
j'avais fait un truc avec jq pour ne sortir que les phrases, je vais voir comment inclure tout ça. merci !
@aprilorg

@tykayn

Est-ce que c'est quelque chose que l'on pourrait voir sur Peertube ?

@aprilorg

@Bristow_69 @aprilorg j'ai fait un essai avec une vidéo sur peertube et mis les sous titres bruts sortis du transcodage, ça marche pas mal, et ça fait gagner un temps fou.

démo ici de sous titre fr sur cette vidéo super bien de captain moustache pour
peertube.cipherbliss.com/video

des erreurs et des coupures de phrases à corriger, mais globalement très utile

@Bristow_69 @aprilorg
merci!
si tu arrives a faire marcher le dépot en suivant la documentation (si tu as la foi de faire de la ligne de commande) tu me dis :)

j'en ai profité pour parler de ce dépot de transcription dans l'issue, si ça peut mâcher le travail a quiconque aurait envie de faire un plugin pour

@tykayn
J'en avais discuté avec @booteille ; l'une des difficultés est que vosk est gourmand en ressources (en tout cas dans l'utilisation python, offline). Mais s'il y a moyen de contourner ce problème...
@Bristow_69 @aprilorg

@tykayn
Du coup, j'ai testé et je n'arrive pas à transcrire un court podcast, j'ai une grosse erreur.

J'ai fait le wav avec ffmpeg : ffmpeg -i podcast.mp3 -ac 1 podcast.wav)

Voici le retour :

paste.chapril.org/?1f59a6970fd

Sinon, install sans soucis ! Mais je remarque que le fichier models/fr/mfcc.conf n'existe pas, dans fr/ j'ai uniquement ce dossier vosk-model-fr-0.6-linto-2.2.0. Le fichier mfcc.conf est dans
transcription/models/fr/vosk-model-fr-0.6-linto-2.2.0/conf

Cela doit venir de cela...

@Bristow_69
Oui, on dirait bien.

@tykayn
On peut tenter de garder le paramétrage initial (models et pas models/fr) en faisant juste un symlink. Je tente.

@Bristow_69

Pour tester sans avoir à tout réinstaller, est-ce que tu pourrais faire les modifs suivantes :

mv models/fr vosk-model-fr-0.6-linto-2.2.0; ln -s vosk-model-fr-0.6-linto-2.2.0 model;

Puis récupérer cette version du fichier de transcription : forge.chapril.org/symeon/trans

(pull request en cours)

Ça donne quoi ?
@tykayn

@r_a

Pareil. Je n'ai pas l'impression que le lien symbolique change la donne (mĂŞme erreur) car dans model/, je tombe sur vosk-model...

@tykayn

@Bristow_69
il faut que le contenu du zip soit dans models/fr , je dirai que le contenu est un dossier plus loin. un simple couper coller vers fr devrait faire l'affaire
@r_a

@Bristow_69
Oui, pardon, il me manquait le dernier sous-dossier.

Le plus simple, si tu as toujours le zip, c'est de supprimer les *dossiers* créés (le dossier vosk-model-fr-0.6-linto-2.2.0 et le symlink), puis de dézipper le zip sans option, et créer de nouveau le symlink :

unzip vosk-model-fr-0.6-linto-2.2.0.zip; ln -s vosk-model-fr-0.6-linto-2.2.0 model

@tykayn

@r_a

Merci, cela fonctionne bien mieux \o/

Toutefois, le log me fait un coredump, j'ai bien les phrases retranscrites mais la fin semble bizarre (le fichier 5_phrases_min_sec.txt est ok)

paste.chapril.org/?e6dfa5b167d

@tykayn

@Bristow_69 @aprilorg
si d'autres veulent améliorer le fichier de sous titre voici un pad avec des corrections

pad.chapril.org/p/osm_4_outils

Sign in to participate in the conversation
Mastodon Bliss

la meilleure instance mastodon du fédiverse, rien que ça.