Seiten: [1]
|
 |
|
|
Autor
|
Thema: TTS Stimme Thorsten-Voice (Gelesen 755 mal)
|
|
Sebastian
YaBB God
    
Offline
Einträge: 701

|
 |
TTS Stimme Thorsten-Voice
« am: 29. November 2024, 13:10:44 »
|
|
Hallo Suletuxe,
Ich möchte euch hier wieder einmal an meinen Erfahrungen teilhaben lassen.
Und zwar habe ich das Projekt https://www.thorsten-voice.de/ gefunden.
Eine qualitativ hochwertige (AI/KI), deutsche, künstliche TTS/Text-to-Speech Stimme, die offline erzeugt werden kann, sollte jedem Projekt kostenlos und ohne lizenzrechtliche Einschränkungen (Open Source) zur Verfügung stehen.
|
|
Da dachte ich mir cool, endlich eine gescheite Deutsche Stimme die man verwenden kann um Text in Sprache umzuwandeln. Um z.b. YouTube-Videos zu vertonen oder andere Dinge damit anzustellen.
Also wollte ich nach dem Installations Video das Thorsten Müller selbst gedreht hat eine Installation wagen:
Bei der Installation stellte ich dann fest das das eingesetzte Programm für seine Stimme
https://github.com/coqui-ai/TTS
eine ältere Python Version erfoderte als ich auf meinen Arch System habe. Erster gedanke war also ein podman Container aufzusetzten. Und das Programm mit seinen benötigten Abhähigkeiten dortdrin laufen lassen.
podman eignet sich hier für hervorragend gegenüber zu docker. Da ich für diese Anwendung keinen Container mit Root Rechten benötige. Flux podman installiert und eine Anpassung an der /etc/subuid und /etc/subgid vorgenommen, da meine Arch Installation schon älter ist.
https://wiki.archlinux.org/title/Podman#Migration_for_users_created_prior_to_shadow_4.11.1-3
Dann das Image gepullt:
podman pull ghcr.io/coqui-ai/tts-cpu
|
|
ein neues Verzeichnis für die wav Dateien erstellt:
Und mit
podman run --rm -v ~/tts:/root/tts-output ghcr.io/coqui-ai/tts-cpu:latest --model_name tts_models/de/thorsten/tacotron2-DDC --out_path /root/tts-output/test1.wav --text "Das ist ein Test."
|
|
Ausprobiert ob es funktioniert. Und tada ich hatte eine Synthetisierte wav Datei mit dem Gesprochen den Text im Verzeichnis liegen.
Jetzt muss ich nur noch lernen wie ich das docker Image umbaue damit bei der Erzeugung eines neuen Containers gleich die TTS Stimme mit eingebaut wird. Damit nicht jedesmal wenn ich einen neuen Container erzeuge erst wieder die Stimme heruntergeladen werden muss.
Als Vorlage werde ich die
https://github.com/coqui-ai/TTS/blob/dev/dockerfiles/Dockerfile.dev
Verwenden und mir dann ein eigenes Image basteln.
Anmerkung:
Die Einrichtung und Verwendung des Containers fand alles ohne Root rechte in meinen home Verzeichnis statt. Das ist der Hauptvorteil gegenüber von Docker das podman Cointainer ohne Root Rechte verwalten kann. Und weniger Resourcen benötigt weil der Docker Deamon überflüssig bei podman ist. Die Container werden mithilfe von cgroups vom Kernel Nativ erstellt und mithilfe von podman als warpper für systemd gemanaged.
LG Sebastian
|
|
Gespeichert
|
Wo die digitale Kultur blüht, nutzen Angreifer Emotionen, Gewohnheiten und Markenbindung aus. Der Schutz beginnt nicht mit Technik, sondern mit Bewusstsein. Wer sich informiert, vorsichtig klickt und sichere Tools nutzt, kann auch unbeschwert an der Digitalkultur teilnehmen.
|
|
|
Andreas
Administrator
    
Offline
Einträge: 1500

Linux von Innen
|
 |
Re:TTS Stimme Thorsten-Voice
« Antwort #1 am: 29. November 2024, 14:26:16 »
|
|
Ich hatte früher auch schon mal mit deutschen Sprachausgaben experimentiert, war aber damit nicht wirklich zufrieden. Das hier hört sich sehr interessant an. Eine Idee, wie Du die Virtualisiserung überflüssig machst wäre, den Python-Code auf Python 3.12 anzupassen - idealerweise als Pull Request an das Github. Die Änderungen zwischen 3.11 und 3.12 sind überschaubar und auch für Leute, die Python nicht wirklich können, einzupflegen, denke ich. Zusätzlich kann es nicht schaden, auch mal einen Blick auf Python Code zu werfen. Python ist eine sehr schöne Sprache und es lohnt sich, sie zu lernen...
LG Andreas
|
|
Gespeichert
|
Wissen ist das einzige Gut, das mehr wird, wenn man es teilt - wenn es Menschen gibt, die es teilen, und es Menschen gibt, die bereit sind, dieses Geschenk auch mit eigenem Einsatz anzunehmen.
Freiheit zu erkämpfen reicht nicht. Man muss sie auch verteidigen.
Ohne IT-Kompetenz ist man heutzutage ein willkommenes Opfer und Spielball anderer, egal, welches System oder Gerät man nutzt. Nur Wissen schützt vor Schaden!
|
|
|
Sebastian
YaBB God
    
Offline
Einträge: 701

|
 |
Re:TTS Stimme Thorsten-Voice
« Antwort #2 am: 29. November 2024, 17:46:17 »
|
|
Synthetisiert aus meinen Angepassten Docker/podman Image.
|
Wo die digitale Kultur blüht, nutzen Angreifer Emotionen, Gewohnheiten und Markenbindung aus. Der Schutz beginnt nicht mit Technik, sondern mit Bewusstsein. Wer sich informiert, vorsichtig klickt und sichere Tools nutzt, kann auch unbeschwert an der Digitalkultur teilnehmen.
|
|
|
Andreas
Administrator
    
Offline
Einträge: 1500

Linux von Innen
|
 |
Re:TTS Stimme Thorsten-Voice
« Antwort #3 am: 30. November 2024, 07:54:05 »
|
|
Das ist wirklich schon krass gut für eine offline-Ausgabe!
Wir sehen uns heute Abend
LG Andreas
|
|
Gespeichert
|
Wissen ist das einzige Gut, das mehr wird, wenn man es teilt - wenn es Menschen gibt, die es teilen, und es Menschen gibt, die bereit sind, dieses Geschenk auch mit eigenem Einsatz anzunehmen.
Freiheit zu erkämpfen reicht nicht. Man muss sie auch verteidigen.
Ohne IT-Kompetenz ist man heutzutage ein willkommenes Opfer und Spielball anderer, egal, welches System oder Gerät man nutzt. Nur Wissen schützt vor Schaden!
|
|
|
Sebastian
YaBB God
    
Offline
Einträge: 701

|
 |
Re:TTS Stimme Thorsten-Voice
« Antwort #4 am: 30. November 2024, 08:21:18 »
|
|
Jetzt wollte ich mir den Python Code mal anschauen im Repository
https://github.com/coqui-ai/TTS
Und musste feststellen das dies nicht mehr geflegt wird. Und die Community davon schon einen fork gemacht hat wo dies weiteretwicklet wird.
https://github.com/idiap/coqui-ai-TTS
Von dem Fork das pip Paket funktioniert auch schon mit python 3.12 das Paket nennt sich jetzt coqui-tts
Wir sehen uns heute Abend
LG Sebastian
|
|
Gespeichert
|
Wo die digitale Kultur blüht, nutzen Angreifer Emotionen, Gewohnheiten und Markenbindung aus. Der Schutz beginnt nicht mit Technik, sondern mit Bewusstsein. Wer sich informiert, vorsichtig klickt und sichere Tools nutzt, kann auch unbeschwert an der Digitalkultur teilnehmen.
|
|
|
Seiten: [1]
|
|
|
|
|
|
|