Sebastian
YaBB God
    
Offline
Einträge: 774

|
 |
Speech Note - Spracherkennung unter Linux
« am: 27. August 2025, 12:16:18 »
|
|
Einleitung
Inspiriert durch den Beitrag "Libre Office Texte unter Linux diktieren mit Speech Note" auf gnulinux.ch habe ich mich näher mit dem Containerformat Flatpak beschäftigt. Flatpak ist ein distributionsunabhängiges Paketformat, das Anwendungen in isolierten Containern bereitstellt. Dadurch lassen sich Programme samt ihrer Abhängigkeiten installieren, ohne Teile des Basissystem zu verändern und mit diesen in Konflikt zu kommen.
Da ich die Anwendung Speech Note testen wollte, erschien mir Flatpak als elegante Alternative zur AUR‑Variante (Arch User Repository), die mir zu viele zusätzliche Abhängigkeiten mitgebracht hätte. Mein Ziel war es, das System schlank zu halten und gleichzeitig die Möglichkeit zu schaffen, weitere Flatpak‑Anwendungen unkompliziert auszuprobieren.
Hauptteil:
Kommen wir zum eigentlichen Thema: Speech Note. Diese Open‑Source‑Anwendung dient der Spracherkennung (Speech‑to‑Text, kurz STT) und hat sich im Vergleich zu meinen letzten Tests vor rund 15 Jahren deutlich verbessert. Damals waren Open‑Source‑Lösungen in diesem Bereich noch deutlich ungenauer.
Ich habe in der Anwendung folgende Sprachmodelle getestet:
- Deutsch – WhisperCpp small
- Deutsch – WhisperCpp medium
Hinweise zu den Modellen: Je größer das Sprachmodell, desto präziser ist die Erkennung – allerdings steigen damit auch der RAM‑Verbrauch und die Verarbeitungszeit. Da ich weder eine starke GPU (Grafikprozessor) noch mehr als 8 GB RAM zur Verfügung habe, beschränkte ich mich auf die beiden genannten Modelle. Selbst das small‑Modell lieferte bereits sehr gute Ergebnisse.
Beispiele/Code Nachfolgend ein Beispiel, wie ich Speech Note unter Flatpak installiert und gestartet habe – mit Kommentaren zu den einzelnen Befehlen:
# Flatpak-Installation von Speech Note (falls Flatpak noch nicht installiert ist, zuerst Flatpak einrichten) flatpak install flathub net.mkiol.SpeechNote # Installation der Anwendung aus dem Flathub-Repository
# Start der Anwendung flatpak run net.mkiol.SpeechNote # Speech Note starten
# Hinweis: Beim ersten Start muss noch das gewünschte Sprachmodell heruntergeladen werden. Speech Note gibt dafür eine kurze Einführung.
|
|
Fazit/Hinweis
Trotz der guten Erkennungsrate werde ich Speech Note vermutlich nicht in meinen täglichen Workflow integrieren. Grund dafür ist die mangelhafte Qualität des eingebauten Notebook‑Mikrofons und die Tatsache, dass ich mein hochwertiges Bluetooth‑Headset selten dabeihabe. Nichtsdestotrotz behalte ich die Anwendung installiert, um sie bei passender Gelegenheit wieder zu nutzen.
Quellen:
Frage an die Community:
Verwendet ihr auch STT Software oder habt ihr erfahrungen mit anderer bzw. anderen Sprachmodellen?
LG Sebasian
|
« Letzte Änderung: 27. August 2025, 18:42:42 von Sebastian » |
Gespeichert
|
Wo die digitale Kultur blüht, nutzen Angreifer Emotionen, Gewohnheiten und Markenbindung aus. Der Schutz beginnt nicht mit Technik, sondern mit Bewusstsein. Wer sich informiert, vorsichtig klickt und sichere Tools nutzt, kann auch unbeschwert an der Digitalkultur teilnehmen.
|
|
|