Można zainstalować przez 'sklep' z aplikacjami w Ubuntu/Debianie wyszukując po nazwie, albo jak chcesz się poczuć bardziej hakersko - instalacja w terminalu:
flatpak install flathub net.mkiol.SpeechNote
Jeśli masz komputer z oddzielną kartą graficzną (GPU nvidia albo AMD) to warto doinstalować elementy do tego i tego i ją wykorzystać, bo to na pewno znacznie przyśpieszy działanie. Program Open Source, działa w całości lokalnie, ma nic nie wysyłać do internetu, więc znacznie bardziej prywatne niż używanie czegokolwiek online. Teoretycznie polski jest tam w pełni wspierany.
Na lekko złomotawym komputerze bez karty graficznej prędkością nie powala, dyktując powyższy komentarz musiałem poczekać ze 2 minuty aż go przemieli, ale wynik zaskakująco dobry. Jestem pod wrażeniem.
Po instalacji trzeba wejść w języki wyszukać polski i wybrać model językowy do ściągnięcia. Pierwszy z góry dał słabe efekty, ale faster whisper large v3 daje bardzo dobre wyniki.
– w wersji free-bez rejestracji – limit 10 min per kawałek, limit dobowy oraz brak rozróżniania rozmówców; za to jakość dla jęz. polskiego – co najmniej dobra.
Analogicznie można użyć YouTube'a z autotranscript, tylko trzeba mieć tam konto.