Ochutnávka ASRPE
Thread poster: Milan Condak
Milan Condak
Milan Condak  Identity Verified
Local time: 01:21
English to Czech
Dec 26, 2022

Na YouTube se vyskytují česká videa zpravidla bez titulků. Existují ale výjimky. U některých videí jsou přepisy a také ručně vytvořené titulky. Výjimečně se vyskytuje přepis a titulky nejsou zapnuté.

AI (Artificial Inteligence) je nástroj na dekódování lidské řeči a jejich převod na písmo.
Vývojáři a programátoři zpravidla používají programovací jazyk Python. AI používává jazykový model, což je sada souborů. Model obsahuje buď data
... See more
Na YouTube se vyskytují česká videa zpravidla bez titulků. Existují ale výjimky. U některých videí jsou přepisy a také ručně vytvořené titulky. Výjimečně se vyskytuje přepis a titulky nejsou zapnuté.

AI (Artificial Inteligence) je nástroj na dekódování lidské řeči a jejich převod na písmo.
Vývojáři a programátoři zpravidla používají programovací jazyk Python. AI používává jazykový model, což je sada souborů. Model obsahuje buď data pouze pro jeden jazyk nebo více jazyků. Modely jsou buď malé nebo velké. Malé modely fungují rychle, ale nepřesně. Když malý model potřebuje na přepis 1 jednotku času, tak největší model potřebuje 32 jednotek času.
Pro češtinu je nyní k dispozici malý model Vosk. Modely Whisper mají pět velikostí. Modely jsou buď pro angličtinu nebo pro více než sto jazyků. Vícejazyčný model obsahuje různé množství dat jednotlivých jazyků. Pro kvalitní přepis češtiny potřebuji velký a pomalý model.
Běžný uživatel používá PC s Windows, takže potřebuje SW spustitelný ve Windows a modely, které SW může využívat. SW Whisper používá tyto modely.

large.bin 3 094 623 691 (3,1GB)
medium.bin 1 533 763 059
small.bin 487 601 967
base.bin 147 951 465
tiny.bin 77 691 713 (77,7MB)

Uživatelům jsou k dispozici zdarma. Všechno mi fungovalo až do okamžiku, kdy jsem chtěl přepsat řeč delší než 30 minut. Chtěl jsem přepsat 47 minut. Whisper s modelem "large.bin" vytvořil 500 titulků a do zbývajících 300 titulků umístil stejný text. Zjistil jsem, že SW uloží data do souboru titulků až po ukončení procesu. Když proces zpracoval 28 minut nahrávky byla RAM 32GB z 95% plná a swapovala data na harddisk. Na dobrý přepis bych potřeboval 48GB nebo 64GB. Problém jsem vyřešil rozdělením souboru na dva menší. Místo výsledkých titulků jsem použil pro import do SE prostý text vytvořený ze dvou souborů SRT.

Jeden vývojář nabízí program Buzz, který využívá modely Whisperu. Tento autor provozuje web https://freesubtitles.ai/ . Můžete si vyzkoušet sami a nepřesnosti opravit.

Video jsem nahrál na web, vybral češtinu a model "base". Po zpracování jsem stáhl titulky ve všech dostupných formátech. Video se zobrazenými titulky jsem si mohl zobrazit.
Na webu zůstal protokol a informace a zpracovaném videu:

https://freesubtitles.ai/player/Sip-Reflex--25-December-2022_14_39_36

Milan
PS: PF 2023
Collapse


 


There is no moderator assigned specifically to this forum.
To report site rules violations or get help, please contact site staff »


Ochutnávka ASRPE






Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

Buy now! »
Anycount & Translation Office 3000
Translation Office 3000

Translation Office 3000 is an advanced accounting tool for freelance translators and small agencies. TO3000 easily and seamlessly integrates with the business life of professional freelance translators.

More info »