Hrvatsko prepoznavanje govora

Najtočniji STT za hrvatski jezik

Napravili smo i uredili veliku bazu hrvatskog govora za naš Dataset i koristili ga za fino podešavanje Whispera kako bi postigli najbolje rezultate za prepoznavanje govora potrebne za naše glasovne AI asistente, ali i ponudili ga kao zaseban proizvod.

Zašto naš STT?

Naši modeli su rezultat opsežnog istraživanja i razvoja, prilagođeni specifičnostima hrvatskog jezika i sa velikom bazom hrvatskog govora (Dataset).

Vrhunska Preciznost

Nakon 6 mjeseci stvaranja i uređivanja hrvatskog govornog Dataseta, razvili smo modele koji nadmašuju sva postojeća rješenja za hrvatski jezik, posebno za snimke pozivnih centara i telefonske razgovore.

Domaći Hosting

Svi podaci obrađuju se lokalno na našim sigurnim poslužiteljima u Hrvatskoj, osiguravajući potpunu usklađenost s GDPR-om i zaštitu privatnosti.

Skalabilnost

Naša infrastruktura automatski se prilagođava vašim potrebama, omogućujući obradu tisuća sati zvuka u stvarnom vremenu bez gubitka performansi.

Najniži WER

Najbolja stopa pogreške riječi za hrvatski na svim mjerilima

Optimizirano za CC

Posebno podešeno za telefonske snimke i CC okruženja

API pristup

Jednostavna integracija putem krajnjih točaka s API ključevima

Spremno za produkciju

Pokreće naše glasovne AI asistente u produkciji

Enterprise

Prepoznavanje hrvatskog govora (API)

Iako naš javno dostupni model pokazuje vrhunske rezultate na javnim datasetovima, ti podaci često ne oslikavaju stvarne izazove s terena. Naš privatni model dodatno je fino podešen na opsežnom internom Datasetu (pozivni centri, telefonske snimke), gdje postiže značajno bolje rezultate od javnog modela, što je jasno vidljivo iz tablice na našim testnim setovima.

Kontaktirajte nas za API pristup i cijene za tvrtke.

Usporedba modela

Niže je bolje

Datasetovi označeni značkom Interni predstavljaju realna okruženja pozivnih centara, snimaka telefonskih poziva, snimljenog prirodnog govora...

SL99 Dataset
(sl99 test)
Interni (Private)
ModelWER (%)
openai/whisper-large-v3-turbo22.93
SL Public Model(GoranS/whisper-large-v3-turbo-hr-parla)18.44
SL Private Model11.53
SL31 Dataset
(sl31 test)
Interni (Private)
ModelWER (%)
openai/whisper-large-v3-turbo21.62
SL Public Model(GoranS/whisper-large-v3-turbo-hr-parla)16.97
SL Private Model8.81
Fleurs Dataset
(google/fleurs hr_hr test)
ModelWER (%)
openai/whisper-large-v3-turbo12.73
SL Public Model(GoranS/whisper-large-v3-turbo-hr-parla)8.66
SL Private Model9.93
Parla Dataset
(parla_867k test)
ModelWER (%)
openai/whisper-large-v3-turbo10.23
SL Public Model(GoranS/whisper-large-v3-turbo-hr-parla)3.52
SL Private Model4.59

Besplatni javni model

Objavili smo finetuniran model podešen na Datasetu Hrvatskog sabora (Parla), slobodno dostupan na Hugging Faceu.

Pogledaj na Hugging Face

Trebate hrvatski STT za vaš projekt?

Pristupite našem najsuvremenijem API-ju za prepoznavanje govora.

Kontaktirajte nas
Exoscale Zagreb Data Center
hr-zag-1
INFRASTRUKTURA

Vrhunska infrastruktura i performanse
Pokreće Omonia & Exoscale Zagreb

Naše AI usluge rade na enterprise infrastrukturi smještenoj u Zagrebu, uz podršku A1 Hrvatska (Exoscale hr-zag-1). To osigurava ultra-nisku latenciju za glasovne aplikacije u stvarnom vremenu i potpunu suverenost podataka.

Ultra-niska latencija

<10ms odziv u Hrvatskoj putem Omonijinog optimiziranog BGP usmjeravanja.

Suverenost podataka

Svi podaci ostaju u Hrvatskoj. GDPR usklađena obrada na lokalnim poslužiteljima.

10Gbit+ Povezivost

Višestruke redundantne 10Gbit veze osiguravaju neprekidnu uslugu.

Tier 3 Pouzdanost

N+1 redundancija na napajanju i hlađenju za 99.99% dostupnost.

Stupite u kontakt

Tu smo da vam pomognemo transformirati način na koji se povezujete s vašim klijentima. Bilo da imate pitanja, trebate demo ili ste spremni započeti, naš tim je na samo poruku udaljen.

Contact