Najtočniji STT za hrvatski jezik
Napravili smo i uredili veliku bazu hrvatskog govora za naš Dataset i koristili ga za fino podešavanje Whispera kako bi postigli najbolje rezultate za prepoznavanje govora potrebne za naše glasovne AI asistente, ali i ponudili ga kao zaseban proizvod.
Naši modeli su rezultat opsežnog istraživanja i razvoja, prilagođeni specifičnostima hrvatskog jezika i sa velikom bazom hrvatskog govora (Dataset).
Nakon 6 mjeseci stvaranja i uređivanja hrvatskog govornog Dataseta, razvili smo modele koji nadmašuju sva postojeća rješenja za hrvatski jezik, posebno za snimke pozivnih centara i telefonske razgovore.
Svi podaci obrađuju se lokalno na našim sigurnim poslužiteljima u Hrvatskoj, osiguravajući potpunu usklađenost s GDPR-om i zaštitu privatnosti.
Naša infrastruktura automatski se prilagođava vašim potrebama, omogućujući obradu tisuća sati zvuka u stvarnom vremenu bez gubitka performansi.
Najbolja stopa pogreške riječi za hrvatski na svim mjerilima
Posebno podešeno za telefonske snimke i CC okruženja
Jednostavna integracija putem krajnjih točaka s API ključevima
Pokreće naše glasovne AI asistente u produkciji
Iako naš javno dostupni model pokazuje vrhunske rezultate na javnim datasetovima, ti podaci često ne oslikavaju stvarne izazove s terena. Naš privatni model dodatno je fino podešen na opsežnom internom Datasetu (pozivni centri, telefonske snimke), gdje postiže značajno bolje rezultate od javnog modela, što je jasno vidljivo iz tablice na našim testnim setovima.
Kontaktirajte nas za API pristup i cijene za tvrtke.
Niže je bolje
Datasetovi označeni značkom Interni predstavljaju realna okruženja pozivnih centara, snimaka telefonskih poziva, snimljenog prirodnog govora...
| Model | WER (%) |
|---|---|
| openai/whisper-large-v3-turbo | 22.93 |
| SL Public Model(GoranS/whisper-large-v3-turbo-hr-parla) | 18.44 |
| SL Private Model | 11.53 |
| Model | WER (%) |
|---|---|
| openai/whisper-large-v3-turbo | 21.62 |
| SL Public Model(GoranS/whisper-large-v3-turbo-hr-parla) | 16.97 |
| SL Private Model | 8.81 |
| Model | WER (%) |
|---|---|
| openai/whisper-large-v3-turbo | 12.73 |
| SL Public Model(GoranS/whisper-large-v3-turbo-hr-parla) | 8.66 |
| SL Private Model | 9.93 |
| Model | WER (%) |
|---|---|
| openai/whisper-large-v3-turbo | 10.23 |
| SL Public Model(GoranS/whisper-large-v3-turbo-hr-parla) | 3.52 |
| SL Private Model | 4.59 |
Objavili smo finetuniran model podešen na Datasetu Hrvatskog sabora (Parla), slobodno dostupan na Hugging Faceu.
Pristupite našem najsuvremenijem API-ju za prepoznavanje govora.

Naše AI usluge rade na enterprise infrastrukturi smještenoj u Zagrebu, uz podršku A1 Hrvatska (Exoscale hr-zag-1). To osigurava ultra-nisku latenciju za glasovne aplikacije u stvarnom vremenu i potpunu suverenost podataka.
<10ms odziv u Hrvatskoj putem Omonijinog optimiziranog BGP usmjeravanja.
Svi podaci ostaju u Hrvatskoj. GDPR usklađena obrada na lokalnim poslužiteljima.
Višestruke redundantne 10Gbit veze osiguravaju neprekidnu uslugu.
N+1 redundancija na napajanju i hlađenju za 99.99% dostupnost.
Tu smo da vam pomognemo transformirati način na koji se povezujete s vašim klijentima. Bilo da imate pitanja, trebate demo ili ste spremni započeti, naš tim je na samo poruku udaljen.