Hrvatsko prepoznavanje govora

Najtočnija transkripcija i pretvaranje govora u tekst za hrvatski jezik

Napravili smo i uredili veliku bazu hrvatskog govora za naš Dataset i koristili ga za fino podešavanje Whispera kako bi postigli najbolje rezultate za prepoznavanje govora potrebne za naše glasovne AI asistente, ali i ponudili ga kao zaseban proizvod.

Zašto naša transkripcija i prepoznavanje govora?

Naši modeli su rezultat opsežnog istraživanja i razvoja, prilagođeni specifičnostima hrvatskog jezika i sa velikom bazom hrvatskog govora (Dataset).

Vrhunska Preciznost

Nakon 6 mjeseci stvaranja i uređivanja hrvatskog govornog Dataseta, razvili smo modele koji nadmašuju sva postojeća rješenja za hrvatski jezik, posebno za snimke pozivnih centara i telefonske razgovore.

Domaći Hosting

Svi podaci obrađuju se lokalno na našim sigurnim poslužiteljima u Hrvatskoj, osiguravajući potpunu usklađenost s GDPR-om i zaštitu privatnosti.

Skalabilnost

Naša infrastruktura automatski se prilagođava vašim potrebama, omogućujući obradu tisuća sati zvuka u stvarnom vremenu bez gubitka performansi.

Najniži WER

Najbolja stopa pogreške riječi za hrvatski na svim mjerilima

Optimizirano za CC

Posebno podešeno za telefonske snimke i CC okruženja

API pristup

Jednostavna integracija putem krajnjih točaka s API ključevima

Spremno za produkciju

Pokreće naše glasovne AI asistente u produkciji

Automatska transkripcija

Pretvorite govor u tekst automatski - idealno za transkripciju sastanaka, poziva i audio datoteka

Enterprise

API za prepoznavanje govora i transkripciju (Govor u tekst)

Iako naš javno dostupni model pokazuje vrhunske rezultate na javnim datasetovima, ti podaci često ne oslikavaju stvarne izazove s terena. Naš privatni model dodatno je fino podešen na opsežnom internom Datasetu (pozivni centri, telefonske snimke), gdje postiže značajno bolje rezultate od javnog modela, što je jasno vidljivo iz tablice na našim testnim setovima.

Kontaktirajte nas za API pristup i cijene za tvrtke.

Usporedba modela

Niže je bolje

Datasetovi označeni značkom Interni predstavljaju realna okruženja pozivnih centara, snimaka telefonskih poziva, snimljenog prirodnog govora...

SL99 Dataset

(sl99 test)

Interni (Private)

Model	WER (%)
openai/whisper-large-v3-turbo	22.93
SL Public Model(GoranS/whisper-large-v3-turbo-hr-parla)	18.44
SL Private Model	11.53

SL31 Dataset

(sl31 test)

Interni (Private)

Model	WER (%)
openai/whisper-large-v3-turbo	21.62
SL Public Model(GoranS/whisper-large-v3-turbo-hr-parla)	16.97
SL Private Model	8.81

Fleurs Dataset

(google/fleurs hr_hr test)

Model	WER (%)
openai/whisper-large-v3-turbo	12.73
SL Public Model(GoranS/whisper-large-v3-turbo-hr-parla)	8.66
SL Private Model	9.93

Parla Dataset

(parla_867k test)

Model	WER (%)
openai/whisper-large-v3-turbo	10.23
SL Public Model(GoranS/whisper-large-v3-turbo-hr-parla)	3.52
SL Private Model	4.59

Besplatni javni model

Objavili smo finetuniran model podešen na Datasetu Hrvatskog sabora (Parla), slobodno dostupan na Hugging Faceu.

Pogledaj na Hugging Face

Trebate transkripciju ili pretvaranje govora u tekst za vaš projekt?

Pristupite našem najsuvremenijem API-ju za prepoznavanje govora i automatsku transkripciju.

Kontaktirajte nas

hr-zag-1

Latencija

< 10ms

INFRASTRUKTURA

Vrhunska infrastruktura i performanse
Pokreće Omonia & Exoscale Zagreb

Naše AI usluge rade na enterprise infrastrukturi smještenoj u Zagrebu, uz podršku Omonia i A1 Hrvatska (Exoscale hr-zag-1). To osigurava ultra-nisku latenciju za glasovne aplikacije u stvarnom vremenu i potpunu suverenost podataka.

Ultra-niska latencija

<10ms odziv u Hrvatskoj putem Omonijinog optimiziranog BGP usmjeravanja.

Suverenost podataka

Svi podaci ostaju u Hrvatskoj. GDPR usklađena obrada na lokalnim poslužiteljima.

10Gbit+ Povezivost

Višestruke redundantne 10Gbit veze osiguravaju neprekidnu uslugu.

Tier 3 Pouzdanost

N+1 redundancija na napajanju i hlađenju za 99.99% dostupnost.

Stupite u kontakt

Tu smo da vam pomognemo transformirati način na koji se povezujete s vašim klijentima. Bilo da imate pitanja, trebate demo ili ste spremni započeti, naš tim je na samo poruku udaljen.