Automatsko prepoznavanje izgovorenih cifara na bosanskom jeziku korištenjem vještačkih neuronskih mreža
Prepoznavanje govora je oblast koja se kroz historiju zasnivala na različitim konceptima. Oni koji su se u prošlosti najviše izdvajali od drugih su obično bili bazirani na skrivenim Markovljevim modelima. U skorije vrijeme neuronske mreže, kao nezaobilazna stanica, su našle primjeru i u ovoj oblasti. Zajedno za ekstrakcijom pogodnih koeficijenata iz audio signala, pokazale su se mnogo uspješnije od prethodnih modela. Upravo će kroz rad biti pokazana tačnost neuronskih mreža na ograničenom skupu riječi koje je potrebno prepoznati. U radu je prikazan rezultat implementacije stabla odlučivanja, klasične umjetne neuronske mreže sa gusto povezanim slojevima, te dvije varijante konvolucione neuronske mreže za suočavanje sa problemom automatskog prepoznavanja govora.
Speech recognition is an area of study which has through history relied on various concepts. Those which have traditionally stood out the most have been based on hidden Markov chains. More recently artificial neural networks, as an evermore prevelant tool, have found a use in this area as well. Together with extraction of adequate coefficients from audio signals, they have shown to be much more successful than earlier models. This work will showcase neural networks and their accuracy on a limited dataset of words to be recognized. The work showcases the results of implementing a decision tree, a traditional artificial neural network with densely connected layers, as well as two variants of convolutional neural networks for tackling the problem of automatic speech recognition.