Väitös puhe- ja kieliteknologian alalta, Ulpu Remes
Väitöksen nimi on ”Tilastollisia menetelmiä osittain havaitun puheen käsittelyyn”.
Map © OpenStreetMap. Some rights reserved.
Automaattinen puheentunnistus toimii nykyään monissa tilanteissa, mutta edelleen tunnistustarkkuus saattaa laskea, kun puheeseen sekoittuu taustamelua kuten liikenteen ääntä tai puheensorinaa. Haasteena on tällöin puheen erottaminen taustamelusta. Puheentunnistus perustuu suuren tietoaineiston mallintamiseen, mutta taustamelun mallintaminen on hankalaa suuren vaihtelun vuoksi. Tässä työssä puheentunnistuksen melusietoisuuden parantamiseen etsittiin ratkaisua puuttuvan tiedon menetelmistä. Puuttuvan tiedon menetelmien soveltaminen melusietoisessa puheentunnistuksessa perustuu taustamelun kuvaamiseen puheen havainnointia vaikeuttavana esteenä: melun takia osa puheen tunnistamiseen tarvittavista havainnoista puuttuu. Nämä puuttuvat havainnot voidaan korvata eri tavoin lasketuilla ennusteilla. Tässä työssä tutkittiin etenkin puheen aikarakenteen mallintamista ennustustarkkuuden parantamiseksi. Lisäksi puheentunnistustarkkuutta parannettiin mallintamalla ennusteen luotettavuutta. Luotettavuuden mallintaminen parantaa puheentunnistustarkkuutta, koska tunnistin voi antaa päätöksenteossa suuremman painon luotettavalle tiedolle. Melusietoiseen puheentunnistukseen sopivien puuttuvan tiedon menetelmien lisäksi tutkittiin samantapaisen menetelmän käyttöä puheen taajuuskaistan keinotekoisessa laajentamisessa. Näin voidaan parantaa esimerkiksi kapeakaistaisen matkapuhelinverkon välittämän puheen laatua.
Vastaväittäjänä toimii professori Hugo Van hamme, KU Leuven, Belgia
Valvojana on professori Mikko Kurimo, Aalto-yliopiston sähkötekniikan korkeakoulu, Signaalinkäsittelyn ja akustiikan laitos
Väittelijän yhteystiedot:
Ulpu Remes
p. 044 5716 000
ulpu.remes@aalto.fi