Väitös puhe- ja kieliteknologian alalta, Heikki Kallasjoki
Väitöksen nimi on Piirteiden korjaus ja epävarmuuden arviointi melua ja kohinaa sisältävän puheen tunnistuksessa.
Map © OpenStreetMap. Some rights reserved.
Vaikka puheentunnistusjärjestelmillä on jo monia käytännön sovelluksia, ovat ne edelleen huomattavasti ihmistä heikompia sietämään ympäristöstä aiheutuvia häiriöitä. Mobiililaitteiden yleistymisen vuoksi puheentunnistusta käytetään kuitenkin mitä erilaisemmissa meluisissa tilanteissa, kuten ulkona liikenteessä tai keskellä puheensorinaa. Olohuoneisiin suunnitelluissa viihdelaitteissa taas ongelmia aiheuttaa kaukana puhujasta oleva mikrofoni, jonka nauhoittamassa äänessä on mukana runsaasti kaikua.
Tässä väitöskirjassa tutkitaan menetelmiä, joilla nauhoitettua puhesignaalia voidaan muokata siten, että melu ja kaiku vaikuttavat siihen vähemmän. Matalalla tasolla ongelmaa lähestytään tutkimalla luotettavampia tapoja signaalin spektrin arvioimiseksi. Puheen ja melun erottamiseen toisistaan sovelletaan ns. puuttuvaan dataan ja epänegatiiviseen matriisihajotelmaan perustuvia menetelmiä sekä näiden yhdistelmää. Kaiusta aiheutuvien häiriöiden käsittelemiseksi esitetään matriisihajotelmaan pohjautuvan menetelmän laajennus, jossa kaiun vaikutus mallinnetaan osana matriisihajotelmaa.
Puhesignaalin suoranaisen korjauksen lisäksi väitöskirjassa kehitetään tapoja arvioida tuloksena saadun signaalin luotettavuutta. Siten pystytään tuottamaan arvio siitä, mitkä aika- ja taajuusalueet todennäköisesti sisältävät häiriöitä, ja mitkä puolestaan eivät. Tätä arviota voidaan hyödyntää puheentunnistuksessa antamalla tunnistimen kiinnittää enemmän huomiota luotettavimpiin alueisiin, ja jättämään todennäköisesti melun pilaamat osat signaalista huomioimatta.
Vastaväittäjänä toimii professori Dorothea Kolossa, Ruhr-Universität Bochum, Saksa
Valvojana on professori Mikko Kurimo, Aalto-yliopiston sähkötekniikan korkeakoulu, Signaalinkäsittelyn ja akustiikan laitos
Väittelijän yhteystiedot:
Heikki Kallasjoki
heikki.kallasjoki@iki.fi