09:00 - 17:00; Sun - 🚫

(03) 2769 600

(09) 6133 500

Kaikki olennainen puheentunnistuksesta

0 Comments
puheentunnistus

Suurin osa meistä on havahtunut siihen, kun puhelin luulee sinun tekevän hakua Googlesta puheentunnistusta hyödyntämällä. Kuuluu vain pling ääni, ja satunnaiset tallentuneet äänet muuttuvat tulkinnaksi hausta, jota et tarkoituksella tehnyt. Kyseessä on virheellinen tunnistus, sillä puhelin tunnistaa virheellisesti äänet ja toiminnan komennoksi etsiä jotain.

Puheentunnistusta pidetään yhtenä merkittävimmistä alan trendeistä, eikä suotta. Sen potentiaalia ei vielä täysin tunneta, mutta sovelluksia ja uusia innovaatioita pyritään kehittämään puheentunnistuksen saralla tällä hetkellä. Puheentunnistusta testataan esimerkiksi itseohjautuvissa autoissa ja osittain sitä hyödynnetään muun muassa pikaruokaravintoloiden drive-in tilauksissa ja puhelinvastaajassa. 

Todelliset puheentunnistuksen kyvyt nähdään siinä vaiheessa, kun kaikki lähitulevaisuuden teknologiat ovat valmiita sillä tavalla, että niitä pystytään yhdistämään toisiinsa. Eniten alalla odotetaan esineiden internetin todellista läpimurtoa, jolloin puheen ymmärtäminen tulee yhdeksi moniulotteisen esineen elementeistä. Mutta mitä asiasta tiedetään nyt, miten sitä voi hyödyntää jo nyt omassa arjessa ja millaisia eettisiä kysymyksiä puheentunnistukseen liittyy? 

Tietokone ymmärtää ja tulkitsee – kun puhe muuttuu tekstiksi

Miten puheentunnistus käytännössä tapahtuu? Prosessi alkaa siitä, kun ihminen tuottaa äänen. Yleensä puheentunnistuksessa puhutaan komennoista. Ääni, jota tuotetaan, on analogista dataa, ja tämä laitteen on osattava muuttaa digitaaliseen muotoon. Tämä tapahtuu ADC-muuntimella, jolloin ääniaallot pilkotaan pieniin osiin. Kun osat saavat numeerisen muodon, on analoginen ääni muutettu digitaaliseen muotoon. 

Samassa ääni pilkotaan tiettyjen konsonanttien perusteella, jolloin syntyy foneemeja. Lopuksi foneemit sovitetaan yhteen valtavasta datasta jo löytyviin foneemeihin, jolloin viesti parhaassa mahdollisessa tilanteessa on oikein tulkittu ja puheentunnistus osaa etsiä vastauksen esitettyyn kysymykseen. Kuulostaako monimutkaiselta? Mikäli aiheesta haluaa tietää tarkemmin, löytyy verkosta runsaasti materiaalia, joka selittää puheen tunnistamisen toimintaperiaatteen paljon tarkemmin. 

Missä puheentunnistusta voi havaita arjessa?

Puheentunnistuksen hyödyntäminen ei ole Suomessa vielä valtavan suosittua, vaikka kyseinen mahdollisuus löytyy lähes kaikista älypuhelimista. Ehkä tunnetuimpia arjen apulaisia ovat ääniavustajat, joiden avulla pystyy tekemään modernissa kodissa kaikkea sään tarkistamisesta robotti-imurin käynnistämiseen ja musiikin soittamisesta jopa lyhyehköön vuoropuheluun. Tunnetuimmat avustajat, joita myös virtuaaliassistenteiksi kutsutaan, ovat Alexa, Google Assistant ja Siri. Jokaisen näistä omistaa suuryritys, joten ei ole ihme, että myös Euroopan Unioni selvittää laitteiden turvallisuutta ja datan keruuta.

Älypuhelimien ja erilaisten avustajien lisäksi puheentunnistukseen voi törmätä lääkärin vastaanotolla, jossa potilastietoja tallennetaan yhä enemmän puheentunnistukseen perustuvalla menetelmällä. Lisäksi, puheentunnistusta hyödyntävät erilaiset verkon kääntäjät sekä kielten opiskelussa käytettävät sovellukset. Joitain puheentunnistusta hyödyntäviä laitteita pystytään jo käyttämään tilanteissa, joissa kaksi eri kieltä puhuvaa voivat keskustella laitteen avulla keskenään. Tämän toteutumisen suhteen suuressa mittakaavassa ollaan kuitenkin vielä lapsen kengissä. 

Puheentunnistuksen eettiset kysymykset ja haasteet

Viime vuonna loimusi, kun Googlen käyttäjien ääniä oli päässyt leviämään vääriin käsiin. Tapaus ei ole millään tavalla ainutlaatuinen, vaan samankaltaisia tilanteita ja epäilyjä on tapahtunut siitä asti, kun puheentunnistus tuli älypuhelimiin ja ääniavustajat alkoivat yleistymään etenkin rapakon toisella puolella. Äänen keräämisessä on paljon eettisiä haasteita, joiden yli ei olla vielä täysin päästy. Tietoturvajärjestelmien pysyminen ajan tasalla tästäkin teknologiasta lienee avain puheentunnistuksen eettisempään käyttötapaan. 

Yksi tämän teknologian käyttöönoton haasteista on kulttuuri. Ennen älykästä puheentunnistusta olemme tottuneet siihen, että vuorovaikutus tapahtuu toisten ihmisten kanssa. Esineille puhuminen tuntuu oudolta. Moni miettii, haluaako tosiaan käydä aamukahvien aikana keskustelua vaikka oman jääkaapin tai leivänpaahtimen kanssa. Kulttuurinen hyppäys voi lopulta olla lähes yhtä iso haaste kuin mitä teknologian puutteet ja eettiset kysymykset ovat. Olisitko sinä valmis esimerkiksi kertomaan pyykkikoneelle tarvittavan pesuohjelman ääneen?