Suomen jätehuolto tuottaa paljon hyvälaatuista dataa jätteiden määristä ja ominaisuuksista. Tämä osaltaan vaikuttaa siihen, että jätealalla käytetään tekoälyyn perustuvia menetelmiä entistä enemmän.
Teksti: Leo-Pekka Salmi
Tekoälyä voidaan nykyään soveltaa yhä useammilla aloilla, esimerkiksi teollisuudessa, terveydenhuollossa ja liikenteessä.
Jätealalla tekoälyä käytetään hyväksi jo muun muassa kierrätyspisteiden täyttöennusteissa ja tyhjennysreittien ajoituksessa ja optimoinnissa. Myös muun muassa konenäköä käytetään jo ahkerasti. Konenäöstä puhutaan, kun digitaalista kameran kuvaa ja automaattista havainnointijärjestelmää käytetään reaaliajassa. Näin tehdään esimerkiksi, kun jätejakeita erotellaan toisistaan.
Helpointa tekoälyä on kehittää silloin, kun käytössä on suuria määriä dataa. Mitä enemmän hyödyllistä informaatiota on tarjolla tai mitä enemmän sitä voidaan hankkia lisää, sitä paremmin tekoälymetodit toimivat.
Opinnäytetyöni keskiössä ovat datapohjaiset tekoälyratkaisut ja -menetelmät, jotka sopivat parhaiten toimeksiantajayritykselle, Wastebook Oy:lle.
Wastebookin tarkoitus on tuoda jätehuoltoa tarjoavat ja tarvitsevat samalle alustalle. Alustan kautta kotitaloudet, taloyhtiöt ja yritykset voivat esimerkiksi kilpailuttaa jätehuollon tai aloittaa muovin kierrätyksen.
Mitä suurempi joukko käyttää Wastebookin palveluita, sitä enemmän informaatiota se saa tietokantaansa kotitalouksien, yritysten ja muiden asiakkaiden jätemääristä ja jätteiden sijainnista.
Tutkimuksen tarkoitus oli selvittää näiden tietojen pohjalta, onko olemassa joitain tekoälyyn perustuvia metodeja, joita yritys voisi hyödyntää nyt ja tulevaisuudessa.
Tarkasteltuani erilaisia tekoälyä hyödyntäviä tilastotiede- ja analysointimenetelmiä, valitsin kaksi menetelmää, joita kannatti tutkia ja mahdollisesti mallintaa pidemmälle. Ne olivat koneoppiminen ja asiakkaiden kanssa vuorovaikutuksessa oleva suosittelijajärjestelmä.
Valintaperusteihin vaikuttivat muun muassa alkupääoman tarve ja se, kuinka paljon työtä ja aikaa menetelmien kehittäminen Wastebookille sopivaksi veisi.
Lisäksi menetelmien piti tuoda todellista hyötyä. Myös riskit oli punnittava tarkkaan. Menetelmien pitää olla luotettavia ja tietoturvan kunnossa, kun yrityksellä on yksityiskohtaista dataa asiakkaistaan.
Koneoppiminen voidaan jakaa ohjattuun oppimiseen, vahvistusoppimiseen ja ohjaamattomaan oppimiseen. Perimmäinen idea on kaikissa tavoissa sama: antaa järjestelmälle tai koneelle kyky oppia datasta ilman erillistä ohjelmointia. Kun esimerkiksi yhden kunnan alueelta saadaan tietoja jätemääristä ja -lajeista, koneoppimista käyttävä järjestelmä voi ennustaa tulevaa, löytää yhteyksiä ja klusteroida tuloksia. Mitä pidemmältä aikaväliltä dataa kerätään, sitä parempia tulokset ovat.
Järjestelmä oppii menneen datan avulla nykyisen tilanteen ja voi lopulta antaa tarkkoja arvioita tulevaisuudesta. Koneoppimisella voidaan myös seuloa dataa ja jäsennellä sitä eri tavoin, jotta löydetään mahdollisia jätejakeiden määrien muutosten välisiä yhteyksiä tai syy- ja seuraussuhteita.
Wastebookin tapauksessa koneoppiminen olisi parasta aloittaa ohjatusta oppimisesta ja siirtyä vasta myöhemmin vahvistus- ja ohjaamattomaan oppimiseen. Samalla pitää ottaa huomioon se, että datamäärät tulevat kasvamaan kovaa vauhtia.
Ohjattu oppiminen auttaa yrityksen henkilökuntaa käyttämään koneoppimiseen perustuvaa järjestelmää ja samalla ymmärtämään koneoppimisen perusteita. Ohjattu oppiminen on myös vähemmän altis virheille, koska sen toimiminen on laajalti ohjaajan eli ihmisen hallussa.
Monet järjestelmät ovat vuorovaikutuksessa ihmisten kanssa. Sellaisia järjestelmiä ovat esimerkiksi chattirobotit, suosittelujärjestelmät ja muut neuvovat ohjelmat.
Wastebook hyötyisi suuresti suosittelujärjestelmästä kotisivuillaan. Jos järjestelmä pystyisi arvioimaan ja vertailemaan tarkasti hintoja, reittejä ja toiminnan ekologisuutta, sen antamat suositukset säästäisivät aikaa niin asiakkailta kuin tarjoajilta. Luonnollisesti asiakkaat saisivat itse määrittää haluamansa palvelut ja niiden ominaisuudet.
Lisäksi järjestelmä antaisi yrityksen työntekijöille tärkeää informaatiota päätöksenteon tueksi.
Jos jatkaisin opinnäytetyötä pidemmälle tai palaisin asian pariin muutaman vuoden päästä, big data -perusteiset menetelmät olisivat kiinnostavia tutkittavia. Tässä vaiheessa yritys olisi luultavasti saanut kerättyä niin paljon informaatiota, että menetelmät, jotka perustuvat todennäköisyyksiin, saisivat niin paljon opetusdataa, että tuloksia voisi pitää jo lähes varmoina.
Kirjoittaja opiskelee Haaga-Helian ammattikorkeakoulussa. Hänen opinnäytetyönsä Tekoälymetodien soveltuvuus jätehuoltoon valmistuu keväällä 2020. Työtään varten hän sai Jätehuoltoyhdistyksen stipendin.