Nauja balso programa gali padėti kontroliuoti svorį
Svarbiausias svorio metimo nuomininkas yra suskaičiuoti kiekvieną suvartotą kaloriją. Nors užduotis skamba lengvai, visų kalorijų dokumentavimas tampa sunkia užduotimi valgant restorane, užkandžiaujant kelyje ar net atsisėdus pavalgyti namuose.
Technika reikalauja nuoseklumo ir tikslumo, o kai nepavyksta, dažniausiai dėl to, kad žmonės neturi laiko ar galimybių susirasti ir įrašyti visą reikiamą informaciją.
Dabar Masačusetso technologijos instituto (MIT) mokslininkai sukūrė programą, leidžiančią žmonėms prisijungti prie vartojamo maisto ir gėrimų naudojant kalbos valdomą sistemą.
Ši koncepcija atsirado prieš kelerius metus, kai mitybos specialistų komanda iš Tufts universiteto kreipėsi į MIT tyrėjus su mintimi apie kalbamosios kalbos programą, kuri palengvintų maisto ruošą.
Šią savaitę Šanchajuje vykusioje tarptautinėje konferencijoje apie akustiką, kalbą ir signalo apdorojimą MIT tyrėjai pristato savo žiniatinklyje pagrįstą kalbos valdomos mitybos registravimo sistemos prototipą.
Juo vartotojas žodžiu apibūdina valgio turinį, o sistema analizuoja aprašą ir automatiškai gauna atitinkamus mitybos duomenis iš internetinės duomenų bazės, kurią tvarko JAV žemės ūkio departamentas (USDA).
Duomenys rodomi kartu su atitinkamų maisto produktų vaizdais ir išskleidžiamaisiais meniu, kurie leidžia vartotojui patikslinti jų aprašymus - pavyzdžiui, pasirinkdami tikslius maisto kiekius. Bet tuos patobulinimus galima atlikti ir žodžiu.
Vartotojas, kuris pradeda sakydamas: „Pusryčiams turėjau dubenėlį avižinių dribsnių, bananų ir stiklinę apelsinų sulčių“, tada jis gali pakeisti: „Aš turėjau pusę banano“, ir sistema atnaujins rodomus duomenis. apie bananus, likusius palikdami nepakitusius.
„Tai, ką patyrė [„ Tufts “mitybos specialistai], yra tai, kad programos, kurios buvo skirtos padėti žmonėms bandyti registruoti patiekalus, buvo šiek tiek varginančios, todėl žmonės jų neatsiliko“, - sako vyresnysis mokslo darbuotojas Jamesas Glassas. .
„Taigi jie ieškojo būdų, kurie būtų tikslūs ir lengvai įvedami informacija.“
Pirmasis naujojo darbo autorius yra Mandy Korpusik, MIT magistrantas elektrotechnikos ir informatikos mokslas. Prie jos prisijungė Glassas, kuris yra jos patarėjas darbe; jos kolegos magistrantas Michaelas Price'as; ir Calvinas Huangas, „Glass“ grupės mokslininkas bakalaurantas.
Straipsnyje mokslininkai pateikia eksperimento su kalbos atpažinimo sistema, kurią jie sukūrė specialiai su maistu susijusiai terminologijai, rezultatus.
Tačiau tai nebuvo pagrindinis jų darbo akcentas, nes jų patiekalų registravimo sistemos internetinė demonstracinė versija naudoja nemokamą „Google“ kalbos atpažinimo programą.
Jų tyrimai buvo sutelkti į dvi kitas problemas. Vienas iš jų yra žodžių funkcinio vaidmens nustatymas: sistema turi pripažinti, kad jei vartotojas įrašo frazę „avižinių dribsnių dubuo“, maistinė informacija apie avižinius dribsnius yra tinkama, tačiau jei frazė yra „avižinių sausainių“, tai ne.
Kita problema yra vartotojo frazių suderinimas su įrašais USDA duomenų bazėje. Pavyzdžiui, USDA duomenys apie avižinius dribsnius įrašomi antraštėje „avižos“; žodis „avižiniai dribsniai“ niekur nerodomas įraše.
Norėdami išspręsti pirmąją problemą, mokslininkai naudojo mašininį mokymąsi.
Per „Amazon Mechanical Turk“ sutelkimo platformą jie įdarbino darbuotojus, kurie tiesiog apibūdino, ką valgė per pastaruosius valgius. Tada jie apibūdinime nurodė atitinkamus žodžius kaip maisto produktų pavadinimus, kiekius, prekės ženklus ar maisto pavadinimų modifikatorius.
„Avižinių dribsnių dubenyje“ „dubuo“ yra kiekis, o „avižiniai dribsniai“ yra maistas, tačiau „avižinių sausainių“ avižiniai dribsniai yra modifikatorius.
Turėdami apytiksliai 10 000 paženklintų patiekalų aprašymų, mokslininkai naudojo mašininio mokymosi algoritmus, norėdami rasti sintaksinių santykių tarp žodžių modelius, kurie nustatytų jų funkcinius vaidmenis.
Tada mokslininkai naudojo atviro kodo duomenų bazę „Freebase“, kad būtų galima išversti vartotojų aprašymus ir etiketes USDA duomenų bazėje. Pačioje duomenų bazėje yra įrašų apie daugiau nei 8000 įprastų maisto produktų, iš kurių daugelyje yra sinonimų.
Kur trūko sinonimų, jie vėl įdarbino „Mechanical Turk“ darbuotojus, kad jie juos aprūpintų.
Konferencijoje pristatyta sistemos versija visų pirma skirta parodyti jos požiūrio į natūralios kalbos apdorojimą perspektyvumą. Sistema praneša apie kalorijų skaičių, bet dar jų automatiškai nesumuoja.
Tačiau versija yra sukurta, tačiau kai ji bus baigta, „Tufts“ tyrėjai planuoja atlikti vartotojo tyrimą, kad nustatytų, ar tai iš tikrųjų palengvina mitybos registravimą.
Šaltinis: MIT