Microsoft-ի նոր տեխնոլոգիան խոսակցությունները մարդուց լավ է հասկանում

0

06-research-team-20161013-lowresMicrosoft-ի գլխավոր խոսքի գիտնականը, 2015-ի Դեկտեմբերին ասել է, որ հաջորդ 4-5 տարիների ընթացքում համակարգիչները մարդկանց նման կհասկանան մեր բոլոր արտասանած բառերը:

Չանցած մեկ տարի, Microsoft-ը ռեկորդ է սահմանում, թողարկելով մի համակարգ, որը կարող է արտաբերել հեռախոսազանգը (գուցե մի քանի սխալներով) ավելի լավ, քան այդ ոլորտի մաստագետները:

Սա շատ մեծ փոփոխություն է լեզվի ճանաչման համար, նույնիսկ Amazon Echo-ն և Apple-ի Airpod սարքավորումները ապացուցում են, որ ձայնը մեծ դեր է խաղալու հետագա տեխնոլոգիաներում:

“Արհեստական բանականության և ակուստիկ տեխնոլոգիաների նոր ձեռքերումների շնորհիվ մենք կարողացանք այս ամենին ավելի շուտ հասնել”,- նշել է Microsoft գլխավոր հետազոտող Ջոֆրի Զվեյգը:

Switchboard-ի փորձարկում

National Institute of Standards and Technology (NIST)-ին 1990-ին թողարկել է մի շարք հեռախոսային խոսակցության ձայնագրություններ անգլերենով, իսպաներենով և մանդարինով, որոնց անվանել են “Switchboard”: Բոլորը նույն տվյալներով են աշխատում:

Այդ ժամանակից ի վեր, շատ կազմակերպություններ, ներառյալ Microsoft-ը, Google-ը և IBM-ը օգտագործել են Switchboard-ը, որպես խոսքի ճշգրտությունը ստուգելու հիմնական եղանակ:

Հուանգը բլոգի միջոցով սեպտեմբերին հայտարարել էր, որ Microsoft Research-ը 6.3%-ի է հասել Switchboard-ում error rate-ով: Ըստ նրա error rate-ը լավագույն արդյունքներն է տրամադրել ողջ արդյունբերական պատմության մեջ:

Այսպիսով Microsoft-ը որոշ խորամանկ քայլերի դիմեց և արեց այն ինչ ըստ Զվեյգի ոչ ոք դեռ չէր արել: Այն վերցրեց Switchboard-ի թեստը և տվեց մաստագետներին նույնացնելու և համեմատելու արդյունքները:

xuedong-huang-268

Ինչու՞ ոչ ոք այս քայլը դեռ չէր արել: Գուցե այն երևակայությունից դուրս էր, քանի որ նույնիսկ ամենալավ համակարգերը մոտ էին մարդուն նմանեցնելու: Արդյունքները վերադարձան և NIST-ը հաստատեց դրանք:

Microsoft-ը պաշտոնապես ստեղծեց խոսքը ընկալով համակարգ, որը ավելի լավ է հասկանում խոսքը, քան մարդը:

Կարճ ժամանակում տեխնոլոգիան Microsoft-ի Cortana վիրտուալ օգնականին ավելի կատարելագործված կդարձնի:

screen-shot-2015-05-26-at-9-55-46-am

Այս պահին համակարգը կարող է լսել  խոսակցությունը կայուն, ֆիքսված հեռախոսազանգով:

Share.