Hur Skype Translator fungerar

Innehållsförteckning:
- Tekniken som gör det möjligt
- Från ett talat språk till ett annat på några sekunder
- Testprogrammet som utgångspunkt
Science fiction är full av referenser till tekniskt avancerade enheter vars funktion, för att parafrasera det mytiska uttrycket, inte går att skilja från magi. Med anledning av deras författares kreativa sinne är det svårt att föreställa sig när sådana uppfinningar kan vara i våra händer och vi slutar acceptera att deras existens inte kommer att bli en del av vår livscykel. Men då och då smyger en av dem in i våra liv i förtid. Det är fallet med den re altidsöversättning som Microsoft och Skype är på väg att möjliggöra
"Uppgiften är allt annat än enkel.Det involverar Skypes förmåga till videokonferenser, Microsoft Azures stora nätverk av molnservrar, Microsoft Researchs tekniska innovationer och de senaste framstegen inom flera områden som statistik och maskininlärning. Allt detta står till din tjänst så att så snart du uttalar en mening på ditt språk, känner systemet igen vad du säger, översätter det och överför det till din kontakt på ett annat språk. Hur är det möjligt?"
Tekniken som gör det möjligt
Skype Translator, namnet som den nya funktionen är känd under, är inte en blinkning, inte ens på ett år . Skype Translator är resultatet av årtionden av forskning inom taligenkänning, maskinöversättning och maskininlärning. På alla dessa områden vilar driften av ett system som inte skulle ha varit möjligt utan de senaste framstegen inom dem.
Skype Translator är resultatet av årtionden av forskning inom taligenkänning, maskinöversättning och maskininlärningsteknik.Börjar med Speech Recognition, en teknik som har varit under utredning en tid men vars adoption alltid har påverkats av det stora antalet av fel och överdriven känslighet hos befintliga system. En sekund av tvivel, små variationer i accenten, eller ett minim alt ljud var tillräckligt för att förvirra datorn och få den att förstå vad den ville. Så var det tills utvecklingen av tekniker för 'djupinlärning' och skapandet av artificiella neurala nätverk exploderade, vilket Microsoft Research vet något om. Tack vare dem har det varit möjligt att avsevärt minska felfrekvensen och förbättra tillförlitligheten och robustheten för taligenkänning, ett nödvändigt första steg för att Skype Translator ska fungera.
maskinöversättning är den andra självklara pelaren som Skype Translator vilar på. Här använder Microsoft återigen intern teknik och använder Bing översättningsmotor för att översätta text från ett språk till ett annat.Hans system använder en kombination av syntaxigenkänningstekniker och statistiska modeller för att förfina resultatet. Dessutom har motorn vid detta tillfälle specialutbildats för att känna igen den typ av språk som förekommer i talade samtal, långt ifrån den korrekthet och prydlighet som brukar antas i skrift. Således kombinerar Skype Translator-systemet Bing Translators enorma språkkunskapsbas tillsammans med ett omfattande lager av ord och fraser som vanligtvis används i vardagsspråket.
Men tal och språk är komplicerad terräng. De förändras ständigt, de finns i flera smaker och varianter, varje person har sin egen speciella stil, etc. Skype Translator måste hålla jämna steg med allt detta, vilket kräver konstant utbildning och optimering av både taligenkänning och maskinöversättning. För att göra detta har systemet byggts på en robust plattform för maskininlärning, en gren av artificiell intelligens som syftar till att utveckla tekniker som gör det möjligt för maskiner och algoritmer att lära sig genom att träna med exempeldata.Användningen av dessa tekniker, vanliga inom statistikområdet, gör att tjänsten kan förbättras när den används, och dra nytta av den data som genereras när den används för att ytterligare förfina taligenkänning och automatisk översättning.
En del av denna testdata genereras automatiskt från en mängd olika källor, inklusive sociala nätverk som Facebook, översatta webbsidor, videor med undertexter eller till och med konversationer som skapats för ändamålet och transkriberats och översatts manuellt . Men en annan del av data kommer från faktiska konversationer som hålls genom tjänsten. Detta är viktigt eftersom, eftersom Microsoft meddelar dig vid varje samtal, bör du veta att Skype Translator kan spela in konversationer och hålla dem anonyma, så att de senare kan analyseras med dess algoritmer och introducerade i utbildningsprocessen av sina statistiska modeller.
Skype Translator kan bara fungera korrekt om den kan lära sig genom en process baserad på dess användning i riktiga mänskliga konversationer
"Systemet kunde inte fungera utan denna inlärningsprocess. När människor pratar pausar vi och upprepar saker, gör misstag och ändrar vårt tänkande när vi går, genom att introducera ahs, ehms, uhms>bara att lära oss om dess faktiska användning kan göra det bättre "
Från ett talat språk till ett annat på några sekunder
Med stöd av alla dessa framsteg, nyckeln är att Skype Translator kan utföra hela igenkännings- och översättningsprocessen snabbt och transparent för användaren Varje gång vi pratar måste systemet känna igen vad vi säger, översätta det till mottagarens språk och kommunicera det till honom på ett sätt som förblir troget det vi först försökte kommunicera.Ju mindre vi märker mellanstegen desto bättre.
Så snart systemet upptäcker att vi talar börjar det spela in vad vi säger och startar taligenkänningsprocessen Detta är inte om att inte bara känna igen varje ord som vi uttalar, utan också att eliminera allt överflödigt, ta bort meningslösa uttryck och brus, upptäcka uppdelningen av texten i meningar, med inkluderande av skiljetecken och versaler, och förse den med ett sammanhang som hjälper till din tolkning. När man tänker efter lite inser man hur svårt det är att avgöra allt detta utifrån talat språk.
Skype Translator behöver den taligenkänningen för att vara så exakt som möjligt, för vad som följer är förbereder den insamlade informationen för att jämföra den med de statistiska modellerna som har förbättrats genom sitt maskininlärningssystem.Här består processen av att hitta likheter mellan vad systemet har förstått att vi sa och de ord och sammanhang som finns i modellerna, för att sedan tillämpa tidigare inlärda transformationer som kommer att omvandla ljudet till text och översätta det till det främmande språket.
I det sista steget har Skype förberett ett par bots, med kvinnliga och manliga röster, som fungerar som tolkar i samtalet När en väl har v alts av användaren kommer han att ansvara för att kommunicera vårt översatta meddelande till mottagaren, så att inte bara de skrivna transkriptionerna och översättningarna visas på skärmen, utan han kan också höra dem högt som om en tredje människa var förmedlar oss emellan.. Dessa bots kan snabbt kommunicera meddelandet, så att den som lyssnar på andra sidan skärmen får meddelandet några sekunder efter att vi har uttalat det.
Testprogrammet som utgångspunkt
Just förekomsten av bots som tredjepartstalare i konversationen är en av detaljerna som fortfarande återstår att putsa. Microsoft inser att det är lätt för människor som är vana vid att tala genom en tolk att anpassa sig till dem, men för andra kräver det en inlärningsperiod. Och det är så att Microsoft och Skype kan vara fast beslutna att skapa den bästa översättningsupplevelsen i re altid som finns, men för att göra det behöver de att vi lär oss både oss själva och maskinernaFörhandsvisningen av Skype Translator är bara ett steg till i den processen.
Testprogrammet startade i mitten av december och introducerade talad översättning mellan två språk: engelska och spanska, och skriftlig översättning på mer än 40 För att komma åt det krävs en inbjudan som vi kan begära genom att registrera oss på programmets hemsida. Om vi är nöjda med det kan vi prova Skype Translator från Skype-applikationerna för Windows 8.1 eller Windows 10 teknisk förhandsvisning. Annars får vi vänta på att tjänsten förlängs och offentliggörs officiellt.
"Hur som helst, Skype Translator har börjat precis när vi ska säga hejdå till 2014. Innan du avslutar, stanna här en sekund och tänk på året du just läste: tvåtusen fjorton>"
Via | Skype Blogs I, II