Bing

Microsoft meddelar att dess taligenkänningsteknik minskar dess felfrekvens och är lika effektiv som människor

Anonim
"

Det är en av pelarna som många bekräftar att de olika plattformarna kommer att växa inom den närmaste framtiden. Inget att interagera med skrivna kommandon eller gester. Framtiden ligger i att prata med maskiner men inget att prata med robotkommandon och onaturliga order. Vi ska göra det med ett naturligt språk, något som vi uppskattar allt tydligare hos personliga assistenter."

Och ett av företagen som har en mest anmärkningsvärd karriär i denna mening är Microsoft, ett företag som har en utvecklingsväg där det arbetar för att ständigt förbättra röstigenkänningen för anställda än på deras plattformar.En teknik som vi nu har nyheter om från utvecklingsteamet, nyheter som talar om en stor förbättring som placerar den på samma precisionsnivå som den som används bland människor

I denna mening har de meddelat att deras röstigenkänningssystem har nått 5,1 % i WER, det vill säga felet i frekvensen av ordet som används. För många kanske detta inte säger någonting, men det är förvånande om vi ser hur å ena sidan denna frekvens är densamma som den vi hittar i kommunikation mellan människor

Från Redmondhar de v alt att använda sig av förbättrade modeller för verb alt och akustiskt språk baserat på användningen av neurala nätverkDessa är De kombineras med långsiktigt dubbelriktat minne så att akustisk modellering förbättras, vilket förbättrar igenkänningen tack vare en förutsägelse av de ord som kan användas baserat på en kommunikationshistorik.Dessa förbättringar har också stöd från molnet tack vare de ansträngningar som företaget har gjort för att förbättra infrastrukturen för molnberäkningar, särskilt med Azure.

Detta har dessutom inneburit att denna felfrekvens har sänkts vad gäller felmarginalen, sedan innan den var kl. 5,9 %, alltså en minskning från 12 %, vilket var den siffra som systemet hade för mindre än ett år sedan. Därför har Microsoft uppnått ett taligenkänningssystem som är lika effektivt som människors och med tanke på hur de utvecklas är det inte förvånande att de ens kommer att förbättra det under de kommande månaderna eller åren.

Vem vet om det om några år kommer att vara något så naturligt att prata med vår Windows-dator, interagera med Cortana eller applikationer som Office, som det de redan har fått oss att drömma (eller ha mardrömmar, vem vet) på bio.

I Xataka | De är inte röster från andra sidan graven, de är dolda kommandon som röstassistenter känner igen och som människor inte

Bing

Redaktörens val

Back to top button