Domov Názory Svatý grál hlasového překladu, nyní na skype john c. dvorak

Svatý grál hlasového překladu, nyní na skype john c. dvorak

Video: Занятие по скайпу | Как провести? | Дистанционное занятие (Listopad 2024)

Video: Занятие по скайпу | Как провести? | Дистанционное занятие (Listopad 2024)
Anonim

Pokud jste sledovali počítačovou revoluci od počátku mikroprocesoru, měli byste vědět, že existuje řada časných příslibů, která ještě musí být splněna.

Jedním z nich je on-the-the-fly přeložená řeč, kde řeknete něco v angličtině a opakuje se v jiném jazyce, jako je španělština, v reálném čase. Přestože Microsoft stále pracuje, Microsoft je nyní o krok blíže k Skype Translator, jehož první fáze byla zveřejněna tento týden.

Pokud se to blíží práci a není to vtip, je to produkt desetiletí. Skype Translator právě podporuje překlady ze španělštiny do angličtiny a ze angličtiny do španělštiny, ale bude následovat více jazyků.

Typickým problémem s těmito druhy věcí je neuvěřitelná úroveň obtížnosti. Ještě jsem neviděl slušný překladový balíček, který by dobře fungoval s překlady z textu na text. Překlad řeči má zcela odlišnou úroveň obtížnosti, zejména v reálném čase.

Společnost Microsoft má film zobrazující dvě děti hovořící španělsky a anglicky, díky čemuž vypadá dobře. Ale viděl jsem podobný systém demonstrovaný IBM téměř před 20 lety, který nikdy neviděl denní světlo. Verze společnosti IBM byla vyvinuta v 90. letech, kdy existovala mánie pro rozpoznávání řeči vedená společností Lernout & Hauspie, společností, která se rozpadla - předtím, než v roce 2001 překonala podvodný skandál. Předtím však kupovala každou řečovou technologii společnosti, včetně Dragon Systems, Berkeley Speech Technologies, Fonix, Dictaphone a dalších. Microsoft měl 8% podíl v L&H a skončil s některými technologiemi jako dar pro bankrot.

Nyní se náhle objeví Skype Translator. Náhoda? Ať je to jakkoli, celá tato technologie trvala příliš dlouho, než se dostala k tomuto bodu.

Podívejte se na mizerné počítačové překlady text-text, které provádí společnost Google a další. Text neodhalí a nemůže se vyhnout nejviditelnějším chybám. Nic z toho se nepřibližuje ke složitosti překladu řeči, což vyžaduje těžké zpracování signálu.

Jsem sběratel vína a často navštěvuji webové stránky francouzských vinařství. Moje francouzština je v pořádku, takže často překládám překlad, abych si stránky rychle přečetl. Jsme zde v roce 2014 a žádný z překladatelů nedokáže zjistit, že překladem zámku Château Margaux je Château Margaux, nikoli Castle Margaux. Jak obtížné je přeložit a nepřekládat běžně používané slovo používané ve vlastním jménu, jako je zámek, obvykle odkazující na konkrétní vinařství, do slova hrad? Zjevně to není možné. Všichni to dělají.

Jak těžké je napsat nějakou výjimku do kódu, který říká překladateli, že je na webové stránce o víně Bordeaux? Zatímco na tomto místě slovo zámek neznamená hrad. Překladatel se často pokusí dekódovat i zbytek názvu zámku s směšnými výsledky. To nejlepší, co můžete obecně udělat s překladem textu, je, že vás napadne, co web říká.

Zeptejte se sami sebe: pokud je text tak obtížný, jak bude Microsoft řídit řeč?

Je to téměř nemožné i ve stejném jazyce. Využijte telefonní službu Google Voice. Má funkci převodu textu na text. Nikdy jsem neobdržel hlasovou zprávu, která by se přiblížila tomu, co dotyčná osoba skutečně řekla. Ani jednou.

Přiznám se, že v tiché místnosti, když mluvíš jasně a jasně, hlasové rozpoznávání funguje dobře. Používám jej pro textové zprávy v telefonu Android. Ale ve skutečné konverzaci nikdo takhle nemluví. Obdivuji společnost Microsoft za to, že se to podařilo. Ale nebude fungovat tak, jak je inzerováno.

To znamená, že je to alespoň něco, s čím si můžete hrát. Mohlo by to dokonce vyvolat novou generaci výzkumu. Takže si nebudu moc stěžovat.

Každý to chce. Vraťme se k tomu.

Svatý grál hlasového překladu, nyní na skype john c. dvorak