https://frosthead.com

Jak GPS uczy się mówić w Twoim języku

Karen Jacobsen, australijska piosenkarka i aktorka głosowa, dostała koncert w 2000 roku, wkrótce po przyjeździe do Nowego Jorku. Producenci - korporacyjni - wysłali ją na trzy tygodnie do studia nagraniowego, gdzie spędzała cztery godziny dziennie, mówiąc „na następnym skrzyżowaniu skręć w lewo” i „przeliczając”. W końcu to nie był jej głos to było napięte. „Powiedziałem„ około ”około 186 razy”, wspomina Jacobsen. „Takie rzeczy mogą sprawić, że zwariujesz.”

powiązana zawartość

  • Od Ptolemeusza do GPS, krótka historia map

Dwa lata później dostała telefon od przyjaciela. „Karen”, wyrzucił jej kumpel. „Kupiłem mężowi jedną z tych nowych rzeczy z GPS-a i nadaliśmy australijskiemu głosowi. To ty! ”W ten sposób Jacobsen dowiedziała się, że jej głos udziela wskazówek 400 milionom ludzi na całym świecie.

W jej pracach podkreśla się hybrydę krwi i technologii, która przechodzi w wszechobecne głosy, mówiąc nam, gdzie się zwrócić: ponad miliard osób korzysta z Google Maps co miesiąc, a 80 procent aktywuje opcję głosu.

We wczesnych dniach syntezy głosu - pomyśl o robotycznych dźwiękach Speak & Spell z końca lat siedemdziesiątych - algorytm przekształcił tekst w strumień monotoniczny. Następnie, gdy bazy danych rosły, można było nagrać aktora głosowego, takiego jak Jacobsen, wypowiadającego zbiór sylab i słów, które algorytmy łączyłyby i zmieniały zgodnie z podstawowymi zasadami. Niedawno koderzy oprogramowania w firmach takich jak Nuance, które projektują interfejsy nawigacyjne do samochodów, opracowali trzecie podejście - stosując głębokie uczenie się do syntezy mowy. Łączy zarejestrowane słowa i zsyntetyzowane fragmenty, wykorzystując sztuczną inteligencję, aby uczynić wymowę jeszcze bardziej ludzką. „Brzmią niesamowicie naturalnie”, mówi dyrektor ds. Technologii Nuance, Vlad Sejnoha.

Oczywiście dziwactwa językowe pozostają wyzwaniem dla systemów głosowych. „Myśl„ kupuj ”a„ kupuj ”lub„ czytaj ”i„ czytaj ”” - mówi rzecznik Google. „Mamy jednak nadzieję, że użytkownik zawsze zgadnie, o co nam chodziło”. Teraz, gdy sztuczna inteligencja uczy systemy nawigacji samochodowej inteligentniejszego mówienia, następnie przeszuka świat online i dowie się, dokąd chcesz się udać, zanim to zrobisz.

Preview thumbnail for video 'Subscribe to Smithsonian magazine now for just $12

Subskrybuj teraz magazyn Smithsonian za jedyne 12 USD

Ten artykuł pochodzi z lipcowego / sierpniowego wydania magazynu Smithsonian

Kupować
Jak GPS uczy się mówić w Twoim języku