https://frosthead.com

Rozmowa z maszynami

Oprogramowanie do rozpoznawania głosu, większość z nas prawdopodobnie by się zgodziło, to całkiem fajna rzecz. Ale rozmowa z maszynami - czy to smartfon, ekran telewizora czy deska rozdzielcza - cóż, nie tak bardzo. Pytanie o urządzenie? Cuchnie maniakiem. Wymawia każde słowo, abyś mógł być zrozumiany? Jak naprawdę możesz być naprawdę fajny?

Ale Apple, zgodnie z prawdziwą formą, podjęło tę decyzję, zatrudniając trzy ikony cool, aby zagrać w swojej najnowszej kampanii reklamowej dla Siri, głosu iPhone'a 4S. Są Zooey Deschanel (Adorable Cool) i John Malkovich (Cerebral Cool) i Samuel L. Jackson (Ultimate Cool) i wszyscy sprawiają, że angażowanie się w grę słowną z telefonem wydaje się być bogiem.

Krytycy zwracają jednak uwagę, że w prawdziwym życiu Siri nie jest tak wrażliwa ani wszechwiedząca, jak jest przedstawiana w reklamach. Jestem pewien, że ty też jesteś zszokowany, gdy to słyszę. Inni uważają, że cała ta sprawa jest gotowa do parodii - zobacz, jak brat Zooeya, Jooey, robi zabawną wersję Die deszczowego dnia Zooey i Siri.

Bez znaczenia. Siri została wokalistką w refrenie robota, głosie „You Got Mail” nowej generacji.

W niektórych kręgach modne jest sugerowanie, że Siri nie jest warta Steve'a Jobsa, że ​​gdyby nadal żył, Jobs wycofałby go z rynku, a przynajmniej nigdy nie zaakceptowałby tak głośnej reklamy kampania dla tak wadliwego produktu.

Ale, jak powiedział następca Jobsa, Tim Cook, wcześniej w tym tygodniu, właściciele iPhone'a 4S tacy jak Siri. Według badania opublikowanego w marcu prawie 90 procent twierdzi, że używa go co najmniej raz w miesiącu. I pamiętaj, że Siri, jeden z niewielu produktów Apple, o których mówi się, że jest w fazie beta, kiedy zostanie wydany, nie będzie obchodzić swoich pierwszych urodzin do października. Wciąż uczy się języka, a co ważniejsze, dopiero zaczyna wykorzystywać potencjał sztucznej inteligencji.

Siri będzie prawdopodobnie centralnym punktem Apple TV, który ma zadebiutować w grudniu. Ale są szanse, że miejsce, w którym rozmowa z maszynami trafi do głównego nurtu, jest w naszych samochodach.

Jedź, powiedziała

Jasne, to już się dzieje, ale jeśli chcesz być zrozumiany, nadal musisz przejść na mowę robota. I nawet wtedy nie ma gwarancji. To zacznie się zmieniać tego lata, gdy niektóre nowe modele będą wyposażone w coś o nazwie Dragon Drive!

To wynalazek Nuance Communications, firmy z Massachusetts, która stała się potęgą w branży rozpoznawania głosu. (Powszechnie uważa się, że to właśnie mózg Siri.) Niuanse i rozpoznawanie głosu w samochodach zrobiły duży krok naprzód w zeszłym tygodniu, kiedy firma ogłosiła, że ​​Dragon Drive! będzie mógł skorzystać z chmury.

Oznacza to, że system znacznie zwiększy moc obliczeniową i możliwości pamięci. A to oznacza, że ​​głos na twoim pulpicie stanie się bardziej podobny do Siri i pozwoli ci faktycznie z nim rozmawiać. Nigdy więcej krzyków jednosylabowych. Nadchodzi dzień, w którym będziesz mógł swobodnie wspomnieć, że czujesz się jak niektórzy Bracia Allman, a kilka sekund później „Whipping Post” zacznie pompować przez głośniki.

Kluczem jest to, jak dobrze potrafimy uczyć kontekstu maszynowego i pragmatyki - jak język jest używany w sytuacjach społecznych. A to trudna sprawa. Na początek nawet najbardziej wyrafinowane urządzenie do rozpoznawania głosu musi poczekać, aż człowiek skończy mówić, aby mógł przeanalizować i zinterpretować całe zdanie. Jest też „teoria umysłu”, zdolność rozumienia, że ​​inni ludzie mogą mieć inne przekonania i intencje niż nasze własne. O ile nam wiadomo, tylko ludzie mogą to zrobić.

Niedawne badanie przeprowadzone przez dwóch psychologów ze Stanford może dać ci wyobrażenie o tym, co pomaga w intuicyjnym działaniu maszyn. Badacze Michael Frank i Noah Goodman przeprowadzili internetowy eksperyment, w którym uczestnicy zostali poproszeni o obejrzenie zestawu obiektów, a następnie wybranie, który z nich będzie określany jako konkretne słowo. Na przykład jedna grupa uczestników widziała niebieski kwadrat, niebieski okrąg i czerwony kwadrat. Pytanie dla tej grupy brzmiało: Wyobraź sobie, że rozmawiasz z kimś i chcesz odnieść się do środkowego obiektu. Jakiego słowa byś użył, „niebieski” lub „kółko”?

Drugiej grupie zapytano: Wyobraź sobie, że ktoś z tobą rozmawia i używa słowa „niebieski” w odniesieniu do jednego z tych obiektów. O jakim obiekcie mówią?

Odpowiedzi pomogły naukowcom uzyskać wyraźniejszy obraz tego, w jaki sposób słuchacz rozumie mówcę i jak decyduje, co powiedzieć. Na tej podstawie opracowali rodzaj modelu matematycznego, który może rozszerzyć i udoskonalić proces myślowy komputera.

Frank powiedział: „To zajmie lata pracy, ale marzeniem jest komputer, który naprawdę myśli o tym, czego chcesz i co masz na myśli, a nie tylko o tym, co powiedziałeś”.

Sposób wypowiedzi

Oto kilka najnowszych osiągnięć w rozpoznawaniu głosu:

  • Siri milczy: IBM zwykle denerwuje się ujawnieniem tajemnic korporacyjnych, dlatego zabrania pracownikom korzystania z publicznych witryn do przesyłania plików, takich jak Dropbox. Ale ma również zakaz używania Siri w biurze, ponieważ szefowie bezpieczeństwa martwią się, że ktoś podczas rozmowy z telefonem może ujawnić poufne informacje, które trafią na serwery Apple.
  • Weźmy to, Apple !: Samsung wypuścił w tym tygodniu swój nowy smartfon Galaxy X III w Londynie, a chociaż jego duży ekran dotykowy cieszy się dużym zainteresowaniem, oferuje także nowe oprogramowanie do rozpoznawania głosu i twarzy.
  • Rób to, co mówię, a nie to, co robię: a Samsung nie poprzestanie na tym. Niedawno złożył wniosek patentowy na robota, który rozumie ludzką mowę. Robot byłby w stanie dostosować swoje możliwości „słuchania”, aby uwzględnić hałas otoczenia, który może zakłócać lub zakłócać wydawane polecenia. Byłby także w stanie rozpoznać, kto do niego mówi, nawet jeśli hałas w tle jest bardzo głośny.

Bonus Infographic: Myślisz, że Twój samochód jest teraz skomputeryzowany. Poczekaj, aż zostanie całkowicie podłączony do Internetu. Dowiedz się, co może zrobić podłączony samochód.

Rozmowa z maszynami