https://frosthead.com

Jak zbudować ludzki głos

Jeden z bardziej rozpoznawalnych głosów na świecie należy do Stephena Hawkinga - chociaż, oczywiście, wcale nie jest to głos słynnego naukowca, ale generowany komputerowo w odpowiedzi na jego ruchy twarzy. Używa syntezatora do mówienia od prawie 25 lat, jego głos i zdolność do przeniesienia się dawno temu do ALS lub choroby Lou Gehriga. Dziś brytyjski astrofizyk jest identyfikowany przez swój robotyczny monotonny, który w rzeczywistości ma amerykański akcent.

Ale prawda jest taka, że ​​Hawking dzieli ten generowany komputerowo głos z tysiącami innych ludzi, niektórymi młodymi dziewczynami, niektórymi starszymi kobietami i innymi w każdym wieku i pochodzenia etnicznego na całym świecie. Wszyscy, niezdolni do mówienia w naturalny sposób, myślą o tym jak o swoim, choć nie ma w tym nic wyjątkowego.

I to po prostu nie wydaje się właściwe Rupalowi Patelowi.

Patel jest logopedą i dyrektorem nowego Centrum Nauk Mowy i Technologii na Uniwersytecie Northeastern. Od dawna czuła, że ​​głos pomaga zdefiniować jednostkę; wyraźnie kształtuje to, jak dana osoba jest znana na świecie. Nawet jeśli ludzie nie mogą mówić, czy nie powinni mieć możliwości komunikowania się za pomocą głosów, które są bardziej odpowiednie dla tego, kim są?

Od kilku lat ona i kolega z nauki mowy Tim Bunnell opracowują sposób konstruowania niestandardowych głosów, wykorzystując jako swoją esencję dźwięki, jakie może wydać dana osoba. Koncentrują się na wysokości i głośności tych dźwięków, a także na tym, jak dana osoba może wymówić określone litery, takie jak „ss” lub „ch”. Celem jest jak najdokładniejsze określenie tożsamości głosu.

Następnie staje się kwestią zbudowania nowego głosu - o wiele bardziej wyraźnego - poprzez zbieranie dźwięków od dawcy o podobnej płci, wieku, wielkości i pochodzeniu geograficznym. Aby oddać głos, nagrywana jest osoba czytająca wybór krótkich zdań, które łącznie obejmują każdą kombinację dźwięków w języku. Idealnie byłoby, gdyby nagrał aż 3000 różnych fraz. To zajmuje godziny. I chociaż nagrywanie nie musi odbywać się w jednej sesji, im więcej dźwięków może dostarczyć dawca, tym lepiej można wydobyć głos.

Z tej kolekcji dźwięków specjalnie zaprojektowane oprogramowanie tworzy słowa w inżynierii wstecznej, które są bliskie temu, jak mogłaby brzmieć dana osoba, gdyby nie miała zaburzeń mowy.

Czy to jest skalowalne?

Czy nie zajmie to niezbyt małej armii darczyńców czytających ogromną liczbę zdań, aby zbudować bazę danych dźwięków, które można przekształcić w spersonalizowane głosy?

Tak, to będzie, Patel mówi w ostatnim przemówieniu TED i dlatego kontynuuje to, co nazywa inicjatywą Human Voicebank.

Strona internetowa projektu, VocaliD.org, zawiera zarówno stronę rejestracji dla darczyńców, jak i drugą dla osób, które chcą uzyskać osobisty głos. Ci drudzy muszą podać swoje nazwiska i inne istotne informacje, takie jak ich zdolność mowy, która może wahać się od „całkowicie bez głosu” do „może wydawać dźwięki, ale nie słowa” do „może używać niektórych słów do komunikacji”.

Podczas gdy w początkowej fazie projektu powstało zaledwie kilka głosów, ponad 10 000 osób zgłosiło się na ochotnika, by zostać dawcami głosu, mówi Patel. „Kilkaset” innych, jak mówi, zapisała się, by zdobyć nowe głosy.

Patel mówi jednak, że istnieje kilka przeszkód, które napotykają, zmuszając darczyńców do przeczytania wszystkich materiałów potrzebnych do skonstruowania głosu. To wyzwanie jest jeszcze większe, biorąc pod uwagę, że w tej chwili wolontariusze muszą nagrywać w profesjonalnym studiu, aby zapewnić naukowcom próbki wysokiej jakości. Patel twierdzi, że opracowywane są narzędzia, które pozwoliłyby dawcom rejestrować wyroki w domu.

Jej wizją jest zebranie miliona różnych próbek głosu do 2020 roku. Ale już jej praca robi wrażenie. Witryna zawiera plik audio o długości zaledwie dwóch zdań, dostarczony przez młodą kobietę opisaną jako „dotknięta upośledzeniem mowy”. Jej słowa są tak wyraźne jak dzień:

„Ten głos jest tylko dla mnie. Nie mogę się doczekać, aby spróbować z moimi przyjaciółmi. ”

Oto Rupal Patel wyjaśniający inicjatywę Human Voicebank w przemówieniu TED:

Słyszeć głosy

Oto najnowsze badania dotyczące wpływu głosów:

  • Słuchaj swojej matki: Tylko dźwięk głosu matki może sprawić, że wcześniaki będą mogły jeść lepiej, zgodnie z badaniem opublikowanym w Pediatrics. Za pomocą smoczków wyposażonych w czujniki naukowcy ze Szpitala Dziecięcego Monroe Carell w Nashville nagrodzili dzieci, które prawidłowo ssały nagrania matek śpiewających kołysanki. Dzieci biorące udział w badaniu, które korzystały ze specjalnych smoczków - i słyszały głos matki - mogły wypaść z karmienia o tydzień wcześniej niż te, które tego nie zrobiły.
  • Witamy w komorze echa: poprzednie badania sugerowały, że ludzie wolą głosy, które brzmią, jakby pochodziły od małych kobiet lub dużych mężczyzn, ale nowe badanie z University of British Columbia twierdzi, że to, co naprawdę lubimy, to głosy, które brzmią jak nasze, w szczególności z akcentami, które znamy. Naukowcy powiedzieli również, że ludzie woleli głosy mężczyzn, którzy używali krótszych słów, i kobiet, które brzmiały zdyszane.
  • Słonie nigdy nie zapominają głosu: słonie afrykańskie najwyraźniej są całkiem dobrymi słuchaczami. Według dwuletnich badań w Kenii potrafią rozróżnić ludzkie głosy według płci, wieku, a nawet grupy etnicznej. Badacze zarejestrowali krzyczących mężczyzn, kobiety i dzieci Masajów i odtwarzali je przez głośnik ukryty przed stadami słoni. Dopiero gdy zwierzęta usłyszały głos dorosłych samców Masajów - grupy, z którą słonie są bardziej narażone na konfrontacje - zareagowały, skupiając się ochronnie wokół cieląt. Nie reagowali na głosy dorosłych mężczyzn z innego plemienia, Kamby, którzy jako rolnicy rzadko wchodzą w konflikt ze stadami.
  • Słyszą twój ból: po wykonaniu serii skanów mózgu u psów naukowcy ze Szkocji twierdzą, że psy są jak ludzie, ponieważ mają obszar mózgu poświęcony rozpoznawaniu i interpretowaniu głosów. I, zdaniem naukowców, twój pies może wydawać się tak zestrojony z twoimi uczuciami.
  • Wiedziałem, że coś jest z tobą inaczej: chirurgia plastyczna nie tylko zmienia twój wygląd; może również zmienić sposób, w jaki osoba brzmi. Według artykułu opublikowanego w czasopiśmie Plastic and Reconstructive Surgery, naukowcy z Iranu odkryli, że pacjenci, którzy mieli plastykę nosa lub nos, często myśleli, że ich głos brzmiał bardziej nosowo po zabiegu.
Jak zbudować ludzki głos