Na większości kursów literackich na uczelniach studenci analizują małe fragmenty klasycznych dzieł literackich: monologi Szekspira, strumień świadomości Joyce i staccato zdania Hemingwaya. Bez wątpienia można się wiele nauczyć o pisarzu, jego rzemiośle i znaczeniu historii dzięki tego rodzaju ścisłemu czytaniu.
Ale Ben Blatt stanowi mocny argument za innym podejściem. Koncentrując się na niektórych zdaniach i akapitach, zakłada w swojej nowej książce, Ulubionym słowem Nabokova jest Mauve, czytelnicy zaniedbują wszystkie inne słowa, które w powieści o średniej długości stanowią dziesiątki tysięcy punktów danych.
Dziennikarz i statystyk stworzył bazę danych zawierającą fragmenty klasyków i bestsellerów XX wieku, aby ilościowo odpowiedzieć na szereg interesujących pytań. Jego analiza ujawniła kilka dziwacznych wzorów, które w przeciwnym razie mogłyby pozostać niezauważone:
Pod względem liczb najlepsze zdania otwierające powieści bywają krótkie. Sławny autor James Patterson średnio 160 klisz na 100 000 słów (to o 115 więcej niż szanowana Jane Austen), a Vladimir Nabokov używał słowa fioletowo 44 razy częściej niż przeciętny pisarz w ciągu ostatnich dwóch stuleci.
Smithsonian.com rozmawiał z Blattem o swojej metodzie, niektórych jego kluczowych odkryciach i dlaczego duże zbiory danych są ważne w badaniu literatury.
Podjąłeś podejście statystyczne do studiowania wszystkiego, od Where's Waldo po Seinfeld, fast foodów i popowych piosenek. Czy możesz wyjaśnić swoją metodę i dlaczego robisz to, co robisz?
Jestem dziennikarzem danych i patrzę na rzeczy w popkulturze i sztuce. Naprawdę lubię patrzeć na rzeczy ilościowo i bezstronnie, które zawierają wiele informacji, których ludzie nie przeszli. Gdybyś chciał dowiedzieć się, jaka jest typowa osoba ze Stanów Zjednoczonych, byłoby to przydatne, ale nie rozmawiałbyś tylko z jedną osobą, wiedziałbyś o niej wszystko, a następnie zakładał, że wszystko o ludziach w Stanach Zjednoczonych to podobnie. Myślę, że jedną z rzeczy, które gubią pisanie, jest to, że możesz skupić się na jednym zdaniu autora, szczególnie na zajęciach z kreatywnego pisania lub na jednym fragmencie, i tracisz większy obraz, aby zobaczyć te ogólne wzorce i trendy, których używają pisarze w kółko, setki, a może tysiące razy we własnym piśmie.
Ulubionym słowem Nabokova jest Mauve: Co mówią liczby o klasykach, bestsellerach i naszym własnym piśmie
KupowaćCo skłoniło cię do sięgnięcia po literaturę?
Moje wykształcenie to matematyka i informatyka, ale zawsze lubiłem czytać i pisać. Gdy pisałem coraz więcej, bardzo zainteresowałem się tym, jak różni pisarze i ludzie udzielają porad dotyczących pisania. Wiele z nich ma sens, ale wydaje się, że nie jest poparta informacją, i wiele z nich jest ze sobą sprzecznych. Pomyślałem, że musi istnieć sposób, aby wziąć pod uwagę te tematy na piśmie, że ludzie byli już świadomi i rozmawiali o nich oraz przetestować ich na wielkich autorach i popularnych autorach, aby zobaczyć, czy ta rada jest prawdziwa, czy też jest to porada nakazowa, która nie ” to naprawdę znaczy cokolwiek w prawdziwych książkach i prawdziwych stronach.
Jakie było pierwsze pytanie, które chciałeś zadać na temat literackich klasyków i bestsellerów?
Pierwszy rozdział tej książki jest o tym, czy powinieneś używać przysłówków. To także pierwszy rozdział, który napisałem chronologicznie. Głównie radzi Stephenowi Kingowi, aby nie używać - przysłówków w swojej książce O pisaniu, która dla wielu pisarzy jest książką o pisaniu. Ale wielu innych pisarzy - Toni Morrison, Chuck Palahniuk - i każda klasa twórczego pisania radzi, aby nie używać „tylko przysłówka”, ponieważ jest to niepotrzebne słowo i znak, że nie jesteś zwięzły. Zamiast powiedzieć: „Szybko uciekł”, możesz powiedzieć: „Biegł”.
Więc chciałem wiedzieć, czy to rzeczywiście prawda? Jeśli jest to tak dobra rada, można się spodziewać, że wielcy autorzy faktycznie używają jej rzadziej. Można się spodziewać, że pisarze amatorzy używają go częściej niż autorzy opublikowani. Chciałem po prostu wiedzieć stylistycznie, najpierw czy Stephen King zastosował się do swojej rady, a następnie, czy dotyczy ona wszystkich innych wielkich i szanowanych autorów.
Co znalazłeś?
W rzeczywistości istnieje trend, że autorzy tacy jak Hemingway, Morrison i Steinbeck, ich najlepszymi książkami, tymi, które są wstrzymywane i mają na nich największą uwagę, są książki z najmniejszą ilością przysłówków. Ponadto, jeśli porównasz pisanie amatorskiej fikcji i pisanie online, które nie jest edytowane z bestsellerami i laureatami Nagrody Pulitzera w ostatnim czasie, istnieje rozbieżność, w której opublikowani autorzy używają mniej przysłówków. Nie jestem tak jednostronny, że myślę, że możesz po prostu wyciągnąć przysłówki z dobrej książki i staje się to świetna książka. To oczywiście nie tak działa. Ale jest coś w tym, że pisarze piszący w bardzo bezpośredni sposób produkują książki, które ogólnie żyją najdłużej.
Jak poszedłeś do stworzenia bazy dzieł literackich?
W przypadku wielu pytań korzystałem z tych samych 50 autorów, których wybrałem nieco arbitralnie. Zasadniczo oparto go na autorach, którzy byli na szczycie listy bestsellerów, autorach, którzy byli na szczycie największych autorów wszystkich list czasowych i autorach, którzy po prostu reprezentowali szereg różnych gatunków i czasów oraz czytelników. W ten sposób w całej książce możesz porównać tych autorów i poznać ich.
Bardzo ważne było dla mnie, że gdybym powiedział coś w stylu „Toni Morrison używa tego słowa w takim tempie”, mówiłem o każdej powieści, jaką kiedykolwiek napisała, a nie tylko o trzech, które już mam. W mojej książce jest od 50 do 100 autorów, o których mowa w całym tekście. Znalazłem ich bibliografie, a następnie znalazłem wszystkie ich powieści, które napisały do tego momentu, jako ich pełny zapis. W pewnym sensie przypomina trochę prowadzenie statystyk sportowych, gdzie każda książka przypomina sezon, a potem wszystkie te sezony lub książki łączą się w karierę. Możesz zobaczyć, jak autorzy zmieniają się w czasie i jak robią to ogólnie. Po zebraniu wszystkich książek, udzielenie odpowiedzi na te pytania, które w pewnym sensie są bardzo zniechęcające, jest bardzo proste.
Jak przetworzyłeś cały ten tekst?
Istnieje język programowania o nazwie Python, w tym zestaw narzędzi o nazwie Natural Language Toolkit, często w skrócie NLTK. Zaangażowane w to narzędzia są bezpłatnie dostępne dla każdego. Możesz pobrać pakiet online i używać go w języku Python lub innych językach. Nie możesz dostać wielu szczegółowych pytań, ale możesz powiedzieć, ile razy to słowo pojawia się w tekście? Może przejrzeć i określić, gdzie kończą się zdania i gdzie zdania się zaczynają, oraz części mowy - przymiotnik vs. przysłówek vs. czasownik. Kiedy już będziesz mieć te narzędzia, możesz uzyskać dane.
Jakie statystyki skompilowałeś ręcznie? Co było najbardziej nużące?
Jest jedna sekcja, w której patrzę na zdania początkowe. Elmore Leonard, który był bardzo odnoszącym sukcesy pisarzem, powiedział: „Nigdy nie otwieraj książki z pogodą”. Jest to również rada zawarta w wielu przewodnikach pisarskich. Przejrzałem więc setki autorów, aby zobaczyć, jak często otwierają książkę o pogodzie. Na przykład, Danielle Steel, uważam, że 45 procent jej pierwszych zdań w książkach dotyczy pogody. Wiele razy to po prostu „To był wspaniały dzień” lub „Było jasno i słonecznie”, takie rzeczy. W tym celu nie było sposobu, aby zrobić to automatycznie bez błędu, więc po prostu przejrzałem wszystkie pliki książek i zaznaczyłem, czy jest to związane z pogodą. Można powiedzieć, że było to uciążliwe, ponieważ zgromadzono wiele danych, ale fajnie było przejrzeć i przeczytać setki zdań otwierających na raz. Istnieją inne wzorce, które z czasem wyraźnie wyłaniają się od autorów.
Jak mówisz, dla niektórych nudne, dla innych zabawne. Niektórzy mogą myśleć, że to analityczne podejście jest nudne, ale twierdzisz, że może być „zabawne” i „często wręcz zabawne”. Jakie było twoje najśmieszniejsze stwierdzenie?
Tytuł książki, Ulubionym słowem Nabokova, jest Mauve, mówi o tym, że pod względem liczbowym słowo, którego używa w najwyższym stopniu w porównaniu z angielskim, jest fioletowe. To ma sens, jeśli spojrzysz na jego pochodzenie, ponieważ miał synestezję. W swojej autobiografii mówił o tym, że kiedy słyszy różne litery i dźwięki, jego mózg automatycznie wyczarowuje kolory.
Powtórzyłem ten eksperyment na 100 innych autorach, aby zobaczyć, jakie jest ich ulubione słowo. W rezultacie otrzymujesz trzy słowa reprezentujące ich pisanie według słów, których najczęściej używają. Uprzejmość, fantazja i nieroztropność. To Jane Austen. Myślę, że jeśli zobaczysz te słowa, Jane Austen może być jednym z twoich pierwszych zgadnięć. A potem masz takiego autora, jak John Updike, który jest trochę bardziej szorstki, prawdziwy i innego czasu. Jego ulubione słowa to obramowanie, ukłucie i pieprzenie. Myślę, że obserwowanie osobowości opartej na tych prostych matematycznych pytaniach jest bardzo interesujące. Jeśli masz ulubionego autora, przejrzenie go w pewien sposób ujawnia coś o jego osobowości, czego być może wcześniej nie zauważyłeś.
Ray Bradbury napisał, że jego ulubionym słowem jest cynamon. Według liczb, on często tego używa. Wyjaśniał, dlaczego lubi cynamon, że przypomina mu spiżarnię babci. Przeszukałem więc inne słowa przyprawowe i powąchałem słowa, które mogłyby kojarzyć się ze spiżarnią babci, a Ray Bradbury używa większości tych słów w bardzo szybkim tempie. W pewnym sensie można dostrzec to dziwne, freudowskie spojrzenie na dzieciństwo dzieci. Jeśli Ray Bradbury tego nie powiedział, być może nadal byś to wymyślił.
Porównywałeś pisarzy amerykańskich i brytyjskich, potwierdzając stereotyp, że Amerykanie są głośni. Czy możesz to wyjaśnić?
Ten był faktycznie oparty na badaniu przeprowadzonym przez doktoranta ze Stanford. Zidentyfikował słowa, które są używane do opisania dialogu w książkach, i opisał je jako głośne, neutralne lub ciche. „Szeptane” i „szepczące” byłyby cicho. Neutralne byłoby „powiedział” lub „ona powiedziała”, a głośne byłoby „wykrzyknął” lub „krzyknął”. Przejrzałem 50 autorów, na które spojrzałem, a także duże próbki fikcji fanów i stwierdziłem, że nie przez szalony margines, ale znaczący margines, że Amerykanie mają wyższy stosunek głośnych słów do cichych słów. Istnieje kilka wyjaśnień. Możliwe, że tak właśnie rozmawiają Amerykanie przez całe życie, tak pisarze często je opisują. Można również zobaczyć, że amerykańscy pisarze preferują bardziej oparte na akcji, thrillery i opowieści o wysokim tempie w porównaniu do bardziej subtelnych. Liczby Amerykanów są rzeczywiście głośniejsze.
Ben Blatt, autor ulubionego słowa Nabokova, jest Mauve (Sierra Katow)Dlaczego według ciebie zastosowanie matematyki do pisania jest dobrym sposobem na studiowanie literatury?
Zdecydowanie nie zalecam, aby był to pierwszy sposób studiowania literatury, jeśli próbujesz poprawić swoje pisanie. Ale nawet powieść o umiarkowanej długości ma prawdopodobnie 50 000 słów, a to 50 000 punktów danych. Po prostu nie będziesz w stanie wchłonąć tego wszystkiego naraz, i będą pewne pytania, na które po prostu nie potrafisz odpowiedzieć. Dobrze jest zobaczyć większy obraz. Jeśli usiądziesz i przestudiujesz jeden akapit, będziesz na zajęciach z kreatywnego pisania i rozmawiasz z profesorem, jeśli istnieje na to ustalony sposób, po prostu zobaczysz to we wszystkim. Ale dzięki danym ten rodzaj uwalnia cię od nich i możesz odpowiedzieć na niektóre pytania bez tych uprzedzeń i naprawdę uzyskać nowe informacje.
Wspominasz, że wciąż myślałeś o „The Great Grammatizator” Roalda Dahla.
Jest świetna historia Roalda Dahla, w której inżynier w zasadzie wymyśla sposób na napisanie historii. W tym scenariuszu zagłady ktoś może po prostu przedstawić maszynie fabułę, która wypluje ostatnią powieść. Sugestia polega na tym, że produkują powieści tak formalne i podstawowe. Bohater tej opowieści postanawia nie brać udziału w działaniu maszyny i walczy z nią, tworząc własne pismo i sztukę.
Zdecydowanie uważam, że ta książka, jeśli jesteś w trakcie pisania, odpowie na wiele pytań i zdecydowanie zmieni sposób myślenia o niektórych rzeczach, ale ostatecznie nie ma naprawdę zamiany pomysłów, które skłaniają ludzi do myślenia i scen, które skłaniają ludzi do myślenia lękliwy lub łącz się z bohaterami. Ta książka opowiada o sztuce pisania i niekoniecznie o tym, jak stworzyć niezapomnianą historię. Ta książka nie próbuje stworzyć idealnej powieści i nie sądzę, że jesteśmy tak blisko, jak niektórzy mogą się bać.