Na maioria dos cursos de literatura de nível universitário, você encontra estudantes dissecando pequenas porções de clássicos literários: os solilóquios de Shakespeare, o fluxo de consciência de Joyce e as frases em staccato de Hemingway. Sem dúvida, há muito que se pode aprender sobre um escritor, seu ofício e o significado de uma história por esse tipo de leitura atenta.
Mas Ben Blatt faz um forte argumento para outra abordagem. Concentrando-se em certas frases e parágrafos, ele postula em seu novo livro, Nabokov's Favorite Word is Mauve, os leitores estão negligenciando todas as outras palavras, que, em um romance de tamanho médio, somam dezenas de milhares de pontos de dados.
O jornalista e estatístico criou uma base de dados do texto de um punhado de clássicos e best-sellers do século XX para responder quantitativamente a uma série de questões de interesse. Sua análise revelou alguns padrões peculiares que poderiam passar despercebidos:
Pelos números, as melhores frases de abertura para romances tendem a ser curtas. O autor prolífico James Patterson calcula a média de 160 clichés por 100.000 palavras (que é 115 mais do que a reverenciada Jane Austen), e Vladimir Nabokov usou a palavra malva 44 vezes mais do que o escritor médio dos últimos dois séculos.
Smithsonian.com conversou com Blatt sobre seu método, algumas de suas principais descobertas e por que o big data é importante para o estudo da literatura.
Você adotou uma abordagem estatística para estudar tudo, de Where's Waldo a Seinfeld, junções de fast food a músicas pop. Você pode explicar seu método e por que você faz o que faz?
Sou jornalista de dados e vejo as coisas na cultura pop e na arte. Eu realmente gosto de ver as coisas de forma quantitativa e imparcial que têm muita informação que as pessoas não passaram. Se você quisesse aprender sobre como é a pessoa típica dos Estados Unidos, seria útil, mas você não apenas conversaria com uma pessoa, saberia tudo sobre ela e então presumiria que tudo sobre as pessoas nos Estados Unidos é o mesmo. Acho que uma coisa com escrever que se perde é que você pode se concentrar em uma frase de um autor, especialmente em aulas de redação criativa, ou em uma passagem, e você perde o quadro maior para ver esses padrões e tendências gerais que os escritores estão usando uma e outra vez, centenas e talvez milhares de vezes em sua própria escrita.
A palavra favorita de Nabokov é malvada: o que os números revelam sobre os clássicos, os best-sellers e nossa própria redação
ComprarEntão, o que fez você se voltar para a literatura?
Minha formação é em matemática e ciência da computação, mas sempre gostei de ler e escrever. Como eu estava escrevendo mais e mais, fiquei muito interessado em como diferentes escritores e pessoas dão conselhos de escrita. Há muito disso que fazia sentido, mas parecia não estar respaldado por informações, e muitas delas conflitavam umas com as outras. Eu apenas pensei que tinha que haver uma maneira de pegar esses tópicos por escrito que as pessoas já estavam bem cientes e falando sobre e testá-los em grandes autores e autores populares para ver se esse conselho é real ou se é um conselho prescritivo que não faz. Na verdade, não significa nada nos livros reais e nas páginas reais.
Qual foi a primeira pergunta que você queria fazer sobre clássicos literários e best-sellers?
O primeiro capítulo do livro está no conselho de se você deve ou não usar advérbios. Este é também o primeiro capítulo que escrevi cronologicamente. É principalmente sobre o conselho de Stephen King não usar advérbios - em seu livro On Writing, que para muitos escritores é o livro sobre escrita. Mas muitos outros escritores - Toni Morrison, Chuck Palahniuk - e qualquer classe de redatores criativos aconselham a não usar um advérbio - porque é uma palavra desnecessária e um sinal de que você não está sendo conciso. Em vez de dizer: "Ele correu rapidamente", você pode dizer: "Ele correu".
Então eu queria saber, isso é realmente verdade? Se esse é um bom conselho, você esperaria que os grandes autores realmente o usassem menos. Você esperaria que escritores amadores a usassem mais do que autores publicados. Eu realmente queria saber, estilisticamente, primeiro se Stephen King seguisse seu próprio conselho, e então se aplicasse a todos os outros grandes e reverenciados autores.
Então, o que você achou?
De fato, há uma tendência de que autores como Hemingway, Morrison e Steinbeck, seus melhores livros, os que são mais detidos e têm mais atenção sobre eles agora, são os livros com o menor número de advérbios. Além disso, se você comparar a escrita de ficção amadora e a escrita on-line sem edição com best-sellers e ganhadores do Prêmio Pulitzer dos últimos tempos, há uma discrepância, na qual os advérbios menos usados são usados pelos autores publicados. Eu não sou tão unilateral que eu acho que você pode simplesmente tirar os advérbios de um livro certo e isso se torna um ótimo livro. Obviamente não é assim que funciona. Mas há algo no fato de que escritores que escrevem de maneira muito direta produzem livros que em geral vivem mais tempo.
Como você criou um banco de dados de obras literárias?
Para muitas das perguntas, eu estava usando os mesmos 50 autores que eu escolhi arbitrariamente. Essencialmente, foi baseado em autores que estavam no topo da lista de best-sellers, autores que estavam no topo dos maiores autores de todos os tempos e autores que apenas representavam uma gama de diferentes gêneros e tempos e leitores. Dessa forma, ao longo do livro, você pode comparar esses autores e conhecê-los.
Foi muito importante para mim que, se eu dissesse algo como “Toni Morrison usa essa palavra nesse ritmo”, eu estava falando sobre cada romance que ela escreveu e não apenas sobre os três que eu já tenho. No meu livro, existem 50 a 100 autores que são referidos em todo. Eu encontrei suas bibliografias e, em seguida, encontrei todos os seus romances que eles tinham escrito até o momento como seu registro completo. De certa forma, é um pouco como manter estatísticas esportivas, onde cada livro é como uma temporada e, em seguida, todas essas temporadas ou livros se juntam como uma carreira. Você pode ver como os autores mudam com o tempo e como eles fazem as coisas em geral. Depois de ter todos os livros em arquivo, responder a essas perguntas que, de certa forma, são muito assustadoras é muito simples.
E como você processou todo esse texto?
Existe uma linguagem de programação chamada Python e, dentro dela, há um conjunto de ferramentas chamado Natural Language Toolkit, geralmente abreviado NLTK. As ferramentas envolvidas estão disponíveis gratuitamente para qualquer pessoa. Você pode baixar o pacote online e usá-lo em Python ou em outros idiomas. Você não pode ter muitas das perguntas escritas em particular, mas você pode dizer quantas vezes essa palavra aparece no texto? Ele pode passar e identificar onde as sentenças terminam e onde as sentenças começam, e partes do discurso - adjetivo versus advérbio versus verbo. Então, depois de ter essas ferramentas, você pode obter os dados.
Quais estatísticas você compilou manualmente? Qual foi o mais tedioso?
Há uma seção em que analiso as frases iniciais. Elmore Leonard, que era um romancista de muito sucesso, disse: "Nunca abra um livro com o tempo". Esse também é um conselho encontrado em muitos guias de redação. Então eu passei por centenas de autores para ver quantas vezes eles abrem seu livro sobre o clima. Por exemplo, Danielle Steel, acredito que 45% de suas primeiras frases em livros são sobre o clima. Muitas vezes é apenas "Foi um dia magnífico" ou "Foi claro e ensolarado", coisas assim. Para isso, não havia como fazer isso automaticamente sem ter algum erro, então eu iria apenas passar por todos os arquivos do livro e marcar se havia algum tempo envolvido. Você pode dizer que foi tedioso, porque foram muitos dados coletados, mas foi divertido ler centenas de frases de abertura de uma só vez. Existem outros padrões que claramente emergem dos autores ao longo do tempo.
Como você diz, tedioso para alguns, divertido para os outros. Alguns podem achar que essa abordagem analítica é entediante, mas você argumenta que ela pode ser “divertida” e “muitas vezes francamente engraçada”. Qual foi a sua descoberta mais engraçada?
O título do livro, A Palavra Favorita de Nabokov é Mauve, é sobre como, pelos números, a palavra que ele usa na maior taxa em relação ao inglês é malva. Isso acaba fazendo muito sentido se você olhar para o seu passado, porque ele tinha sinestesia. Ele falou, em sua autobiografia, sobre como quando ouvia letras e sons diferentes, seu cérebro evocava cores automaticamente.
Eu repeti esse experimento em 100 outros autores para ver qual é a palavra favorita deles. Como resultado, você obtém três palavras que representam sua escrita pelas palavras que mais usam. Civilidade, fantasia e imprudência. Essa é Jane Austen. Eu acho que se você viu essas palavras, Jane Austen pode ser uma das suas primeiras suposições. E então você tem um autor como John Updike, que é um pouco mais corajoso e real e de um tempo diferente. Suas palavras favoritas são orladas, picadas e fodidas. Eu acho que ver a personalidade através dessas simples questões matemáticas é muito interessante. Se você tem um autor favorito, passar revela algo sobre sua personalidade que você pode não ter percebido antes.
Ray Bradbury escreveu que sua palavra favorita era canela. Pelos números, ele usa muito isso. Sua explicação de por que ele gostava de canela era que isso o lembrava da despensa de sua avó. Então eu fui e encontrei outras palavras de especiarias e cheirava palavras que poderiam ser associadas à despensa de uma avó, e Ray Bradbury usa a maioria dessas palavras a uma taxa muito alta. De certa forma, você pode ter esse estranho olhar freudiano em algo sobre a infância dos autores. Se Ray Bradbury não tivesse dito isso, talvez você ainda pudesse descobrir.
Você comparou escritores americanos e britânicos, confirmando um estereótipo de que os americanos são barulhentos. Você pode explicar isso?
Este foi realmente baseado originalmente em um estudo feito por um estudante de graduação em Stanford. Ele identificou palavras que são usadas para descrever o diálogo em livros e as descreveu como barulhentas, neutras ou silenciosas. "Sussurrou" e "murmurou" estaria em silêncio. Neutro seria "ele disse" ou "ela disse", e alto seria "ele exclamou" ou "gritou". Eu passei pelos 50 autores que eu olhei, bem como grandes amostras de fan fiction, e achei, não por uma margem louca, mas uma margem significativa, que os americanos têm uma proporção maior entre as palavras mais altas e as palavras mais sossegadas. Existem algumas explicações. Pode ser que seja assim que os americanos falam durante toda a vida, então é assim que os escritores os descrevem falando freqüentemente. Você também pode ver isso como escritores americanos tendo uma preferência por mais histórias baseadas em ação, suspense e ritmo, em comparação com as mais sutis. Os americanos são de fato mais altos pelos números.
Ben Blatt, autor da palavra favorita de Nabokov é malva (Sierra Katow)Por que você acha que aplicar a matemática à escrita é uma boa maneira de estudar literatura?
Eu definitivamente não estou defendendo que esta seja a primeira maneira de estudar literatura se você está tentando melhorar sua escrita. Mas até mesmo um romance de duração moderada é provavelmente de 50.000 palavras, e são 50.000 pontos de dados. Você não vai conseguir absorver tudo de uma vez, e haverá algumas perguntas que você não pode responder lendo sozinho. É bom ver a foto maior. Se você se sentar e estudar um parágrafo, você está em sua aula de redação criativa conversando com seu professor, se há uma maneira definida de olhar para isso, você vai ver isso ao longo de tudo. Mas com os dados, isso te liberta disso, e você pode responder a algumas perguntas sem esses preconceitos e obter realmente novas informações.
Você menciona que ficou pensando no "The Great Grammatizator" de Roald Dahl.
Há uma grande história de Roald Dahl em que essencialmente um engenheiro cria uma maneira de escrever uma história. Neste cenário do dia do juízo final, alguém pode simplesmente dar à máquina um enredo e cuspirá um romance final. A insinuação é que eles estão produzindo romances tão estereotipados e básicos. O protagonista nessa história opta por não se juntar à operação da máquina e luta contra ela criando sua própria escrita e arte.
Eu definitivamente acho que este livro, se você estiver escrevendo, responderá muitas perguntas para você e definitivamente mudará sua maneira de pensar sobre algumas coisas, mas no final não há substituto para idéias que fazem as pessoas pensarem e cenas que fazem as pessoas com medo ou se conectar com os personagens. Este livro está olhando para o ofício de escrever e não necessariamente como criar uma história memorável. Este livro não está tentando criar um romance perfeito, e eu não acho que estamos tão perto disso quanto algumas pessoas podem temer.