• Knowable Magazine

Como os algoritmos descobrem nossas emoções

Cientistas e empresas vasculham nossos sentimentos no que escrevemos online.


Análise de sentimento: as raízes já têm 50 anos | Imagem: cc0 Gerd Altmann/Pixabay

Muitas pessoas têm declarado que 2020 é o pior ano de todos. Embora essa descrição possa parecer irremediavelmente subjetiva, ela é verdadeira de acordo com uma medida.


Esse parâmetro é o Hedonômetro, uma forma computadorizada de avaliar nossa felicidade e nosso desespero. Ele é executado dia após dia nos computadores da Universidade de Vermont (UVM), onde obtém cerca de 50 milhões de tuítes por dia do Twitter e, em seguida, fornece uma leitura rápida e superficial do humor do público.


De acordo com o Hedonômetro, 2020 tem sido de longe o ano mais horrível desde que esses registros começaram em 2008.


O Hedonômetro é uma encarnação relativamente recente de uma tarefa na qual os cientistas da computação vêm trabalhando há mais de 50 anos: usar computadores para avaliar o tom emocional das palavras.


Para construir o Hedonômetro, o cientista da computação da UVM Chris Danforth teve que ensinar uma máquina a entender as emoções por trás desses tuítes - nenhum ser humano poderia ler todos eles. Esse processo, chamado de análise de sentimento, fez grandes avanços nos últimos anos e está encontrando cada vez mais usos.


Além de medir a temperatura emocional do usuário do Twitter, os pesquisadores estão empregando análise de sentimento para avaliar as percepções das pessoas sobre as mudanças climáticas e para testar a sabedoria convencional.


Na música, por exemplo, avaliam se um acorde menor é considerado mais triste do que um acorde maior (e em que medida).


As empresas que desejam informações sobre os sentimentos dos clientes estão aproveitando a análise de sentimento para examinar as avaliações em plataformas como o Yelp.


Algumas empresas estão usando a análise de sentimento para medir o humor dos funcionários nas redes sociais internas do trabalho. A técnica também pode ter aplicações médicas, como identificar pessoas deprimidas que precisam de ajuda.


A análise de sentimento está permitindo que os pesquisadores examinem um dilúvio de dados que antes eram demorados e difíceis de coletar, quanto mais de estudar, diz Danforth. “Em ciências sociais, tendemos a medir coisas que são fáceis, como o produto interno bruto. A felicidade é algo importante e difícil de medir.”


Desconstruindo a 'sopa de palavras'


Você pode pensar que o primeiro passo na análise de sentimento seria ensinar o computador a entender o que os humanos estão dizendo. Mas isso é uma coisa que os cientistas da computação não podem fazer; compreender a linguagem é um dos problemas mais difíceis da inteligência artificial.


No entanto, existem muitas pistas sobre as emoções por trás de um texto escrito, que os computadores podem reconhecer mesmo sem compreender o significado das palavras.


A primeira abordagem para a análise de sentimento é a contagem de palavras. A ideia é bastante simples: conte o número de palavras positivas e subtraia o número de palavras negativas.


Uma medida ainda melhor pode ser obtida ponderando as palavras: “excelente”, por exemplo, transmite um sentimento mais forte do que “bom”. Esses pesos são normalmente atribuídos por especialistas humanos e fazem parte da criação dos dicionários palavra-para-emoção, chamados léxicos, que as análises de sentimento costumam usar.


Mas a contagem de palavras tem problemas inerentes. Uma é que ignora a ordem das palavras, tratando a frase como uma espécie de sopa de palavras. E a contagem de palavras pode perder dicas específicas do contexto.


Considere esta análise de produto: “Estou tão feliz que meu iPhone não se parece em nada com meu velho e feio Droid.” A frase contém três palavras negativas (“nada”, “velho”, “feio”) e apenas uma positiva (“feliz”).


Embora um humano reconheça imediatamente que “antigo” e “feio” se referem a um celular diferente, parece negativo para o computador.


E as comparações apresentam dificuldades adicionais: o que significa “nada como”? Isso significa que a pessoa não está comparando o iPhone com o Android? A língua pode ser tão confusa...


Para lidar com essas questões, os cientistas da computação têm se voltado cada vez mais para abordagens mais sofisticadas, que tiram os humanos completamente do circuito.


Eles estão usando algoritmos de aprendizado de máquina que ensinam um programa de computador a reconhecer padrões, como relações significativas entre palavras.


Por exemplo, o computador pode aprender que pares de palavras como "banco" e “jardim” costumam ocorrer juntas. Essas associações podem dar pistas sobre o significado ou o sentimento. Se “banco” e “dinheiro” estiverem na mesma frase, provavelmente é um tipo diferente de banco.

Um computador que usa uma rede neural superficial pode ser facilmente treinado para a tarefa de previsão da palavra seguinte - um exemplo familiar são as palavras sugeridas durante a digitação em um smartphone.


Um grande passo em tais métodos foi dado em 2013, quando Tomas Mikolov, do Google Brain, aplicou o aprendizado de máquina para construir uma ferramenta chamada embeddings de palavras.


Essa ferramenta converte cada palavra em uma lista de 50 a 300 números, chamada de vetor. Os números são como uma impressão digital que descreve uma palavra e, particularmente, as outras palavras com as quais ela tende a ser usada.


Para obter esses descritores, o programa de Mikolov analisou milhões de palavras em artigos de jornal e tentou prever a próxima palavra do texto, considerando as palavras anteriores. Os embeddings de Mikolov reconhecem sinônimos: palavras como “dinheiro” e “grana” têm vetores muito semelhantes.


Mais sutilmente, os embeddings de palavras capturam analogias elementares - que o rei está para a rainha como o menino está para a menina, por exemplo - mesmo que não possa definir essas palavras, um um feito notável.


Os embeddings de palavras de Mikolov foram gerados pelo que é chamado de rede neural com uma camada oculta. As redes neurais, que são vagamente modeladas no cérebro humano, permitiram avanços impressionantes no aprendizado de máquina, incluindo AlphaGo (que aprendeu a jogar Go melhor do que o campeão mundial).


A rede de Mikolov era uma rede deliberadamente mais rasa, por isso poderia ser útil para uma variedade de tarefas, como tradução e análise de tópicos.


Redes neurais mais profundas, com mais camadas de “córtex”, podem extrair ainda mais informações sobre o sentimento de uma palavra no contexto de uma frase ou documento específico.


Uma tarefa de referência comum é o computador ler uma crítica de filme no IMDB e prever se o revisor deu um polegar para cima ou para baixo. Os primeiros métodos de léxico alcançaram cerca de 74 por cento de precisão. Os mais sofisticados alcançaram 87%.


As primeiras redes neurais, em 2011, já chegaram a 89 por cento. Hoje elas funcionam com mais de 94 por cento de precisão - se aproximando de um humano. (Humor e sarcasmo continuam a ser grandes obstáculos, porque as palavras escritas podem expressar literalmente o oposto do sentimento pretendido.)


Apesar dos benefícios das redes neurais, os métodos baseados em léxico ainda são populares; o Hedonômetro, por exemplo, usa um léxico e Danforth não tem intenção de alterá-lo.


Embora as redes neurais possam ser mais precisas para alguns problemas, elas têm um custo. O período de treinamento por si só é uma das tarefas com maior intensidade computacional que você pode pedir a um computador.


“Basicamente, você está limitado pela quantidade de eletricidade que possui”, diz Robert Stine, da Wharton School, que aborda a evolução da análise de sentimento na Revisão Anual de Estatísticas e sua Aplicação de 2019.


“Quanta eletricidade o Google usou para treinar AlphaGo? A piada que ouvi foi: o suficiente para ferver o oceano ”, conta Stine.


Além das necessidades de eletricidade, as redes neurais requerem hardware caro e conhecimento técnico. E há falta de transparência, porque o computador está descobrindo como realizar a tarefa, em vez de seguir as instruções explícitas do programador.


“É mais fácil corrigir erros com um léxico”, fala Bing Liu, da Universidade de Illinois (UI) em Chicago, um dos pioneiros da análise de sentimento.


Medindo saúde mental


Embora a análise de sentimento muitas vezes caia sob a alçada dos cientistas da computação, ela tem raízes profundas na psicologia.


Em 1962, o psicólogo de Harvard Philip Stone desenvolveu o General Inquirer, o primeiro programa computadorizado de análise de texto de propósito geral para uso em psicologia.


Na década de 1990, o psicólogo social James Pennebaker desenvolveu um programa inicial de análise de sentimento (a Investigação Linguística e Contagem de Palavras) como uma visão do mundo psicológico das pessoas.


Essas avaliações anteriores revelaram e confirmaram padrões que os especialistas observavam há muito tempo: os pacientes com diagnóstico de depressão tinham estilos de texto distintos, como usar o pronome “eu” com mais frequência. Eles usavam mais palavras de cunho negativo e, às vezes, mais palavras relacionadas à morte.


Os pesquisadores agora estão investigando a expressão da saúde mental na fala e na escrita, analisando posts nas redes sociais.


Danforth e o psicólogo de Harvard Andrew Reece, por exemplo, analisaram os posts no Twitter de pessoas com diagnósticos formais de depressão ou transtorno de estresse pós-traumático(TPET) que foram escritos antes do diagnóstico (com consentimento dos participantes).


Os sinais de depressão começaram a aparecer nove meses antes. O Facebook tem um algoritmo para detectar usuários que parecem estar em risco de suicídio. Especialistas humanos revisam os casos e, se necessário, enviam mensagens aos usuários ou números de telefone de apoio.


No entanto, os dados de redes sociais ainda estão longe de serem usados ​​no atendimento ao paciente. As questões de privacidade são uma preocupação óbvia. Além disso, ainda há trabalho a ser feito para mostrar a utilidade dessas análises.


Muitos estudos que avaliam a saúde mental não definem seus termos adequadamente ou não fornecem informações suficientes para replicar os resultados, diz Stevie Chancellor, especialista em computação centrada no ser humano da Universidade Northwestern, e coautora de uma revisão recente de 75 desses estudos.


Mas ela ainda acredita que a análise de sentimento pode ser útil para clínicas, por exemplo, ao fazer a triagem de um novo paciente.


E mesmo sem dados pessoais, a análise de sentimento pode identificar tendências como o nível geral de estresse de estudantes universitários durante uma pandemia ou os tipos de interações de mídia social que desencadeiam recaídas entre pessoas com transtornos alimentares.


Lendo os humores


A análise de sentimento também está abordando questões mais leves, como os efeitos do clima no ânimo das pessoas.


Em 2016, Nick Obradovich, agora no Instituto Max Planck para o Desenvolvimento Humano em Berlim, analisou cerca de 2 bilhões de posts do Facebook e 1 bilhão de posts do Twitter.


Aproximadamente 2,5 centímetros de chuva diminuíram a felicidade expressa das pessoas em cerca de 1 por cento. Temperaturas abaixo de zero baixaram esse índice duas vezes vezes mais.


Em um estudo complementar - e mais desanimador - Obradovich e seus colegas consultaram o Twitter para entender os sentimentos sobre as mudanças climáticas.


Eles descobriram que, após cerca de cinco anos de aumento de calor, o senso de “normal” dos usuários do Twitter mudou e eles não tuitaram mais sobre ondas de calor. No entanto, a percepção de bem-estar dos usuários ainda continuou sendo afetada, mostram os dados.


“É como ferver um sapo”, diz Obradovich. “Essa foi uma das descobertas empíricas mais perturbadoras de qualquer paper que já fiz.”


A reputação de segunda-feira como o pior dia da semana também estava pronta para investigação. Embora “segunda-feira” fosse o nome do dia da semana que provocava as reações mais negativas, terça-feira era na verdade o dia em que as pessoas ficavam mais tristes, constatou uma análise inicial dos tuítes feita pelo Hedonômetro de Danforth. Sexta-feira e sábado, é claro, eram os dias mais felizes.


Mas o padrão semanal mudou após a eleição presidencial de 2016 nos EUA. Embora provavelmente ainda haja uma marcação semanal, sobrepostos a ela estão eventos que capturam nossa atenção e são falados mais do que o básico da vida, diz Danforth.


Tradução: No Twitter, a política nunca para. “Qualquer dia da semana pode ser o mais triste”, diz ele.


Outro truísmo posto à prova é que, na música, os acordes maiores são percebidos como mais felizes do que os acordes menores. Yong-Yeol Ahn, especialista em ciências sociais computacionais da Universidade de Indiana, testou essa noção ao analisar o sentimento das letras que acompanham cada acorde de 123.000 canções.


De fato, acordes maiores foram associados a palavras mais felizes, 6,3 em comparação com 6,2 para acordes menores (em uma escala de 1 a 9). Embora a diferença pareça pequena, é cerca de metade da diferença de sentimento entre o Natal e um dia de semana normal no Hedonômetro.


Ahn também comparou gêneros e descobriu que o rock dos anos 1960 era o mais feliz; o heavy metal foi o mais negativo.


Visão de negócios


O mundo dos negócios também está aderindo à ferramenta. A análise de sentimento está se tornando amplamente usada pelas empresas, mas muitas não falam sobre isso, então é difícil avaliar sua popularidade.


“Todo mundo está fazendo isso: Microsoft, Google, Amazon, todos. Alguns deles têm vários grupos de pesquisa ”, diz Bing Liu.


Uma medida do interesse prontamente acessível é o grande número de programas de software de análise de sentimento comerciais e acadêmicos que estão disponíveis publicamente: uma comparação de 2018 detalhou 28 desses programas.


Algumas empresas usam a análise de sentimento para entender o que seus clientes estão dizendo nas mídias sociais. Outras empresas usam a análise de sentimento para monitorar a satisfação dos funcionários, acompanhando as redes sociais dentro da empresa.


A IBM, por exemplo, desenvolveu um programa chamado Social Pulse que monitorava a intranet da empresa para ver do que os funcionários estavam reclamando. Por motivos de privacidade, o software analisava apenas posts compartilhados com toda a companhia.


Mesmo assim, essa tendência incomoda Danforth, que diz: “Minha preocupação seria que a privacidade dos funcionários não fosse compatível com os resultados financeiros da empresa. É uma coisa eticamente falha.”


É provável que a ética continue a ser um problema à medida que a análise de sentimento se torna mais comum. Empresas, profissionais de saúde mental e qualquer campo que considere seu uso devem ter em mente que, embora a análise de sentimento seja infinitamente promissora, cumprir essa promessa ainda pode ser complicado.


A matemática subjacente às análises é a parte fácil. A parte difícil é entender os humanos. Como diz Liu, “Nós nem mesmo entendemos o que é compreensão”.


☛ Este texto, de Dana Mackenzie, foi republicado da Knowable Magazine, uma iniciativa independente do publisher sem fins lucrativos Annual Reviews. Leia o original em inglês.


Veja mais: Os drones deixam de ser brinquedo


#UVM #RedesNeurais #Facebook #IBM