USP e UFSCar criam ferramenta que detecta fake news

Protótipo pode ser acessado tanto pelo computador quanto pelo WhatsApp e tem 90% de precisão

De acordo com a última edição do Digital News Report, organizado pelo Instituto Reuters, 66% dos brasileiros utilizamm as redes sociais para encontrar as notícias que o manterão informado. Uma porcentagem ainda maior, de 85%, se diz preocupada em relação ao que é verdade ou mentira na internet — o que colocou os brasileiros no topo da lista entre os 37 países que participaram da pesquisa.

Pensando nisso e em como o WhatsApp, fonte de notícias para 48% dos entrevistados, está mexendo com a nossa cabeça nestas eleições, pesquisadores da Universidade de São Paulo (USP) e da Universidade Federal de São Carlos (UFSCar) se reuniram para desenvolver um protótipo de detector de fake news. A ferramenta pode ser acessada via web ou pelo WhatsApp.

A iniciativa rendeu a publicação de um artigo e está ancorado em diversos projetos de pós-graduação, como o de Roney Lira, doutorando do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP.

Orientado pelo professor Thiago Pardo, o pesquisador piauiense partiu do princípio de que, quando uma pessoa está contando uma mentira, a forma de se expressar e de escrever um texto é afetada.

Por isso, ao longo de quatro meses, os pesquisadores reuniram 3,6 mil textos completamente falsos e outros 3,6 mil genuinamente verdadeiros. A partir disso, eles usaram uma série de códigos para identificar os principais padrões linguísticos de cada tipo de texto.

Verdade x Mentira

Os erros ortográficos estão presentes em 36% das notícias falsas, enquanto aparecem em apenas 3% dos textos verídicos. As fake news também costumam apresentar frases mais curtas do que as notícias verdadeiras: as médias são de 15,3 e 21,1 palavras por sentença respectivamente.

Notícias verdadeiras também usam uma quantidade ligeiramente maior de substantivos, adjetivos, advérbios e pronomes. Ainda assim, o uso de adjetivos que apelam para o lado emocional do leitor é uma marca das fake news. “Geralmente são adjetivos ‘fortes’, sentimentais — o que não costuma acontecer em notícias verdadeiras”, explica Lira.

“Também há os casos do uso de verbos auxiliares, que não passam confiança para a matéria”, afirma o pesquisador. “Se o autor escreve ‘pode ter tido um acidente’, isso significa que não é algo que aconteceu de verdade.”

Apesar disso, as fake news apresentam um vocabulário mais diverso. “Nossa hipótese é a de que o enganador — o autor de notícias falsas — tenta explicar a mesma coisa com palavras diferentes; ao contrário de uma notícia verdadeira, onde o jornalista informa o leitor de forma direta”, explica Roney.

Características básicas de notícias falsas e verdadeiras, segundo estudo desenvolvido pelo NILC-USP (Foto: Arte: Fernando Mazzola)

Próximos passos

Agora que o protótipo do projeto já está no ar, os pesquisadores pretendem aprimorar o banco de dados e a precisão da ferramenta. Equilibrar a quantidade de textos entre os temas encontrados nessa primeira versão é um dos primeiros passos. “Futuramente a gente pretende ampliar esse banco para balancear essa base”, afirma Lira.

Política (58%), TV e celebridades (21,4%), e sociedade e cotidiano (17,7) são os assuntos mais recorrentes nos textos coletados entre dezembro de 2017 e março de 2018. Outros temas que também aparecem são ciência e tecnologia (1,5%), economia (0,7%) e religião (0,7%).

Outra melhoria que está no horizonte dos pesquisadores é a checagem de fatos automática. “Precisamos criar algo que seja capaz de selecionar uma parte da notícia e compará-la com dados disponíveis em sites confiáveis”, propõe Lira. “Hoje em dia, há diversos veículos especializados em fact-checking, mas todo o trabalho é feito manualmente. O desafio é automatizar essa tarefa e sem perder a acurácia.”

A versão atual apresentou 90% de precisão nos testes, sendo que ainda pode gerar avaliações equivocadas sobre artigos opinativos e notícias parcialmente falsas.

Saiba como utilizar a ferramenta*

1. Você pode acessá-la via web ou através do WhatsApp.

2. Em seu smartphone, uma janela de troca de mensagens do aplicativo se abrirá automaticamente com a segunte mensagem: “Nilc-FakeNews”.

3. Aperte a tecla enviar. Você receberá outra mensagem: “Olá! Seja bem-vindo ao detector de fake news do NILC-USP – Detecção Automática de Notícias Falsas para o Português! O sistema irá utilizar o modelo de detecção para avaliar se a notícia é falsa ou verdadeira. Insira o corpo de uma notícia.”

4. Utilize o texto completo da notícia, que deve conter, no mínimo, 100 palavras. A ferramenta não analisa títulos.

5. Se o sistema identificar sinais de que o texo seja uma notícia falsa, ele alertará: “Essa notícia pode ser falsa. Por favor, procure outras fontes confiáveis antes de divulgá-la”.

Como identificar fake news?

Além das características citadas pela pesquisa, outros aspectos são comuns em notícias falsas. Confira as dicas da Federação Internacional de Associações e Instituições Bibliotecárias (IFLA) para identificar e evitar fake news:

– Verifique se a fonte é confiável: quais são suas missões, trajetória e contatos?
– Leia a notícia completa. Títulos são apenas um resumo de uma história e podem ser clickbait.
– Pesquise sobre o autor do texto. Ele é confiável? Ele é real?
– Clique nos links que baseiam o texto e cheque se o conteúdo condiz com a história contada.
– Preste atenção na data em que a notícia foi publicada. Notícias podem ser “ressuscitadas” na internet e colocadas fora do contexto em que foram criadas.
– Certifique-se de que não se trata de um texto sarcástico ou irônico.

– Considere se as suas crenças e valores podem afetar o seu julgamento.
– Consulte uma fonte especializada.

Dicas da Federação Internacional de Associações e Instituições Bibliotecárias (IFLA) para identificar fake news. (Foto: IFLA)

Referência:
https://revistagalileu.globo.com/Tecnologia/noticia/2018/10/usp-e-ufscar-criam-ferramenta-que-detecta-fake-news.html

Sobre Paulo Santos

Especialista em Tecnologia da Informação | Specialist in Information Technology

Deixe um comentário