Análise de texto: Uso de léxicos aplicado a tweets referentes a COVID-19

Categorias: R

No processo de coleta de dados, geralmente os pesquisadores se deparam com uma grande quantidade de informações textuais. Sendo assim, a análise de texto se torna um método importante para converter dados não estruturados em textos compreensíveis e com significados. Sua finalidade é mensurar opiniões por meio de e-mails, blogs, tweets, fóruns e outras formas de comunicação, para posteriormente obter uma análise descritiva ou preditiva [1]. Dentre as diferentes metodologias encontradas na análise de texto está a análise de sentimento (mineração de opinião), método que se popularizou nos últimos anos graças ao crescimento das redes sociais.

Ler Mais →

Segmentação de clientes: análise de cluster usando o algoritmo Partitioning Around Medoids (PAM)

Categorias: R

Como comentamos em posts anteriores, segmentação de clientes é uma metodologia de agrupamento que permite às empresas entenderem seus clientes e orientar a tomada de decisões para grupos bem definidos, atendendo as necessidades específicas de cada um deles. No entanto, geralmente encontramos na literatura algoritmos de agrupamento que usam apenas variáveis numéricas, ao passo que, em várias situações da vida real, precisamos agrupar conjuntos de dados que são do tipo misto (variáveis numéricas e categóricas).

Ler Mais →

e-commerce: Teste A/B Bayesiano usando níveis de significância adaptativos

Categorias: Bayesiana

Os testes A/B podem ser vistos como experimentos controlados que suportam a tomada de decisão baseada em dados. Esses tipos de experimentos geralmente são usados para medir o impacto das alterações feitas e comparar diferentes alternativas em campanhas de marketing, produtos de software ou sites. Hoje, grandes empresas de tecnologia usam testes A/B para apoiar a tomada de decisões, por exemplo, Facebook [3], Google [4] e Microsoft [5]. Como mostrado na figura anterior, a ideia de um teste A/B é comparar as taxas de sucesso de cada variante executada (na imagem, variantes A e B).

Ler Mais →

Análise de texto: Processamento de linguagem natural (NLP) aplicado em projetos de lei

Categorias: Python

Em diferentes fases de nossas vidas, seja profissional ou acadêmica, vemos a necessidade de compactar informações apresentadas em textos. Sem dúvida, essa tarefa não é fácil e tende a ser mais complicada quando as fontes e o tamanho do texto aumentam. Por exemplo, considere um aluno de doutorado que está iniciando sua pesquisa e que se depara com a leitura de vários artigos apenas para definir seu marco teórico.

Ler Mais →

Análise de dados: Latent Dirichlet Allocation (LDA) Aplicada em Textos Jornalistícos

Categorias: R

Há muito tempo a escrita é uma das principais ferramentas da comunicação humana. Mas na Era Digital, esse meio de registrar ideias e sentimentos atingiu um novo potencial. Com a ascensão da Internet, artigos científicos, textos publicitários e jornalísticos não ficam mais apenas no papel, estão disponíveis em qualquer meio digital. Essa numerosa quantidade de textos gera um banco de dados riquíssimo, que pode ser base para diversas análises.

Ler Mais →