Análise de texto: Uso de léxicos aplicado a tweets referentes a COVID-19

Categorias: R

No processo de coleta de dados, geralmente os pesquisadores se deparam com uma grande quantidade de informações textuais. Sendo assim, a análise de texto se torna um método importante para converter dados não estruturados em textos compreensíveis e com significados. Sua finalidade é mensurar opiniões por meio de e-mails, blogs, tweets, fóruns e outras formas de comunicação, para posteriormente obter uma análise descritiva ou preditiva [1]. Dentre as diferentes metodologias encontradas na análise de texto está a análise de sentimento (mineração de opinião), método que se popularizou nos últimos anos graças ao crescimento das redes sociais.

Ler Mais →

Segmentação de clientes: análise de cluster usando o algoritmo Partitioning Around Medoids (PAM)

Categorias: R

Como comentamos em posts anteriores, segmentação de clientes é uma metodologia de agrupamento que permite às empresas entenderem seus clientes e orientar a tomada de decisões para grupos bem definidos, atendendo as necessidades específicas de cada um deles. No entanto, geralmente encontramos na literatura algoritmos de agrupamento que usam apenas variáveis numéricas, ao passo que, em várias situações da vida real, precisamos agrupar conjuntos de dados que são do tipo misto (variáveis numéricas e categóricas).

Ler Mais →

Análise de dados: Latent Dirichlet Allocation (LDA) Aplicada em Textos Jornalistícos

Categorias: R

Há muito tempo a escrita é uma das principais ferramentas da comunicação humana. Mas na Era Digital, esse meio de registrar ideias e sentimentos atingiu um novo potencial. Com a ascensão da Internet, artigos científicos, textos publicitários e jornalísticos não ficam mais apenas no papel, estão disponíveis em qualquer meio digital. Essa numerosa quantidade de textos gera um banco de dados riquíssimo, que pode ser base para diversas análises.

Ler Mais →

Um estudo do preço de aluguel em Medellín por meio de um modelo de árvore de regressão

Categorias: R

Entre outras razões, o investimento em construção e infraestrutura tornou Medellín (Cidade dividida em comunas) um dos locais mais procurados para morar na Colômbia, de acordo com a Red Colombiana de Ciudades Cómo Vamos. Para aqueles que estão pensando viver em Medellín e não tem ideia do preço de aluguel ou quais zonas têm maior oferta de imóveis, elaboramos um pequeno estudo sobre o preço do aluguel na cidade segundo a região em que as propriedades estão localizadas e algumas de suas características.

Ler Mais →

Google Form: Importando dados em R e publicando resultados em AnalyStats-App

Categorias: R

Existem vários serviços gratuitos de pesquisa web que permitem criar formulários online. Porém, há várias razões para que os formulários do Google Forms (baseados em planilhas) sejam um dos mais amigáveis e vantajosos. Neste post, queremos mostrar a facilidade de importar no R dados de um formulário construído no Google Forms e, simultaneamente, publicar seus respectivos resultados no AnalyStats-App. Para isso, o primeiro requisito é criar um formulário (para detalhes sobre como criar formulários, clique aqui).

Ler Mais →