Análisis de texto: Uso de léxicos aplicado a tweets referentes a COVID-19

Categorías: R

Los investigadores usualmente en el proceso de recolección de datos se enfrentan con una gran cantidad de información textual, por tanto, el análisis de texto se convierte en un método importante para convertir datos no estructurados, en textos entendibles y con significado. Tiene como fin medir opiniones por medio de correos electrónicos, blogs, tweets, foros y otras formas de comunicación, para posteriormente obtener un análisis de tipo descriptivo o predictivo [1].

Leer Más →

Segmentación de clientes: análisis de cluster usando el algoritmo partitioning around medoids (PAM)

Categorías: R

Como hemos comentado en anteriores post, segmentación de clientes es agrupamiento que permite a las empresas comprender sus clientes y orientar la toma de decisiones hacia grupos bien definidos, atendiendo las necesidades especificas en cada uno de ellos. Sin embargo, generalmente en la literatura encontramos aquellos algoritmos de agrupación que utilizan sólo variables numéricas, contrario a esto, en diversas situaciones de la vida real vamos a requerir construir agrupamientos sobre conjuntos de datos que son de tipo mixto (variables numéricas y categóricas).

Leer Más →

Análisis de datos: Latent Dirichlet Allocation (LDA) Aplicada en Textos Periodísticos

Categorías: R

Hace mucho tiempo que la escritura es una de las principales herramientas de la comunicación humana. Pero en la era digital, ese medio de registrar ideas y sentimientos alcanzó un nuevo potencial. Con el ascenso de la Internet, artículos científicos, textos publicitarios y periodísticos no quedan sólo en el papel, están disponibles en cualquier medio digital. Esa numerosa cantidad de textos genera un banco de datos riquísimo, que puede ser base para diversos análisis.

Leer Más →

Un estudio al precio de arrendamiento en Medellin por medio un modelo de arbol de regresion

Categorías: R

Debido a las inversiones en construcción e infraestructura (entre otros indicadores) Medellín se ha convertido en los últimos años como una de las mejores ciudades para vivir en Colombia, así lo ha venido revelando la Red Colombiana de Ciudades Cómo Vamos. Por eso para quien esta pensando en vivir en Medellin y no tiene idea de cuanto pude llegar a costar un canon de arrendamiento o cuales son las zonas que tienen mayor oferta de lugares para residir nos dimos a la tarea de consultar a cuanto podría llegar a un canon de arrendamiento según la comuna donde está ubicado y algunas características del predio.

Leer Más →

Google Form: Importando datos en R y publicando resultados en AnalyStats-App

Categorías: R

Actualmente existen varios servicios de encuestas en la web que permiten crear formularios en línea de forma gratuita, sin embargo, hay un par de razones por las que los formularios de Google Forms (basados en hoja de cálculo) son más amigables y útiles que los otros. En este post queremos mostrar la facilidad con que pueden ser importados en R datos de un formulario construido en Goolge Forms y simultáneamente publicar sus resultados en AnalyStats-App.

Leer Más →