Hogar Finanzas personales Algoritmos de agrupación utilizados en Data Science - Dummies

Algoritmos de agrupación utilizados en Data Science - Dummies

Video: Algoritmos de Clustering en R/Rstudio | Clasificación no supervisada | HDBSCAN, K-means,Data Science 2024

Video: Algoritmos de Clustering en R/Rstudio | Clasificación no supervisada | HDBSCAN, K-means,Data Science 2024
Anonim

Utiliza algoritmos de agrupamiento para subdividir sus conjuntos de datos en grupos de puntos de datos que son más similares para un atributo predefinido. Si tiene un conjunto de datos que describe múltiples atributos sobre una característica en particular y desea agrupar sus puntos de datos según sus similitudes de atributos, entonces use algoritmos de agrupamiento.

Un simple diagrama de dispersión de los conjuntos de datos de Ingreso y educación del país arroja el gráfico que se ve aquí.

En la agrupación no supervisada, comienza con estos datos y luego procede a dividirlos en subconjuntos. Estos subconjuntos se denominan clusters y están compuestos por puntos de datos que son más similares entre sí. Parece que hay al menos dos grupos, probablemente tres, uno en la parte inferior con bajos ingresos y educación, y luego los países de educación superior parecen divididos entre ingresos bajos y altos.

La siguiente figura muestra el resultado de eyeballing - haciendo una estimación visual de - clusters en este conjunto de datos.

Aunque puede generar estimaciones visuales de clustering, puede lograr resultados mucho más precisos cuando maneja conjuntos de datos mucho más grandes mediante el uso de algoritmos para generar clústeres por usted. La estimación visual es un método aproximado que solo es útil en conjuntos de datos más pequeños y de complejidad mínima. Algoritmos: produce resultados exactos y repetibles, y puede usar algoritmos para generar clusters para múltiples dimensiones de datos dentro de su conjunto de datos.

Los algoritmos de agrupamiento son un tipo de enfoque en el aprendizaje automático no supervisado; otros enfoques incluyen métodos y métodos de Markov para la reducción de dimensiones. Los algoritmos de agrupamiento son apropiados en situaciones donde las siguientes características son verdaderas:

  • Usted conoce y comprende el conjunto de datos que está analizando.

  • Antes de ejecutar el algoritmo de agrupación, no tiene una idea exacta sobre la naturaleza de los subconjuntos (clústeres). A menudo, ni siquiera sabrá cuántos subconjuntos hay en el conjunto de datos antes de ejecutar el algoritmo.

  • Los subconjuntos (clústeres) están determinados solo por el conjunto de datos que está analizando.

  • Su objetivo es determinar un modelo que describa los subconjuntos en un solo conjunto de datos y solo este conjunto de datos.

Si agrega más datos, debe volver a ejecutar el análisis desde cero para obtener resultados del modelo completos y precisos.

Algoritmos de agrupación utilizados en Data Science - Dummies

Selección del editor

Cómo agregar campos calculados a datos en dummies

Cómo agregar campos calculados a datos en dummies

Después de haber creado el subconjunto apropiado de sus datos, es probable que el siguiente paso en su análisis sea realizar algunos cálculos con R. Cómo hacer aritmética en columnas de un marco de datos R hace que sea muy fácil realizar cálculos en columnas de un marco de datos porque cada columna es en sí misma a ...

10 Cosas que puede hacer en R que habría hecho en Microsoft Excel - Para Dummies

10 Cosas que puede hacer en R que habría hecho en Microsoft Excel - Para Dummies

La hoja de cálculo es probablemente una de las aplicaciones de PC más utilizadas, y por una buena razón: las hojas de cálculo facilitan la realización de cálculos y otras operaciones en los datos tabulares. Pero las hojas de cálculo también presentan algunos riesgos: son fáciles de corromper y muy difíciles de depurar. La buena noticia es que puede usar R ...

Cómo agregar observaciones a un marco de datos en dummies

Cómo agregar observaciones a un marco de datos en dummies

Con el paso del tiempo, nuevo los datos pueden aparecer y deben agregarse al conjunto de datos en R. Al igual que las matrices, los marcos de datos se pueden agregar utilizando la función rbind (). Agregar una sola observación Diga que Granny y Geraldine jugaron otro juego con su equipo, y desea agregar el número de cestas que ...

Selección del editor

Elección del algoritmo correcto para Aprendizaje automático: las máquinas de inflar

Elección del algoritmo correcto para Aprendizaje automático: las máquinas de inflar

Aprendizaje automático implican el uso de muchos algoritmos diferentes. Esta tabla le brinda un resumen rápido de las fortalezas y debilidades de varios algoritmos. Algoritmo Mejor en Pros Cons Random Forest Apto en casi cualquier problema de aprendizaje automático Bioinformatics Puede trabajar en paralelo Raramente overfits Maneja automáticamente valores perdidos No hay necesidad de transformar ninguna variable ...

Elegir una distribución de Python con Machine Learning in Mind - Dummies

Elegir una distribución de Python con Machine Learning in Mind - Dummies

Es completamente posible obtener una copia genérica de Python y agregue todas las bibliotecas de aprendizaje automático requeridas. El proceso puede ser difícil porque debe asegurarse de tener todas las bibliotecas necesarias en las versiones correctas para garantizar el éxito. Además, debe realizar la configuración necesaria para hacer ...

Algoritmos de agrupación utilizados en Data Science - Dummies

Algoritmos de agrupación utilizados en Data Science - Dummies

Usted usa algoritmos de agrupamiento para subdividir sus conjuntos de datos en grupos de puntos de datos que son más similares para un atributo predefinido. Si tiene un conjunto de datos que describe múltiples atributos sobre una característica en particular y desea agrupar sus puntos de datos según sus similitudes de atributos, entonces use algoritmos de agrupamiento. Un diagrama de dispersión simple de ...

Selección del editor

ASVAB Práctica de razonamiento aritmético: preguntas de geometría tridimensional: dummies

ASVAB Práctica de razonamiento aritmético: preguntas de geometría tridimensional: dummies

La subprueba de razonamiento aritmético en el ASVAB contendrá preguntas de geometría que involucran figuras tridimensionales. Con esto en mente, debe memorizar las fórmulas para el área de superficie y el volumen de las formas tridimensionales más comunes. Preguntas de práctica ¿Cuánta hoja de metal es necesaria para crear un tanque de agua con forma de cilindro de 300 pies de largo y ...

ASVAB Práctica de razonamiento aritmético: problemas de geometría bidimensional: maniquíes

ASVAB Práctica de razonamiento aritmético: problemas de geometría bidimensional: maniquíes

En la subprueba de razonamiento aritmético en el ASVAB, las preguntas de geometría bidimensional suelen ser bastante sencillas. Sin embargo, si se presentan como problemas planteados, es importante que los lea cuidadosamente y tal vez incluso dibuje un diagrama para ayudarlo a visualizar el problema. Preguntas de práctica Un marco rectangular tiene un perímetro interior de 38 pulgadas. Uno ...

Consejos de razonamiento aritmético aSVAB: dummies

Consejos de razonamiento aritmético aSVAB: dummies

La subprueba de razonamiento aritmético de ASVAB constituye una parte importante de su puntaje, por lo que no dejes que estos problemas de palabras te hagan tropezar. Recuerde: lea el problema a fondo para que comprenda lo que le está pidiendo. Asegúrate de estar usando las unidades de medida correctas para el problema (y si es necesario, conviértelas). ...