Hogar Finanzas personales Cómo crear un modelo de aprendizaje supervisado con regresión logística: variables ficticias

Cómo crear un modelo de aprendizaje supervisado con regresión logística: variables ficticias

Tabla de contenido:

Video: Regresión Logística - Práctica | #38 Curso Machine Learning con Python 2025

Video: Regresión Logística - Práctica | #38 Curso Machine Learning con Python 2025
Anonim

Después de construir su primer modelo predictivo de clasificación para el análisis de los datos, crear más modelos como este es una tarea realmente sencilla en scikit. La única diferencia real de un modelo al siguiente es que puede que tenga que ajustar los parámetros de algoritmo a algoritmo.

Cómo cargar sus datos

Este listado de códigos cargará el conjunto de datos del iris en su sesión: >>>> desde sklearn. datasets import load_iris >>> iris = load_iris ()

Cómo crear una instancia del clasificador

Las siguientes dos líneas de código crean una instancia del clasificador. La primera línea importa la biblioteca de regresión logística. La segunda línea crea una instancia del algoritmo de regresión logística. >>>> de sklearn import linear_model >>> logClassifier = linear_model. LogisticRegression (C = 1, random_state = 111)

Observe el parámetro (parámetro de regularización) en el constructor. El parámetro de regularización


se usa para evitar el sobreajuste. El parámetro no es estrictamente necesario (el constructor funcionará bien sin él porque de manera predeterminada será C = 1). La creación de un clasificador de regresión logística usando C = 150 crea una mejor gráfica de la superficie de decisión. Puedes ver ambas tramas a continuación.

Cómo ejecutar los datos de entrenamiento

Deberá dividir el conjunto de datos en conjuntos de entrenamiento y prueba antes de que pueda crear una instancia del clasificador de regresión logística. El siguiente código realizará esa tarea: >>>> de sklearn import cross_validation >>> X_train, X_test, y_train, y_test = cross_validation. train_test_split (iris. datos, iris. destino, test_size = 0. 10, random_state = 111) >>> logClassifier. fit (X_train, y_train)

La línea 1 importa la biblioteca que le permite dividir el conjunto de datos en dos partes.

La línea 2 llama a la función de la biblioteca que divide el conjunto de datos en dos partes y asigna los conjuntos de datos ahora divididos a dos pares de variables.

La línea 3 toma la instancia del clasificador de regresión logística que acaba de crear y llama al método de ajuste para capacitar al modelo con el conjunto de datos de capacitación.

Cómo visualizar el clasificador

Al observar el área de la superficie de decisión en la trama, parece que se debe hacer algún ajuste. Si te ves cerca del centro de la trama, puedes ver que muchos de los puntos de datos que pertenecen al área central (Versicolor) se encuentran en el área del lado derecho (Virginica).

Esta imagen muestra la superficie de decisión con un valor de C de 150. Se ve mejor visualmente, por lo que elegir usar esta configuración para su modelo de regresión logística parece apropiado.

Cómo ejecutar los datos de prueba

En el siguiente código, la primera línea alimenta el conjunto de datos de prueba al modelo y la tercera línea muestra el resultado: >>>> predicted = logClassifier. predicción (X_test) >>> predictedarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 2, 2, 2])

Cómo evaluar el modelo < Puede hacer una referencia cruzada de la salida de la predicción con la matriz y_test. Como resultado, puede ver que predijo correctamente todos los puntos de datos de prueba. Aquí está el código: >>>> de sklearn import metrics >>> predictedarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 2, 2, 2]) >>> y_testarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 2, 2, 2]) >>> métricas. accuracy_score (y_test, predicha) 1. 0 # 1. 0 es 100 por ciento de precisión >>> predicho == y_testarray ([True, True, True, True, True, True, True, True, True, True, True, True, True, True, True], dtype = bool)

Entonces, ¿cómo se compara el modelo de regresión logística con el parámetro C = 150 con eso? Bueno, no puedes vencer al 100 por ciento. Aquí está el código para crear y evaluar el clasificador logístico con C = 150: >>>> logClassifier_2 = linear_model. LogisticRegression (C = 150, estado_aleatorio = 111) >>> logClassifier_2. fit (X_train, y_train) >>> predicted = logClassifier_2. predecir (X_test) >>> métricas. accuracy_score (y_test, predicha) 0. 93333333333333335 >>> métricas. confusion_matrix (y_test, predicted) array ([[5, 0, 0], [0, 2, 0], [0, 1, 7]])

Esperábamos algo mejor, pero en realidad era peor. Hubo un error en las predicciones. El resultado es el mismo que el del modelo de Máquina de Vector de Soporte (SVM).

Aquí está la lista completa del código para crear y evaluar un modelo de clasificación de regresión logística con los parámetros predeterminados: >>>> de sklearn. datasets import load_iris >>> from sklearn import linear_model >>> from sklearn import cross_validation >>> from sklearn import metrics >>> iris = load_iris () >>> X_train, X_test, y_train, y_test = cross_validation. train_test_split (iris. datos, iris. target, test_size = 0. 10, random_state = 111) >>> logClassifier = linear_model. LogisticRegression (, random_state = 111) >>> logClassifier. fit (X_train, y_train) >>> predicted = logClassifier. predicción (X_test) >>> predictedarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 2, 2, 2]) >>> y_testarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 2, 2, 2]) >>> métricas. accuracy_score (y_test, predicha) 1. 0 # 1. 0 es 100 por ciento de precisión >>> predicho == y_testarray ([True, True, True, True, True, True, True, True, True, True, True, True, True, True, True], dtype = bool)
Cómo crear un modelo de aprendizaje supervisado con regresión logística: variables ficticias

Selección del editor

Cómo enviar videos e imágenes por correo electrónico con Flip Video - Dummies

Cómo enviar videos e imágenes por correo electrónico con Flip Video - Dummies

Después de tomar fotos y videos de eventos en su vida con su cámara Flip Video, es posible que desee enviarlos por correo electrónico a amigos y familiares. Compartir películas e imágenes que capture y cree mediante el envío de un mensaje de correo electrónico facilita la comunicación y el contacto con sus creaciones, sin importar cuán cerca ...

Cómo grabar sonido por separado para su película digital - dummies

Cómo grabar sonido por separado para su película digital - dummies

Hay momentos en que un cineasta necesita Grabe sonido utilizando un dispositivo separado de la cámara, para grabar sonido por separado y luego sincronice el sonido con el video más tarde, al editar. Por lo general, la razón de esto es para aumentar la calidad del sonido grabado porque muchas cámaras no graban el sonido tan bien como ...

Cómo grabar video con una cámara de video con tapa: imitar

Cómo grabar video con una cámara de video con tapa: imitar

Grabar videos con su cámara Flip es como fácil como 1-2-3 (y 4). Antes de grabar un video, verifique los indicadores de estado de su Flip para asegurarse de que la cámara esté completamente cargada y de que tenga suficiente tiempo de grabación para capturar el video que desea filmar. Para verificar el nivel de carga de la batería de su Flip (o ...

Selección del editor

¿Qué hacer con los resultados de conciliación en QuickBooks 2016? Principios ficticios

¿Qué hacer con los resultados de conciliación en QuickBooks 2016? Principios ficticios

En una reconciliación, como probablemente sepa , utiliza QuickBooks para comparar sus registros de una cuenta bancaria con los registros del banco de la misma cuenta. Debería poder explicar cualquier diferencia entre las dos cuentas, por lo general señalando a los cheques que escribió que aún no se han borrado. (A veces los depósitos caen en ...

Su Lista de artículos en QuickBooks 2012 - dummies

Su Lista de artículos en QuickBooks 2012 - dummies

QuickBooks 2012 proporciona varias maneras diferentes de ver la información que usted Guardado en tu lista de elementos. Puede que ya sepas algo de esto si has trabajado un poco con QuickBooks. Algo de esto puede ser nuevo para ti. La columna Código de artículo en la Lista de artículos de QuickBooks 2012 Un punto importante para ...

Qué sucede cuando condensa el archivo QuickBooks Company - dummies

Qué sucede cuando condensa el archivo QuickBooks Company - dummies

El proceso de condensación de archivos QuickBooks hace dos cosas : El comando QuickBooks Condense crea una copia permanente del archivo de datos de QuickBooks (llamado una copia de archivo del archivo); el proceso de condensación de archivos hace que el archivo de datos sea más pequeño al resumir muchas antiguas transacciones cerradas y detalladas que usan entradas de diario de grandes monstruos. Debido a esta condensación y archivo ...

Selección del editor

4 Prácticos botones de herramientas en QuickBooks Online - Dummies

4 Prácticos botones de herramientas en QuickBooks Online - Dummies

En QuickBooks Online (QBO), en la parte superior del ventana, hay herramientas disponibles para ayudarlo a encontrar su camino. Puede buscar o crear transacciones, ver transacciones recientes o realizar otras acciones no relacionadas con las transacciones. Si está trabajando en QBOA y abre una empresa de QBO, las herramientas varían un poco. Las herramientas en ...

3 Formas de simplificar la contabilidad de activos fijos con QuickBooks: dummies

3 Formas de simplificar la contabilidad de activos fijos con QuickBooks: dummies

Usan QuickBooks 2016 para administrar sus activos fijos contabilidad (lo que significa seguimiento de todos los activos de su empresa), pero puede convertirse en un desastre si no tiene cuidado: sus listas de activos fijos tienden a crecer con el tiempo, llegando a estar desordenada con cosas que ni siquiera recuerda haber comprado. Sin embargo, puede probar los siguientes tres ...

3 Formas de simplificar la contabilidad de activos fijos con QuickBooks: dummies

3 Formas de simplificar la contabilidad de activos fijos con QuickBooks: dummies

Usan QuickBooks 2014 para administrar sus activos fijos contabilidad (lo que significa seguimiento de todos los activos de su empresa), pero puede convertirse en un desastre si no tiene cuidado: sus listas de activos fijos tienden a crecer con el tiempo, llegando a estar desordenada con cosas que ni siquiera recuerda haber comprado. Sin embargo, puede probar los siguientes tres ...