Hogar Finanzas personales Los límites de los datos de calificación en Machine Learning: los dummies

Los límites de los datos de calificación en Machine Learning: los dummies

Video: How data brokers sold my identity | Madhumita Murgia | TEDxExeter 2024

Video: How data brokers sold my identity | Madhumita Murgia | TEDxExeter 2024
Anonim

Los datos de calificación tienen sus limitaciones en el aprendizaje automático. Para que los sistemas de recomendación funcionen bien, necesitan saber acerca de usted y de otras personas, como usted y diferente de usted. La adquisición de datos de calificación permite que un sistema de recomendación aprenda de las experiencias de múltiples clientes. Los datos de calificación podrían derivarse de un juicio (como calificar un producto usando estrellas o números) o un hecho (un binario 1/0 que simplemente indica que usted compró el producto, vio una película o dejó de navegar en una determinada página web).

No importa la fuente o el tipo de datos, los datos de calificación siempre se refieren a comportamientos. Para calificar una película, tiene que decidir verla, mirarla y luego calificarla en función de su experiencia de ver la película. Los sistemas de recomendación reales aprenden de los datos de clasificación de diferentes maneras:

  • Filtrado colaborativo: Coincidencias evaluadores basados ​​en similitudes de películas o productos utilizados en el pasado. Puede obtener recomendaciones basadas en elementos gustado por personas similares a usted o en artículos similares a los que le gustan.
  • Filtrado basado en contenido: va más allá del hecho de que haya visto una película. Examina las características relacionadas con usted y la película para determinar si existe una coincidencia en función de las categorías más grandes que representan las entidades. Por ejemplo, si eres una mujer a la que le gustan las películas de acción, el recomendador buscará sugerencias que incluyan la intersección de estas dos categorías.
  • Recomendaciones basadas en el conocimiento: Basado en metadatos, como las preferencias expresadas por los usuarios y las descripciones de los productos. Se basa en el aprendizaje automático y es eficaz cuando no tiene suficientes datos de comportamiento para determinar las características del usuario o del producto. Esto se denomina inicio en frío y representa una de las tareas de recomendación más difíciles porque no tiene acceso al filtrado colaborativo o al filtrado basado en el contenido.

Al usar el filtrado colaborativo, debe calcular la similitud. Además de las distancias Euclidiana, Manhattan y Chebyshev, el resto de esta información analiza la similitud del coseno. La similitud del coseno mide la distancia del coseno angular entre dos vectores, lo que puede parecer un concepto difícil de comprender, pero es solo una forma de medir ángulos en los espacios de datos.

Imagine un espacio hecho de características y que tiene dos puntos. Puedes medir la distancia entre los puntos. Por ejemplo, podría usar la distancia euclidiana, que es una elección perfecta cuando tiene pocas dimensiones, pero que falla miserablemente cuando tiene múltiples dimensiones debido a la maldición de la dimensionalidad.

La idea detrás de la distancia del coseno es usar el ángulo creado por los dos puntos conectados al origen del espacio (el punto donde todas las dimensiones son cero) en su lugar. Si los puntos están cerca, el ángulo es estrecho, no importa cuántas dimensiones haya. Si están lejos, el ángulo es bastante grande.

La similitud coseno implementa la distancia del coseno como un porcentaje y es bastante efectiva para determinar si un usuario es similar a otro o si una película puede asociarse a otra porque los mismos usuarios la favorecen. El siguiente ejemplo ubica las películas que son las películas más similares a la película 50, Star Wars.

print (colnames (MovieLense [50]))

[1] "Star Wars (1977)"

similar_movies <- similitud (MovieLense [50],

MovieLense [-50],

method = "cosine",

which = "items")

colnames (similar_movies) [which (similar_movies> 0. 70)]

[1] "Toy Story (1995)" < "El imperio contraataca, el (1980)"

[3] "En busca del arca perdida" (1981) "

" El retorno del Jedi (1983) "

Los límites de los datos de calificación en Machine Learning: los dummies

Selección del editor

Haciendo Notes en Outlook en Office 2011 para Mac - Dummies

Haciendo Notes en Outlook en Office 2011 para Mac - Dummies

Cuando se te ocurra lo que piensas "Debo tomar nota de eso", haga clic en el botón Notas en la esquina inferior izquierda de la ventana de Outlook 2011 para Mac, presione Comando-5, o elija Ver → Ir a → Notas en la barra de menú para mostrar la lista de Notas . La función Notas llena la necesidad de hacer una nota rápida ...

Navegando por la pestaña Organizar de Outlook en Office 2011 para Mac: dummies

Navegando por la pestaña Organizar de Outlook en Office 2011 para Mac: dummies

Office 2011 para Mac ofrece una Un montón de excelentes funciones de organización, y estará especialmente contento con las de Outlook 2011. Organizar su correo es rápido y fácil. (Tenga en cuenta que las opciones de Permisos y Propiedades estarán atenuadas en la pestaña Organizar a menos que esté usando una cuenta de Microsoft Exchange). La pestaña Organizar de ...

Navegando por la pestaña Herramientas de Outlook en Office 2011 para Mac - dummies

Navegando por la pestaña Herramientas de Outlook en Office 2011 para Mac - dummies

En Outlook 2011 para Mac, cuando abre un elemento individual en su propia ventana, como un mensaje, encuentra pestañas adicionales de Cinta. La pestaña Herramientas de la cinta de opciones en la Vista de correo le brinda un control sin precedentes sobre su cuenta: Mi día: haga clic para mostrar la miniaplicación Mi día. Fuera de la oficina: para cuentas de Exchange ...

Selección del editor

Modos de exposición personalizados canon 60D: muñecos

Modos de exposición personalizados canon 60D: muñecos

Un ajuste especial en el dial de modo de la Canon EOS 60D que es fácil pasar por alto (pero es genial y práctico) es la configuración del usuario de la cámara (C). Con él, establece el modo de disparo, la velocidad de obturación, el modo de medición, etc., y luego guarda (registra, en la jerga de Canon) esas configuraciones. Más tarde, cuando salga a grabar, recuerde esos ...

Canon 60D Consejos para fotografiar en primer plano: muñecos

Canon 60D Consejos para fotografiar en primer plano: muñecos

Para obtener excelentes primeros planos, comience por verificar su manual de la lente para conocer la distancia mínima de enfoque cercano de su lente. Qué tan cerca y personal puede estar para su sujeto depende de su lente, no del cuerpo de la cámara de su Canon EOS 60D. La lente del kit de 18-135 mm puede estar tan cerca como ...

Canon 60D Filtros creativos: los dummies

Canon 60D Filtros creativos: los dummies

Filtros creativos son efectos de software distintivos diseñados para cambiar el aspecto de una fotografía y proporcionan una forma divertida y sencilla de procesar fotos en su Canon EOS 60D. Puede aplicar estos filtros a las fotos que haya tomado en el gran formato de archivo JPEG sin procesar y de cualquier tamaño. No necesita una computadora, y no ...

Selección del editor

Cómo buscar fuentes incorrectas en Office 2011 para Mac - Dummies

Cómo buscar fuentes incorrectas en Office 2011 para Mac - Dummies

Durante la instalación de Office 2011 para Mac, los usuarios deberían examinar sus colecciones de fuentes, ya que las fuentes incorrectas pueden hacer que las aplicaciones se cuelguen. Puede usar el Libro de fuentes para identificar las fuentes que tienen problemas y ayudarlo a eliminar estas fuentes. Font Book clasifica las fuentes en tres categorías: Aprobado (seguro de usar) Problemas menores Problemas principales Así es como ...

Cómo agregar clips a Scrapbook en Office 2011 para Mac - dummies

Cómo agregar clips a Scrapbook en Office 2011 para Mac - dummies

Scrapbook es uno de las pestañas importantes dentro de la interfaz de Office 2011 Toolbox. Cada vez que seleccione algo, como una imagen en una diapositiva de PowerPoint, y luego elija Editar → Copiar, terminará enviando esa imagen al Portapapeles. A continuación, puede ir a su documento de Word abierto y elegir Editar → Pegar para traer una copia ...

Cómo elegir la versión correcta de Office 2011 para Mac: dummies

Cómo elegir la versión correcta de Office 2011 para Mac: dummies

Office 2011 para Mac viene en varias ediciones, por lo que cuando instale Word, Excel, PowerPoint y más nuevos en su Mac, necesita investigar un poco. Cada versión de Office 2011 para Mac tiene un conjunto diferente de aplicaciones y características, además de un precio diferente. La siguiente lista lo ayuda a elegir la edición ...