Hogar Finanzas personales Cómo tomar muestras de datos en dummies

Cómo tomar muestras de datos en dummies

Video: Como extraer una muestra aleatoria con el M.A.S 2025

Video: Como extraer una muestra aleatoria con el M.A.S 2025
Anonim

Los estadísticos a menudo tienen que tomar muestras de datos y luego calcular estadísticas. Tomar una muestra es fácil con R porque una muestra no es más que un subconjunto de datos. Para hacerlo, utiliza sample (), que toma un vector como entrada; Luego, dígale cuántas muestras extraer de esa lista.

Digamos que quería simular rollos de un dado, y quiere obtener diez resultados. Debido a que el resultado de un solo lanzamiento de un dado es un número entre uno y seis, su código se ve así:

>> muestra (1: 6, 10, reemplazar = VERDADERO) [1] 2 2 5 3 5 3 5 6 3 5
Usted le dice a sample () que devuelva diez valores, cada uno en el rango 1: 6. Debido a que cada rollo del dado es independiente de cada otro rollo del dado, está tomando muestras con reemplazo. Esto significa que toma una muestra de la lista y restablece la lista a su estado original (en otras palabras, coloca el elemento que acaba de dibujar de nuevo en la lista).

Para hacer esto, agregue el argumento replace = TRUE, como en el ejemplo.

Debido a que el valor de retorno de la función sample () es un número determinado aleatoriamente, si prueba esta función repetidamente, obtendrá resultados diferentes cada vez. Este es el comportamiento correcto en la mayoría de los casos, pero a veces es posible que desee obtener resultados repetibles cada vez que ejecute la función.

Generalmente, esto ocurrirá solo cuando desarrolle y pruebe su código, o si quiere estar seguro de que alguien más puede probar su código y obtener los mismos valores que usted. En este caso, es habitual especificar un valor de inicialización denominado

.

Si proporciona un valor de inicialización, la secuencia de números aleatorios se restablecerá a un estado conocido. Esto se debe a que R no crea números verdaderamente aleatorios, sino solo números pseudoaleatorios. Una secuencia pseudoaleatoria es un conjunto de números que, para todos los propósitos prácticos, parecen ser aleatorios pero fueron generados por un algoritmo. Cuando establece un inicio de inicialización para un proceso pseudoaleatorio, R siempre devuelve la misma secuencia pseudoaleatoria.

Pero si no establece la semilla, R dibuja desde el estado actual del generador de números aleatorios (RNG). Al inicio, R puede establecer una semilla aleatoria para inicializar el RNG, pero cada vez que lo llame, R comienza desde el siguiente valor en la secuencia RNG. Puedes leer la Ayuda para? RNG para obtener más detalles.

En R, usa el conjunto. función seed () para especificar el valor inicial de su semilla. El argumento para establecer seed () es cualquier valor entero. >> establecido. seed (1)> sample (1: 6, 10, replace = TRUE) [1] 2 3 4 6 2 6 6 4 4 1

Si dibuja otra muestra, sin establecer una semilla, obtendrá un conjunto diferente de resultados, como era de esperar: >> muestra (1: 6, 10, reemplazar = VERDADERO) [1] 2 2 5 3 5 3 5 6 3 5

Ahora, para demostrar ese conjunto.seed () realmente restablece el RNG, pruébalo nuevamente. Pero esta vez, establecer la semilla una vez más: >> establecer. seed (1)> sample (1: 6, 10, replace = TRUE) [1] 2 3 4 6 2 6 6 4 4 1

Obtiene exactamente los mismos resultados que la primera vez que utilizó el set. semilla (1).

Puede usar sample () para tomar muestras del iris del marco de datos. En este caso, es posible que desee utilizar el argumento replace = FALSE. Como este es el valor predeterminado del argumento de reemplazo, no necesita escribirlo explícitamente: >> establecer. semilla (123)> índice índice [1] 44 119 62 133 142> iris [índice,] Sepal. Longitud Sepal. Ancho Pétalo. Longitud de pétalo. Ancho Especies 44 5. 0 3. 5 1. 6 0. 6 setosa 119 7. 7 2. 6 6. 9 2. 3 virginica 62 5. 9 3. 0 4. 2 1. 5 versicolor 133 6. 4 2. 8 5. 6 2. 2 virginica 142 6. 9 3. 1 5. 1 2. 3 virginica
Cómo tomar muestras de datos en dummies

Selección del editor

Desenmascarando la máscara de subred para el examen CCNA - dummies

Desenmascarando la máscara de subred para el examen CCNA - dummies

Subredes le permite tomar prestados bits del host y usar ellos para permitir más redes. Al crear subredes, separar la red y el host requiere un mecanismo especial llamado máscara de subred. Una máscara de subred, que contiene un patrón de bits binarios de unos y ceros, se aplica a una dirección para extraer la ID de red para ...

Utilice su certificación CISSP para ser un agente de cambio - muñecos

Utilice su certificación CISSP para ser un agente de cambio - muñecos

Como un profesional de seguridad certificado, alguien con una credencial de Certified Information Systems Security Professional (CISSP), usted es un agente de cambio en su organización: el estado de las amenazas y las reglamentaciones cambia constantemente, y debe responder asegurando que el entorno y las políticas de su empleador continúen defendiendo los activos de su empleador contra daños. Estos son algunos de ...

Canales de comunicación de voz y CISSP - Dummies

Canales de comunicación de voz y CISSP - Dummies

El examen de certificación de Certified Information Systems Professional (CISSP) requiere conocimiento de principios de diseño seguro e implementación de diversas tecnologías de comunicación, incluida la voz. Los conmutadores PBX (Private Branch Exchange), POTS (Plain Old Telephone Systems) y VoIP (Voice over Internet Protocol) son algunos de los aspectos más olvidados y costosos de una infraestructura de telecomunicaciones corporativa. Muchos ...

Selección del editor

Cómo buscar en la red de LinkedIn para una persona específica: muñecos

Cómo buscar en la red de LinkedIn para una persona específica: muñecos

Cuando esté listo para encontrar a una persona específica, use el motor de búsqueda de LinkedIn, con el que puede escanear las decenas de millones de miembros de LinkedIn, en función de las palabras clave. Las dos formas principales de buscar en la red son una búsqueda básica y una Búsqueda avanzada. En la parte superior de cada página de LinkedIn hay un sencillo ...

Cómo enviar una solicitud de conexión de LinkedIn a un miembro no miembro: dummies

Cómo enviar una solicitud de conexión de LinkedIn a un miembro no miembro: dummies

Solo los miembros de LinkedIn pueden ser parte de la red de cualquier persona. Por lo tanto, si desea enviar una solicitud de conexión a alguien que aún no se ha unido a LinkedIn, primero debe invitar a esa persona a crear una cuenta de LinkedIn. Puede enviar un correo electrónico directamente a su invitado, pedirle que se una, o puede usar un ...

Cómo buscar empresas en LinkedIn - muñecos

Cómo buscar empresas en LinkedIn - muñecos

Cuando necesite saber más sobre su industria actual o encuentra un socio comercial potencial para un gran negocio, LinkedIn te brinda herramientas para investigar un poco. Las páginas de empresas de LinkedIn permiten a los usuarios explorar empresas de su interés y recibir actualizaciones de la empresa y noticias de la industria, así como investigar los productos y servicios de cada compañía ...

Selección del editor

Cómo eliminar registros con la característica Eliminar duplicados de Excel 2013 - Dummies

Cómo eliminar registros con la característica Eliminar duplicados de Excel 2013 - Dummies

Puede usar Excel's Eliminate Duplicates característica para encontrar y eliminar rápidamente registros duplicados de una lista (o filas de una tabla). Esta es una gran característica, especialmente cuando se trata de una gran lista de datos en la que varias personas diferentes realizan la entrada de datos y que no deberían tener ningún registro duplicado (como ...

Cómo editar títulos de gráfico en Excel 2016 - Dummies

Cómo editar títulos de gráfico en Excel 2016 - Dummies

Cuando Excel 2016 primero agrega títulos a un nuevo gráfico , les da nombres genéricos, como título de gráfico y título de eje (para los títulos de eje xey). Para reemplazar estos títulos genéricos con los títulos reales de los gráficos, haga clic en el título en el gráfico o haga clic en el nombre del título en el Gráfico ...

Cómo ingresar una fórmula usando nombres de celda en Excel 2013 - dummies

Cómo ingresar una fórmula usando nombres de celda en Excel 2013 - dummies

Nombres de celda son una excelente forma de entender el propósito de sus fórmulas en Excel 2013. Por ejemplo, suponga que tiene una fórmula simple en la celda K3 que calcula el total que le debe al multiplicar las horas que trabaja para un cliente (en la celda I3) por el tarifa por hora del cliente (en la celda ...