Estadistica Practica para Ciencia de Datos con R y Python
Bruce, Peter
Los métodos estadísticos son una parte fundamental de la ciencia de datos, pero pocos científicos de datos tienen una formación avanzada en estadística. Los cursos y libros sobre estadística básica rara vez tratan el tema desde la perspectiva de la ciencia de datos. La segunda edición de este libro incluye ejemplos detallados de Python, ofrece una orientación práctica sobre la ...
Sinopsis
Los métodos estadísticos son una parte fundamental de la ciencia de datos, pero pocos científicos de datos tienen una formación avanzada en estadística. Los cursos y libros sobre estadística básica rara vez tratan el tema desde la perspectiva de la ciencia de datos. La segunda edición de este libro incluye ejemplos detallados de Python, ofrece una orientación práctica sobre la aplicación de los métodos estadísticos a la ciencia de datos, te indica cómo evitar su uso incorrecto y te aconseja sobre lo que es y lo que no es importante. Muchos recursos de la ciencia de datos incorporan métodos estadísticos, pero carecen de una perspectiva estadística más profunda. Si estás familiarizado con los lenguajes de programación R o Python y tienes algún conocimiento de estadística, este libro suple esas carencias de una forma práctica, accesible y clara. Con este libro aprenderás: Por qué el análisis exploratorio de datos es un paso preliminar clave en la ciencia de datos Cómo el muestreo aleatorio puede reducir el sesgo y ofrecer un conjunto de datos de mayor calidad, incluso con Big Data Cómo los principios del diseño experimental ofrecen respuestas definitivas a preguntas Cómo utilizar la regresión para estimar resultados y detectar anomalías Técnicas de clasificación esenciales para predecir a qué categorías pertenece un registro Métodos estadísticos de aprendizaje automático que 'aprenden' a partir de los datos Métodos de aprendizaje no supervisados para extraer significado de datos sin etiquetar Peter Bruce es el fundador del Institute for Statistics Education en Statistics.com. Andrew Bruce es científico investigador jefe en Amazon y tiene más de 30 años de experiencia en estadística y ciencia de datos. Peter Gedeck es científico de datos senior en Collaborative Drug Discovery, desarrolla algoritmos de aprendizaje automático para pronosticar propiedades de posibles futuros fármacos.
Índice
CONTENIDOS Prefacio 1. Análisis exploratorio de datos 1.1 Elementos de datos estructurados 1.1.1 Lecturas complementarias 1.2 Datos rectangulares 1.2.1 Marcos de datos e índices 1.2.2 Estructuras de datos no rectangulares 1.2.3 Lecturas complementarias 1.3 Estimación de la localización 1.3.1 Media 1.3.2 Estimación de medianas robustas 1.3.3 Ejemplo: estimaciones de localización de la población y tasas de homicidios 1.3.4 Lecturas complementarias 1.4 Estimación de la variabilidad 1.4.1 Desviación estándar y estimaciones relacionadas 1.4.2 Estimación basada en percentiles 1.4.3 Ejemplo: estimaciones de variabilidad de la población estatal 1.4.4 Lecturas complementarias 1.5 Exploración de la distribución de datos 1.5.1 Percentiles y diagramas de caja 1.5.2 Tablas de frecuencias e histogramas 1.5.3 Diagrama y estimación de la curva de densidad 1.5.4 Lecturas complementarias 1.6 Exploración de datos binarios y categóricos 1.6.1 Moda 1.6.2 Valor esperado 1.6.3 Probabilidad 1.6.4 Lecturas complementarias 1.7 Correlación 1.7.1 Diagramas de dispersión 1.7.2 Lecturas complementarias 1.8 Exploración de dos o más variables 1.8.1 Agrupación hexagonal y contornos (representación numérica frente a datos numéricos) 1.8.2 Dos variables categóricas 1.8.3 Datos categóricos y numéricos 1.8.4 Visualización de varias variables 1.8.5 Lecturas complementarias 1.9 Resumen 2. Distribuciones de datos y muestreo 2.1 Muestreo aleatorio y sesgo de la muestra 2.1.1 Sesgo 2.1.2 Selección aleatoria 2.1.3 Tamaño frente a calidad: ¿cuándo importa el tamaño? 2.1.4 Media muestral frente a media poblacional 2.1.5 Lecturas complementarias 2.2Sesgo de selección 2.2.1 Regresión a la media 2.2.2 Lecturas complementarias 2.3 Distribución muestral del estadístico 2.3.1 Teorema del límite central 2.3.2 Error estándar 2.3.3 Lecturas complementarias 2.4 Bootstrap 2.4.1 Remuestreo frente a bootstrapping
Comentarios
Sé el primero en comentar este libroArtículos relacionados