Diseño de Sistemas de Machine Learning
Un Proceso Iterativo para Aplicaciones Listas para Funcionar
Huyen, Chip
Los sistemas de aprendizaje automático, en inglés Machine Learning, implican el uso de métodos, algoritmos y procesos complejos que constan de muchos componentes diferentes además, dependen de datos que varían considerablemente de un caso a otro. Con este libro aprenderá un método integral para diseñar sistemas de aprendizaje automático fiables, escalables, fáciles de mantener ...
Sinopsis
Los sistemas de aprendizaje automático, en inglés Machine Learning, implican el uso de métodos, algoritmos y procesos complejos que constan de muchos componentes diferentes además, dependen de datos que varían considerablemente de un caso a otro. Con este libro aprenderá un método integral para diseñar sistemas de aprendizaje automático fiables, escalables, fáciles de mantener y adaptables a los entornos dinámicos y a los requisitos empresariales. La autora Chip Huyen, cofundadora de Claypot AI, considera cada decisión de diseño en su contexto para determinar la manera como este puede ayudar a su sistema. Analiza desde cómo procesar y crear datos de formación, hasta qué atributos utilizar, con qué frecuencia volver a formar los modelos y qué elementos supervisar. En el marco iterativo de este libro se utilizan estudios de casos reales respaldados por referencias amplias que le ayudarán a alcanzar sus objetivos. Así pues, gracias a esta lectura conocerá: ' La ingeniería de datos y la elección de las métricas adecuadas para resolver un problema empresarial. ' La automatización del proceso de desarrollo, evaluación, instalación y actualización de los modelos. ' El desarrollo de un sistema de supervisión para detectar y resolver rápidamente los problemas que pueda encontrarse con sus modelos en funcionamiento. ' La arquitectura de una plataforma de aprendizaje automático que sirva para todos los casos. ' El desarrollo de sistemas de aprendizaje automático responsables. Chip Huyen es cofundadora de Claypot AI, una plataforma de aprendizaje automático en tiempo real. A través de su trabajo en NVIDIA, Netflix y Snorkel AI, ha ayudado a algunas de las organizaciones más grandes del mundo a desarrollar e implementar sus sistemas de aprendizaje automático. Chip basó este libro en sus apuntes para CS 329S: Diseño de Sistemas de Aprendizaje Automático, un curso que imparte en la Universidad de Stanford. 'Este es, sencillamente, el mejor libro que se puede leer sobre có
Índice
Prefacio .................................................................................................................... ix 1. Panorama de los sistemas de aprendizaje automático ................................... 1 Cuándo utilizar el aprendizaje automático 3 Casos de uso del aprendizaje automático 9 Cómo entender los sistemas de aprendizaje automático 12 El aprendizaje automático en la investigación y en la práctica 12 Los sistemas de aprendizaje automático y el software tradicional 22 Resumen 24 2. Introducción al diseño de sistemas de aprendizaje automático. .................. 25 Objetivos empresariales y de AA 26 Requisitos para los sistemas de AA 29 Confiabilidad 29 Escalabilidad 30 Capacidad de mantenimiento 31 Adaptabilidad 32 Proceso iterativo 32 Planteamiento de problemas de AA 34 Tipos de tareas del AA 35 Funciones objetivo 39 El intelecto frente a los datos 42 Resumen 45 3. Fundamentos de la ingeniería de datos .......................................................... 47 Las fuentes de datos 48 Formatos de datos 51 JSON 52 Los formatos de orden por filas frente a los de orden por columnas 52 Texto frente a formato binario 55 Modelos de datos 56 Modelo relacional 57 NoSQL 61 Datos estructurados frente a datos no estructurados 64 Motores de almacenamiento de datos y procesamiento 65 Procesamiento transaccional y analítico 66 ETL: Extraer, transformar y leer 69 Modos de flujo de datos 71 Datos que pasan por bases de datos 71 Datos que pasan a través de los servicios 71 Transferencia de datos a través del transporte de datos al instante 73 El procesamiento por lotes frente al procesamiento continuo 76 Resumen 78 4. Datos de formación ........................................................................................... 81 Muestreo 82 Muestreo no probabilístico 83 Muestreo aleatorio simple 84 Muestreo estratificado 84 Muestreo ponderado 85 Muestreo de depósito 86 Muestreo de importancia 87 Etiquetado 88 Etiquetas manuales 88 Etiquetas naturales 91 C
Comentarios
Sé el primero en comentar este libroArtículos relacionados