Grandes Modelos de Lenguaje
Conceptos, Técnicas y Aplicaciones
Atkinson-Abutridy, John
¡Prepárese para sumergirse en el mundo fascinante y vanguardista de la inteligencia artificial! En este libro descubrirá el nexo en común que impulsa algunas de las aplicaciones recientes más revolucionarias de la inteligencia artificial (IA): desde sistemas conversacionales como ChatGPT o BARD, hasta la traducción automática, generación de resúmenes, respuesta a preguntas y mu...
Sinopsis
¡Prepárese para sumergirse en el mundo fascinante y vanguardista de la inteligencia artificial! En este libro descubrirá el nexo en común que impulsa algunas de las aplicaciones recientes más revolucionarias de la inteligencia artificial (IA): desde sistemas conversacionales como ChatGPT o BARD, hasta la traducción automática, generación de resúmenes, respuesta a preguntas y mucho más. En el centro de estas innovadoras aplicaciones, se encuentra una disciplina poderosa y en creciente evolución, el procesamiento del lenguaje natural (PLN o NLP, por sus siglas en inglés). Durante más de 60 años, la investigación de esta ciencia ha estado enfocada en permitir que las máquinas comprendan y generen lenguaje humano de manera eficiente. Los secretos detrás de estos avances tecnológicos residen en los grandes modelos de lenguaje (LLM), cuyo poder radica en su capacidad de capturar patrones complejos y aprender representaciones contextuales del lenguaje. Imagine cómo estos modelos pueden poner atención en los detalles más relevantes de un texto, aprendiendo automáticamente relaciones complejas para brindar respuestas y resultados más precisos. ¿Cómo funcionan estos LLM? ¿Cuáles son los modelos disponibles y cómo se evalúan? Este libro le ayudará a responder estas y muchas otras preguntas. Con una introducción técnica pero accesible: ' Explorará el fascinante mundo de los LLM, desde sus fundamentos hasta las aplicaciones más poderosas. ' Aprenderá a construir sus propias aplicaciones simples con algunos de los LLM. Grandes modelos de lenguaje está diseñado para guiarle paso a paso en este emocionante viaje. Con 6 capítulos que combinan teoría y práctica, junto con ejercicios en Python en la plataforma Colab, dominará los secretos de los LLM y su aplicación en el procesamiento del lenguaje natural. Desde las redes neuronales profundas y los mecanismos de atención, hasta los LLM más relevantes tales como BERT, GPT-4, LLaMA, Palm-2 y Falcon, será testigo de los logros más imp
Índice
Índice de figuras ................................................................................................ XIX Índice de tablas ................................................................................................ XXII CAPÍTULO 1 ............................................................................................................ 1 1.1. Inteligencia artificial generativa ............................................................ 1 1.1.1. Funcionamiento de la IA generativa ................................................. 3 1.1.2. Focos de la IA generativa .................................................................. 6 1.1.3. Aplicaciones ...................................................................................... 7 1.2. Modelos de lenguaje generativos ......................................................... 8 1.3. Conclusiones ....................................................................................... 14 CAPÍTULO 2 .......................................................................................................... 15 2.1. Introducción ........................................................................................ 15 2.2. Modelos de lenguaje autorregresivos ................................................ 19 2.3. Modelos de lenguaje estadísticos ....................................................... 21 2.4. Modelos de lenguaje neuronales ........................................................ 22 2.4.1. Modelos de lenguaje preentrenados ............................................. 25 2.5. Grandes modelos de lenguaje ............................................................ 26 2.6. Modelos de embeddings de palabras ................................................. 27 2.7. Redes neuronales recurrentes ............................................................ 35 2.7.1. Redes neuronales recurrentes simples .......................................... 35 2.7.2. Redes de memoria a corto-largo plaz
Comentarios
Sé el primero en comentar este libroArtículos relacionados