Перед вами - первая книга о глубоком обучении, написанная на русском языке. Глубокие модели оказались ключом, который подходит ко всем замкам сразу: новые архитектуры и алгоритмы обучения, а также увеличившиеся вычислительные мощности и появившиеся огромные наборы данных, привели к революционным прорывам в компьютерном зрении, распознавании речи, обработке естественного языка и многих других типично "человеческих" задачах машинного обучения. Эти захватывающие идеи, вся история и основные компоненты революции глубокого обучения, а также самые современные достижения этой области, доступно и интересно изложены в книге. Максимум объяснений, минимум кода, серьезный материал о машинном обучении и увлекательное изложение - в этой уникальной работе замечательных российских ученых и интеллектуалов.
Ч а с ть I. Как обучать н ей р он ны е сети Глава 1. От биологии к информатике, или We need to go deeper... 6 1.1. Революция обучения глубоких с е т ей ... 7 1.2. Искусственный интеллект и машинное обучение...11 1.3. Немного о словах: каким бывает машинное обучение... 17 1.4. Особенности человеческого мозга... 21 1.5. Пределы нейробиологии: что мы на самом деле знаем? . . ...26 1.6. Блеск и нищета современных нейронных сетей...30 Глава 2. Предварительные сведения, или Курс молодого б о й ц а ... 38 2.1. Теорема Байеса...39 2.2. Функции ошибки и регуляризация...53 2.3. Расстояние Кульбака — Лейблера и перекрестная энтропия...63 2.4. Градиентный спуск: основы...69 2.5. Граф вычислений и дифференцирование на нем... .. 75 2.6. И о практике: введение в TensorFlow и Keras... 81 Глава 3. Перцептрон, или Эмбрион мудрого компьютера...93 3.1. Когда появились искусственные нейронные с е т и ... 94 3.2. Как работает перцептрон... 97 3.3. Современные перцептроны: функции активации... 105 3.4. Как же обучаются настоящие нейроны...ИЗ 3.5. Глубокие сети: в чем прелесть и в чем сложность?..117 3.6. Пример: распознавание рукописных цифр на TensorFlow... 123 Ч а с ть II. О сн о вны е ар хи тек ту ры Глава 4. Быстрее, глубже, сильнее, или Об оврагах, долинах и трамплинах .137 4.1. Регуляризация в нейронных с е тя х ...138 4.2. Как инициализировать в е с а ... 142 4.3. Нормализация по мини-батчам... 153 4.4. Метод моментов: Ньютон, Нестеров и Гессе... 164 4.5. Адаптивные варианты градиентного сп у ска ...169 Глава 5. Сверточные нейронные сети и автокодировщики, или Не верь глазам своим... 176 5.1. Зрительная кора головного мозга... 177 5.2. Свертки и сверточные сети... 182 5.3. Свертки для распознавания цифр...199 5.4. Современные сверточные архитектуры...206 5.5. Автокодировщики...214 5.6. Пример: кодируем рукописные цифры...219 Глава 6. Рекуррентные нейронные сети, или Как правильно кусать себя за х в о с т ... 231 6.1. Мотивация: обработка последовательностей... 232 6.2. Распространение ошибки и архитектуры RN N ... 236 6.3.LST M ...242 6.4. GRU и другие варианты... 249 6.5. SCRN и другие: долгая память в обычных RNN... 253 6.6. Пример: порождаем текст символ за символом... 259 Часть III. Новые архитектуры и применения Глава 7. Как научить компьютер читать, или Математик — Мужчина + Женщина = ... 278 7.1. Интеллектуальная обработка текстов... 279 7.2. Распределенные представления слов: word2vec... 285 7.3. Русскоязычный word2vec на практике...297 7.4. GloVe: раскладываем матрицу правильно...305 7.5. Вверх и вниз от представлений слов... 313 7.6. Рекурсивные нейронные сети и синтаксический ра зб о р ...322 Глава 8. Современные архитектуры, или Как в споре рождается истина . . .330 8.1. Модели с вниманием и encoder-decoder... 331 8.2. Порождающие модели и глубокое обучение... 341 8.3. Состязательные с е т и ... 348 8.4. Практический пример и трюк с логистическим сигмоидом...353 8.5. Архитектуры, основанные на GAN...359 Глава 9. Глубокое обучение с подкреплением, или Удивительное происшествие с чемпионом... 372 9.1. Обучение с подкреплением...373 9.2. Марковские процессы принятия решений...379 9.3. От TDGammon к DQN... 391 9.4. Бамбуковая хлопушка... 399 9.5. Градиент по стратегиям и другие применения...405 Глава 10. Нейробайесовские методы, или Прошлое и будущее машинного обучения...409 10.1. Теорема Байеса и нейронные сети...410 10.2. Алгоритм ЕМ...412 10.3. Вариационные приближения...419 10.4. Вариационный автокодировщик...426 10.5. Байесовские нейронные сети и дропаут... 438 10.6. Заключение: что не вошло в книгу и что будет дальше... 446 Благодарности... 450 Литература...451
Название: Глубокое обучение Автор: Николенко С. И., Кадурин А. А., Архангельская Е. О. Год: 2018 Жанр: программирование Серия: Библиотека программиста Издательство: Питер Язык: Русский
Формат: pdf Качество: Распознанный текст с ошибками (OCR) Страниц: 479 Размер: 106 MB
Скачать Николенко С. И., Кадурин А. А., Архангельская Е. О. - Глубокое обучение (2018)