1 / 1 / 0
Регистрация: 28.08.2015
Сообщений: 112
|
|
1 | |
Локальный минимум при обучении нейросети31.07.2016, 11:43. Показов 1720. Ответов 3
Метки нет (Все метки)
Как понять, что при обучении функция ошибки попала в локальный минимум? Ошибка начинает увеличиваться или очень медленно уменьшаться?
0
|
31.07.2016, 11:43 | |
Ответы с готовыми решениями:
3
локальный минимум локальный минимум Локальный минимум локальный минимум |
41 / 20 / 3
Регистрация: 12.10.2015
Сообщений: 126
|
|
31.07.2016, 12:50 | 2 |
То же как при приближении к глобальному экстремуму, ошибка стабилизируется и шумит, многое зависит от применения «ускорителей» градиентного спуска , всяких гессианов и эвристических масштабирований лернингрэйта градиента, приращение ошибки может и не замедляться перед эустремумом а почти линейно к нему прийти и там осциллировать
1
|
1609 / 1511 / 251
Регистрация: 19.02.2010
Сообщений: 4,078
|
|
31.07.2016, 21:43 | 3 |
Ой, как я рад тому, что народ использует деление на лок/глоб.минимумы при определении успешности обучения
Вместо того, чтобы успехом считать построение АДЕКВАТНОЙ модели (нейросети). В качестве одного примера-подсказки: в случае шума в данных глоб.минимум может соответствовать запоминанию шума (т.е. неадекватной модели), а лок.минимум - остановке в момент, когда тенденции были выявлены, но случайный шум ещё не начал запоминаться. Да и смысл ловить разные минимумы при КОМБИНАТОРНОМ числе эквивалентных "клонов"-копий каждого минимума (хоть локального, хоть глобального) в нейросетке? Думаете, что если одно обучение прибежало в лок.минимум - то следующее прибежит в глобальный? Нет, может прибежать даже не в другой лок.минимум - а в эквивалентный предыдущему вариант (в котором просто будут "переставлены" местами пара нейронов скрытого слоя с их входными и выходными синапсами - таких возможных парных перестановок комбинаторное число, и это ещё не вся комбинаторика эквивалентностей в нейросетке).
0
|
41 / 20 / 3
Регистрация: 12.10.2015
Сообщений: 126
|
|
04.08.2016, 14:44 | 4 |
Ну так динамика ошибки на лёрне и тесте как правило и отражают адекватность модели, на сколько мне известно строгой теории как строить архитектуры многослойных персептронов в зависимости от данных и процесса обучения ещё нет, всё на эвристиках, что то типа генетического перебора архитектур которые сравниваются по функционалам которые зависят как правило от минимума ошибки на тесте и чтобы не сильно шумела. А адекватных моделей может быть много, вопрос как эту адекватность быстро вычислять ограничивая перебор.
0
|
04.08.2016, 14:44 | |
04.08.2016, 14:44 | |
Помогаю со студенческими работами здесь
4
Локальный минимум локальный минимум Локальный минимум матрицы Локальный минимум матрицы Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи | |||||
Как написать микросервис на Go/Golang
InfoMaster 14.01.2025
Определение микросервиса, преимущества использования Go/ Golang
Микросервис – это архитектурный подход к разработке программного обеспечения, при котором приложение состоит из небольших, независимо. . .
|
Как написать микросервис с нуля на C#
InfoMaster 14.01.2025
В современном мире разработки программного обеспечения микросервисная архитектура стала стандартом де-факто для создания масштабируемых и гибких приложений. Этот архитектурный подход предполагает. . .
|
Как создать интернет-магазин на PHP и JavaScript
InfoMaster 14.01.2025
В современном мире электронная коммерция стала неотъемлемой частью бизнеса. Создание собственного интернет-магазина открывает широкие возможности для предпринимателей, позволяя достичь большей. . .
|
Как написать Тетрис на Ассемблере
InfoMaster 14.01.2025
Тетрис – одна из самых узнаваемых и популярных компьютерных игр, созданная в 1984 году советским программистом Алексеем Пажитновым. За прошедшие десятилетия она завоевала симпатии миллионы людей по. . .
|
Как создать игру "Танчики" на Unity3d и C#
InfoMaster 14.01.2025
Разработка игр – это увлекательный процесс, сочетающий в себе творчество и технические навыки. В этой статье мы рассмотрим создание классической игры "Танчики" с использованием Unity3D и языка. . .
|
Организую платный онлайн микро-курс по доработке Android-клиента Telegram
_Ivana 14.01.2025
Официальная версия и распространенные форки не полностью устраивают? Сделай свою кастомную версию клиента!
4 занятия по 2 часа (2 недели пн, ср 19:00-21:00 по Москве).
Первое вводное занятие. . .
|
Как создать приложение для фитнеса для iOS/iPhone на Kotlin
InfoMaster 14.01.2025
Создание собственного фитнес-приложения — это не только захватывающий, но и полезный процесс, ведь оно может стать вашим верным помощником на пути к здоровому и активному образу жизни. В современных. . .
|
Как создать приложение магазина для iOS/iPhone на Swift
InfoMaster 14.01.2025
Введение в разработку iOS-приложений
Разработка приложений для iPhone и других устройств на базе iOS открывает огромные возможности для создания инновационных мобильных решений. В данной статье мы. . .
|
Это работает. Скорость асинхронной логики велика. Вопрос видимо останется в стабильности. Плата - огонь!
Hrethgir 13.01.2025
По прошлому проекту в Logisim Evolution https:/ / www. cyberforum. ru/ blogs/ 223907/ blog8781. html прилагаю файл архива проекта в Gowin Eda. Восьмибитный счётчик из сумматора+ генератор сигнала. . .
|
UserScript для подсветки кнопок языков программирования в зависимости от текущего раздела
volvo 13.01.2025
В результате работы этого скрипта подсвечиваются нужные кнопки не только в форме быстрого ответа, но и при редактировании сообщения:
/ / ==UserScript==
/ / @name CF_DefaultLangSelect
/ / . . .
|
Введение в модели и алгоритмы машинного обучения
InfoMaster 12.01.2025
Машинное обучение представляет собой одну из наиболее динамично развивающихся областей искусственного интеллекта, которая фокусируется на разработке алгоритмов и методов, позволяющих компьютерам. . .
|
Как на Python создать нейросеть для решения задач
InfoMaster 12.01.2025
В контексте стремительного развития современных технологий особое внимание уделяется таким инструментам, как нейросети. Эти структуры, вдохновленные биологическими нейронными сетями, используются для. . .
|