Форум программистов, компьютерный форум, киберфорум
Искусственный интеллект
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.75/4: Рейтинг темы: голосов - 4, средняя оценка - 4.75
0 / 0 / 0
Регистрация: 12.08.2016
Сообщений: 23
1

ИИ и Qlearning в частности

25.10.2020, 16:44. Показов 780. Ответов 2

Author24 — интернет-сервис помощи студентам
Доброго времени суток уважаемые форумчане!

В последнее время интересуюсь ИИ, пройден курс по введению в машинное обучение на курсере, однако по Q learning там не было материала.
Изучал статьи и код:
https://habr.com/ru/post/308094/
https://habr.com/ru/post/345656/
https://blog.foxylab.com/q-learning/

Остался ряд вопросов на примере 3ьей статьи.
Суть статьи как я понял:
Есть лабиринт, есть препятствия и ловушки, есть финиш справа внизу, есть старт слева сверху. ИИ учится, составляет матрицу весов для каждой клетки. После каждого достижения финиша матрица весов сохраняется и поверх неё начинается записываться новая, увеличивая коэффициенты тех направлений, что приводят нас к финишу. В итоге, после нескольких итераций получается матрица весов, по которой вино кратчайшее направление движения.
А теперь вопросы:
Что будет если расширить карту влево и вверх еще на столько же и поместить финиш в другой угол? Ведь в этом случае полученная матрица весов будет бесполезна. (тут проглядывается классический результат переобучения)
Эффективен ли будет QLearning, если финиш будет каждый раз менять своё местоположение? Ведь, насколько я понял, результатом обучения является матрица весов, указывающая правильное направление. Да, если финиш сменил своё место с нижнего угла справа на нижний угол слева, то какой то профит всё еще остается (алгоритм знает что надо двигаться вниз), но вот если финиш совсем в другом месте? А если финиш в каждой итерации будет перемещаться рандомно по всему полю?
Если не Qlearning, то какой алгоритм ИИ сможет эффективно решить задачу, где есть полностью наблюдаемая окружающая среда (её можно просчитать, но число вариантов очень много и сложность расчетов также присутствует, поэтому нужно просчитывать "нужные" варианты, а не все подряд, что полностью исключает решение задачи методом в лоб - перебором), которая при этом изменяется во времени, а конечная цель может менять своё местоположение?

Открыт для любой информации.
Заранее спасибо
С уважением, Вячеслав.
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
25.10.2020, 16:44
Ответы с готовыми решениями:

Form, а в частности Textarea
в Textarea в зоне ввода весь текст он вводит в одну строку... а мне бы хотелось чтобы текст...

шаблоны и typename в частности
Здравствуйте! Я разбираюсь с ассоциативными контейнерами в с++ - делаю лабораторную по ним...

Игровые движки в частности 2д
Порылся пару дней по форуму, но нужной темы и не нашел. Мне 17 лет год назад начал изучать...

Распознавание образов (цифр в частности)
Помогите создать нейросеть и обучить ее, чтобы она загружала картинки с пк и в результате выводила...

2
672 / 546 / 74
Регистрация: 20.09.2014
Сообщений: 3,550
25.10.2020, 17:06 2
Не путайте переобучение с дообучением (обучением заново). Переобучение - это чрезмерная тренировка на каких-либо не столь богатых данных, т.е. перебор в обучении. Дообучение - обучение нейросети на новых данных, которые сильно отличаются от тех данных, которые предоставлялись ранее.

Если вы обучили нейросеть определенной задаче, то она не будет работать на другой задаче (точнее сказать, будет работать плохо).

Чтобы нейросеть умела находить выходы слева, справа, сверху и т.п., вы должны подготовить соответствующие обучающие примеры.

Чуда не бывает, никакой интеллект не умеет делать то, не знаю что. И человеческий интеллект тоже, как бы хорошо вы о нем не думали. Просто возможно человек обучается многому и везде понемножку, многое может продемонстрировать, поэтому кажется, что он способен решать любые неформализованные задачи. Однако это заблуждение.
1
0 / 0 / 0
Регистрация: 06.06.2020
Сообщений: 3
31.10.2020, 11:07 3
"...есть полностью наблюдаемая окружающая среда...".

Обычно машинное обучение требуется, где как раз полного наблюдения нет. Если вы полностью знаете граф, то решите задачу поиска минимального пути одним из алгоритмов на графе, методом Дейкстры, волновым методом.

Если заранее веса ребер в графе не известны и смена целевой позиции меняется произвольно, то Q-learning будет также тупить, как и человек в подобной ситуации.
0
31.10.2020, 11:07
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
31.10.2020, 11:07
Помогаю со студенческими работами здесь

Динамические структуры. В частности стек.
В динамических структурах оочень плохо разбираюсь, помогите. Вывести стек и если все элементы...

Языки программирования в целом и С++ в частности
В школе с учителем информатики произошёл спор. Он утверждает,что перед main() { } может писаться...

Неприятность с компьютером. В частности с ОС Windows 7
Уважаемые знатоки! Произошла неприятная история, с которой я не могу справиться из-за отсутствия...

Подбор комплектующих, в частности, процессора
Не уверен какой проц взять. Знаю что этот мощнее http://www.citilink.ru/catalog/parts/cpu/734013/ ...

Обучение основам программирования и Qt в частности
Здравствуйте уважаемые форумчане. Я в програмировании новичок, знаю только ХТМЛ и совсем немного...

Отображение данных на форме, в частности, в TreeView
У меня есть несколько вопросов: 1) можно ли привязать БД Access к форме С#? 2) Если можно, то...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru