Подстропильник: Стропильная система двухскатной крыши своими руками – инструкция по устройству

04.03.2021 автор alexxlab

Содержание

Двухскатная кровля крыш под ключ — стропильная система, калькулятор для расчета онлайн двухскатной крыши, как сделать

Крыша — один из самых важных элементов любой постройки. Она защищает остальные строительные конструкции от воздействия атмосферных явлений. От качества ее проектирования и монтажа напрямую зависит способность строения противостоять дождю, снегу ветру и морозу. Одной из наиболее популярных конструкций заслуженно стала двухскатная крыша.

Особенности, преимущества и недостатки двухскатной крыши

Главная особенность двухскатной крыши вытекает из ее названия: кровля имеет два ската, симметричных или ассиметричных. В случае ассиметричной крыши возможны два варианта:

конек сдвинут относительно продольной оси здания;
кровля с одной стороны образует свес, под которым оборудуют веранду или стоянку для автомобиля.

От угла наклона кровли зависит ее способность сопротивляться ветровой и снеговой нагрузке.

Двускатная кровля обладает следующими преимуществами:

прочность: симметричная стропильная система лучше других сопротивляется переменным нагрузкам и равномерно распределяет их по стенам;
надежность: единственный стык по коньку обеспечивает долгую службу;
увеличивая угол наклона, можно повысить способность противостоять снеговой нагрузке и одновременно увеличить объем мансардного пространства;
простота проектирования и монтажа;
разумная цена.

К недостаткам двускатных крыш относят:

влияние площади дома на высоту крыши и угол ее наклона;
необходимость устройства мансардных окон для выхода на крышу.

Двускатная крыша остается одним из самых популярных вариантов для небольших жилых и средних хозяйственных построек.

Какой угол выбрать у крыши

На выбор угла наклона крыши решающее влияние оказывает преобладающая погода в регионе постройки.

В районах с частыми и обильными снегопадами угол лучше увеличить, чтобы облегчить сход снега с кровли. В противном случае придется усиливать стропильную систему так, чтобы она могла выдержать снеговую нагрузку.

Если же преобладают сильные и порывистые ветра, угол лучше уменьшить. Это снизит эффективное вертикальное сечение кровли и позволит выдерживать сильные порывы ветра.

Третьим фактором при выборе угла служит желание максимально использовать мансардное пространство. При угле в 45^о удается использовать до половины площади.

Подготовительный этап

От качества проектирования напрямую зависит прочность, экономичность и долговечность постройки.

Расчет площади крыши

При расчете площади крыши дома нужно обязательно учитывать ее свесы. Они составляют от 0,7 до 1,5 метров с каждой стороны. Свесы защищают верхнюю часть стен от осадков и отводят стекающую дождевую воду на определенное расстояние от фундамента.

Выбираем точки опоры

При длине стропил до 3 метров, в небольших постройках типа сарая, бани или гаража, используют т.н. висячую конструкцию: стропила и опорные брусья образуют разносторонний треугольник и скрепляются по концам. Опираются они непосредственно на верхнюю кромку стен.

Для построек больших размеров по верхней части стен устраивается опорный контур из брусьев, называемый мауэрлат. К нему крепятся стропила, опорные брусья и промежуточные стойки, или подстропильники.

Материалы для утепления

При выборе теплоизолирующего материала необходимо учитывать:

коэффициент теплопроводности;
пожаробезопасность и экологичность;

плотность.

Стропильная система должна выдерживать массу кровли, утеплителя, нагрузку от снега и ветра. Для жилых домов обычно применяют минеральную или стеклянную вату. Она не горит, не выделяет вредные вещества, обладает хорошими теплоизоляционными свойствами. Для хозяйственных построек используют пенопласт. Он отличается низкой ценой и малым удельным весом.

Укладываем мауэрлат

Монтаж крыши начинается с укладки мауэрлата. В ходе этой операции необходимо соблюдать аккуратность и точность. Это обеспечит надежное крепление кровли к стенам. В кирпичных домах используют следующие методы крепления, или вязки:

в последние 3-4 ряда кладки вставляется закладная деталь — катаная проволока, она закручивается вокруг брусьев мауэрлата;
закладываются стальные шпильки диаметром 12-20 мм, они пропускаются сквозь отверстия в брусьях и фиксируются гайками и шайбами;

по верхнему контуру стен отливается бетонная балка с закладными деталями — шпильками.

В деревянных домах мауэрлат укладывается в качестве последнего венца сруба и крепится к предпоследнему коваными скобами или монтажными пластинами.

Установка стропил

Монтаж стропил выполняют в следующем порядке:

выставляют крайние стропильные фермы;
проверяют точность установки уровнем и нивелиром;
закрепляют боковые стропила к мауэрлату временными раскосинами;
монтируют остальные стропила;
укладывают гидроизоляционную мембрану;
набивают доски обрешетки, окончательно фиксирующие конструкцию.

Далее следует еще раз проверить соответствие чертежу размеров и углов установки элементов.

Утепление двухскатной крыши

Изоляционный материал закладывают между стропил так, чтобы не оставалось щелей и зазоров. Сверху его покрывают слоем пароизоляции.

Полотна пароизолирующей мембраны укладывают с нахлестом в 10-15 см и скрепляют между собой двухсторонним скотчем.

При перемещении по утепляемой крыше нужно соблюдать осторожность и наступать только на стропила.

Выбор кровельного материала

Рынок предлагает большое разнообразие кровельных материалов. Наиболее популярными среди них являются.

Металлочерепица

Имитация черепичной кровли из холоднокатаного стального листа с многослойным полимерным покрытием обладает следующими достоинствами:

прочность благодаря пространственной структуре, имитирующей плашки черепицы, способность нести большую снеговую и ветровую нагрузку;
надежность, стойкость к воздействию погодных явлений;
элегантный внешний вид.

Свойственны металлочерепице и ряд недостатков:

большой вес кровли;
высокие требования к точности монтажа стропильной системы и ровности поверхности обрешетки;
требуются опытные работники для качественного монтажа.

Металлочерепица выгодно проявляет свои эстетические свойства на двускатных кровлях.

Мягкая кровля

Мягкая кровля выполняется из целлюлозных листов, пропитанных битумом. Сверху на них наносят слой кварцевого песка. Делается в виде рулонов, используемых на плоских кровлях, и в виде сегментированных листов.

Фигурные сегменты вырезаются на производстве и укладываются с многократным перекрытием. Крепятся кровельными гвоздями и предварительно нанесенной на листы мастикой. На каждую точку крыши приходится от 4 до 6 слоев кровельного материала.

Ее достоинства таковы:

приятный внешний вид;
долговечность;
простота установки;
качественная звукоизоляция.

К недостаткам относят:

цену;
особую внимательность при монтаже;
затруднения при покрытии крыши сложной формы.

Материал сочетается как с деревянными, так и с кирпичными домами.

Композитная черепица

Это разновидность металлочерепицы, в которой на стальную основу нанесены слои эпоксидной грунтовки, каменной крошки и защитной акриловой эмали. Установленная крыша выглядит как керамическая черепица. Достоинства ее таковы:

исключительно эстетичный внешний вид;
повышенная прочность к механическим воздействиям;
увеличенный срок службы.

К недостаткам материала относятся высокая цена и большой вес, приводящий к усилению стропильной системы.

Профнастил

Это упрощенная версия металлочерепицы, на стальном листе вместо имитации рисунка черепицы выштамповывают прямоугольные волны. К преимуществам материала относятся:

доступная цена;
высокая прочность;
простота монтажа.

Свойственны ему и недостатки:

простоватый внешний вид;
повышенный вес.

Профнастил чаще используют для вспомогательных построек, таких как гараж или сарай.

Ондулин

Ондулин представляет собой листы из целлюлозного материала, пропитанные битумом и окрашенные специальным покрытием. Листы размеров 2*1 м отформованы и имитируют черепицу или волнистый шифер.

Достоинства:

дешевизна;
устойчивость к погодным явлениям;
легкость;
простота установки;
шумоизоляция.

Недостатки:

малая прочность при механических воздействиях;
пожароопасность;
выгорание на солнце;
склонность к появлению мха в затененных местах.

Фальцевая кровля

Плоские металлические листы соединяются продольными швами с загибанием края листов друг относительно друга. Такой материал обладает следующими плюсами:

дешевизна материала;
герметичность кровли;
небольшой удельный вес;
удобство выполнения крыш сложной формы.

Есть и минусы:

высокая шумность;
нужна улучшенная теплоизоляция;
накопление статических зарядов;
трудоемкость и сложность монтажных работ.

Стоимость квадратного метра такой кровли получается весьма высокой.

На какие сооружения рекомендуется двухскатная крыша

Двухскатная кровля идеальна для малых и средних жилых домов, сараев. Подойдет она и на гараж.

Она позволяет устроить в мансардном пространстве жилые помещения или место для хранения различных материалов или запасов корма для животных.

Идеальным вариантом двускатная кровля является для бани – в большинстве популярных проектов выбран именно этот тип крыши.

Как лучше сделать мансардный этаж под двухскатную крышу

При проектировании мансардных помещений под двускатной крышей следует понимать, что при высоте кровли в 4 метра эффективно использовать удастся не более половины площади. С одной стороны, ограничение накладывает высота помещения, с другой – ряды стропильных опор ограничивают возможности для планировки. Для спальных комнат допустимо часть стены сделать наклонной и разместить под ней кровать.

Интересным решением является планировка, при которой конек размещен не традиционно, вдоль длинной стороны дома, а вдоль короткой. Это увеличивает ширину фронтонов, возможности для размещения окон и позволяет уйти от продольной «коридорной» планировки мансарды.

Устройство мансардных окон дает возможность использовать естественное освещение там, где это необходимо. Но такое решение снижает прочность и герметичность кровли.

виды крыши для бани, установка, монтаж, видео

Несущие возможности и прочность крыши прямо зависят от характеристик ее конструкции – основы или каркаса, поэтому размещение стропилин должно выполняться строго по имеющимся технологиям. Как крепить стропила на баню – часто возникающий вопрос, особенно, у тех, кто решил самостоятельно возвести такой объект.

Какой вид крыши для бани выбрать?

Если возведение бани выполняется самостоятельно, то еще в ходе разработки проекта появляется вопрос о выборе конструкции кровли. Чаще всего, предпочтение отдают кровле с одним или двумя скатными поверхностями, и каждая из них имеет свои достоинства.

Виды крыш бани

Чтобы максимально сократить расходы на возведение небольшой бани, которая будет использоваться только в теплый период года, рекомендуют выбрать для строительства кровлю с одной скатной поверхностью. В таком случае подкровельное — чердачное — пространство будет небольшого размера (или совсем будет отсутствовать), но его можно будет использовать для складирования и хранения инвентаря или материалов. Главные преимущества кровли с одним скатом — несложное возведение и небольшая стоимость использующихся материалов. К основным недостаткам относятся низкие теплоизолирующие показатели такой конструкции.

Важно: правильно определить угол уклона такой крыши, чтобы на ней не застаивалась дождевая вода и не скапливались снеговые наносы в холодный период.

Возведение кровли с двумя скатными плоскостями позволяет обустроить на крыше бани чердачное помещение, которое можно использовать, разместив банные принадлежности (например, веники) и различного инвентаря. Достаточное по площади подкровельное пространство часто задействовано для обустройства помещения для развлечений (бильярдной) и отдыха, и, даже жилых комнат (например, мансарды или спальни). Постройка двускатной, хорошо теплоизолированной кровли с ломаными и прямыми скатными плоскостями позволяет получить необходимые условия, чтобы пользоваться баней круглый год.

Важно: к постройке банной кровли переходят, как правило, сразу, как закончено обустройство сруба или монтаж коробки строения из других стройматериалов.

Опора для стропил под баню

Схема крепления стропильной системы крыши бани. Висячие стропила.

Чаще всего для обустройства стенок бани используется сруб из брусьев/бревен. Также распространенными стеновыми стройматериалами для возведения бани являются блоки из газобетона, кирпич и другие штучные стройматериалы. На предварительно подготовленном участке сруб несложно возвести самостоятельно из готовых деталей, либо собрать его из приобретенной древесины и обрезать каждый элемент.

Если у бревен/брусьев для монтажа конструкции сруба отсутствует защищающая спецпропитка, все деревянные элементы перед установкой обрабатываются огне- и биозащитными веществами.

После выбора типа возводимой кровли нужно обеспечить будущей стропиловочной конструкции надежную опору. Отвечая на вопрос — как крепить стропила на баню, нужно знать, что система стропилин должна опираться и крепится к мауэрлату/к балкам перекрытия, которые опираются, в свою очередь, на верхушки стенок. Если крыша на баню устанавливается на деревянный сруб, мауэрлатом является самый верхний ряд (венец) балок/бревен конструкции.

Мауэрлат возводится из деревянных толстых досок или брусьев, размещаемых на стенках. Он обеспечивает распределять вполне равномерно нагрузку всей кровельной конструкции на стенки и, дальше, вплоть до фундамента-основы строения.

Варианты крепления стропильной ноги к мауэрлату

Важно в процессе монтажа деталей мауэрлата применять надежные гибкие гидроизоляционные стройматериалы на битумной основе. На небольших по размеру банях, или если их кровля имеет незначительную массу (не создавая больших нагрузок) в верхней части стенок можно не обустраивать специальный армпояс, с размещенными в нем шпильками для крепежа мауэрлата. В таком случае в самые верхние ряды стеновых элементов вмуровываются отрезки металлической прочной катанки-проволоки. Эти отрезки скручиваются вокруг деталей мауэрлата, закрепляя его и предотвращая его перемещения. К стенкам детали мауэрлата также могут крепиться анкерами.

Каркас бани, представляющий собой деревянный сруб, необходимо подготовить к размещению на нем деталей конструкции крыши. Следует провести проверку расположения деталей верхнего венца строго по горизонтали и, при наличии, ликвидировать отклонения.

Балки или бревна перекрытий размещаются в несколько способов:

Врезкой балочных торцов, непосредственно, в самый верхний ряд брусьев.
Укладыванием балок сверху стенок, с выходом их концов за пределы стен, чтобы стать опорными элементами стропилин.
Либо же балками перекрытия становятся сами затяжки висячих стропиловочных ферм.

Стропиловочная конструкция может включать множество деталей. Для возведения стропиловочной конструкции для банной кровли могут потребоваться:

ригеля;
стропилины;
перемычки;
стойки;
затяжки и подкосы.

Вспомогательные детали обеспечивают усиление конструкций, создавая нужную жесткость у подкровельного каркаса.

Важно: стропилины и другие деревянные детали под нужные размеры изготавливают прямо на стройплощадке.

Установка крыши с одной скатной плоскостью на бане

При возведении кровли с одним скатом нужно сделать угол уклона таким, чтобы в дождливые периоды года с кровельной поверхности быстро и легко стекала вода, а в холодное время не скапливались снежные наносы. Поэтому значение этого параметра должно быть не меньше 20°. Самым оптимальным является угол наклона стропилин — 35°, а для районов с обильными зимними снегопадами – 45° и больше. Как крепить стропила на баню на крыше с одним скатом? Необходимо, чтобы стропилины были установлены под заранее рассчитанным углом, а также обеспечить нужную разницу высот стенок, являющихся опорными. Получить требующуюся разницу высот можно 2 способами:

При строительстве одну из двух опорных стенок строят выше другой.
На одной из стенок строения устанавливается дополнительная конструкция.

Схема крепления односкатной крыши бани

Первый способ чаще используется для возведения стенок из штучных стройматериалов. Второй способ используется в любых строениях, которые получают при этом, одновременно, фронтон, закрытый деревянными элементами или любым листовым стройматериалом. Опорные функции под стропилинами выполняют прогоны, устанавливаемые и закрепляемые на стойках.

Стропилины при возведении крыши с одной скатной поверхностью на бане перекрывают весь пролет по протяженности бани. Возможно размещение стропилин без установления подпорок, если размер пролета по длине меньше 4,5 м. Чтобы кровля стала еще более надежной, стропилины размещаются на расстоянии 0,6 м друг от друга (значение промежутка зависит от рассчитываемых в проекте крыши нагрузок и диаметра используемого стройматериала). Если значение величины пролета больше 4,5 м, обязательно под стропилины укладывают подкосы.

Стропилины крепятся верхней и нижней сторонами к опорному бруску. Для обеспечения наиболее плотного контакта, в стропилинах необходимо выполнить спецвырезы. Для крепежа используются стальные гвозди, пластины и проволока.

Важно: при строительстве кровли с одной скатной плоскостью необходимо делать вынос стропилин за границы стенок строения на 0,3-0,5 м. Это защитит поверхность стенок от неблагоприятного действия природных явлений.

Монтаж двускатной крыши на бане

Стропиловочная конструкция щипцовой крыши предусматривает необходимость монтажа висячих /наслонных стропилин. Когда строительство кровли с двумя скатными плоскостями осуществляется на бане, имеющей несущую стенку внутри, легче всего устанавливать стропилины наслонного типа.

Варианты устройства стропильной системы двускатной крыши бани

Верхняя часть наслонных стропилин прикрепляется к коньковому брусу или прогону. Чтобы этот элемент был строго горизонтален, нужно установить опорные стойки, а затем проконтролировать их размещение и высоту. Вначале устанавливаются стойки на стенках во фронтальных частях строения, а потом по шнуру, располагаемому горизонтально, определяется правильность монтажа остальных деталей конструкции. Наслонные стропилины прикрепляются гвоздями к прогону конька. А их нижняя сторона опирается на брусья мауэрлата, верхнюю часть (венец) сруба или в балку опорную. Чтобы избежать смещения стропилин, нужно выполнить врубку или поставить брус подшивной. Боковое смещение стропилин предотвратят стальные крепежные уголки.

Зарубки для крепления стропильной системы банной кровли

Чтобы смонтировать каркасную основу крыши, с использованием висячей конструкции стропилин, нужно сделать несколько стропиловочных ферм, и установить их на стенки. Размер этих элементов зависит от значения уклона скатных плоскостей и протяженности пролета. Стропилины попарно прикрепляются одна к другой с закреплением в коньковой части. Чаще всего такое соединение делается встык (с использованием стальных или деревянных накладок), с применением врубки или болтового соединения внахлест. Изготовить висячие стропиловочные фермы жестко и уменьшить при этом нагрузку на стенки помогают затяжки и ригеля – перемычки, расположенные горизонтально.

Как крепить стропила на баню, каркас которой является срубом? Стропилины необходимо размещать на скользящих опорах и применять шарнирное соединение в коньковой части. В ходе своей усадки коробка бани изменяет свои геометрические формы, заложенные при строительстве. Данный процесс может деформировать кровлю. Этого можно избежать, установив специальные стальные крепежные детали — стропилины получат небольшую свободу для допустимого смещения, позволяющего исключить изменение геометрической формы и других параметров крыши. Верхняя сторона стропилин скрепляется с помощью болтов или особой стальной шарнирной пластины.

Важно: для строений бани со стандартными параметрами и конструкцией, можно использовать информацию из унифицированных справочных таблиц или имеющийся онлайн-калькулятор.

Видео «Как крепить стропила на баню»

Как крепить стропила к срубу — установка и крепление (фото, видео)

Деревянный сруб из бревна или бруса – традиционная для территории России постройка, которая может использоваться в качестве жилого дома или бани. Процесс сборки такого жилища происходит согласно выверенным веками технологиям, поэтому оно получается теплым, уютным и комфортным для жизни. Особого внимания заслуживает такая технологическая операция как налаживание стропильного каркаса, от прочности которого зависят защитные качества кровли. В этой статье мы расскажем, как правильно крепить стропила к срубу, чтобы они выдержали вес даже самого тяжелого кровельного материала, но не деформировались при усадке древесины.

Содержание статьи

Функции и виды

Стропильной системой называют каркас крыши, совокупность опорных элементов, которые во взаимосвязи придают ей форму, уклон и значительную несущую способность. «Костяк» кровли изготавливают из сухой, прочной древесины, обработанной антисептическими препаратами, или металлического профиля. Он служит основой для крепления кровельного покрытия, а также равномерно распределяет нагрузку между несущими стенами. Чтобы перекрыть сруб, используют стропила следующих видов:

Висячие. Висячие стропила имеют всего одну точку опоры – на мауэрлат, свободным концом ноги они упираются друг друга, образуя трехшарнирную треугольную арку. Такая конструкция применяется, если сруб внутри не предусматривает несущих стен, на которые можно установить стойки. Висячая стропильная система испытывает нагрузку на распирание, поэтому она включает в себя разного рода затяжки, компенсирующие это напряжение. Стропила такого типа отличаются массивностью и сложностью монтажа.
Наслонные. Наслонные стропила обладают двумя точками опоры – мауэрлат и коньковый прогон, который поддерживают вертикальные стойки. Такая конструкция может использоваться, только если внутри сруб имеет как минимум 1 несущую стену или ряд колонн, на которые можно разгрузить конек. Наслонная стропильная система испытывает нагрузку только на прогиб, потому монтировать ее проще.

Обратите внимание! Сруб изготавливается из натурального строительного материала – древесины, обладающей уникальными свойствами. После сборки конструкции начинает выравниваться влажность дерева, поэтому она дает усадку в течении первых 3-5 лет эксплуатации. Самые значительные изменения размеров происходят в первый год службы, поэтому крепление стропил рекомендуется выполнять только по прошествии этого времени.

Виды стропильных систем

Устройство двухскатной крыши сруба

Способы крепления

Крепление стропил к деревянному срубу – технологически сложный процесс, от правильности выполнения которого зависит прочность, целостность и долговечности кровли. В работе нужно учитывать, что дерево в процессе высыхания оседает, поэтому геометрия строения изменяется. Кроме того, этот материал подвергается термическому расширению, поэтому слишком жесткое крепление стропил на сруб вызывает деформации. Существует два типа креплений стропильных ног:

Подвижные. Подвижными креплениями стропил называют специальные «ползуны», изготовленные из металла. Благодаря им, стропильные ноги не испытывают нагрузку на прогиб, а также реагируют на малейшие температурные колебания, подстраиваясь геометрию сруба. Ползуны позволяют крепить стропильную систему до окончания усадки дома без риска деформации.
Шарнирное крепление
«Ползуны»
Конструкция подвижного крепления
Стационарные. Неподвижные крепления не обеспечивают небольшой запас подвижности при фиксации стропильных ног, однако, они гарантируют жесткость и прочность конструкции. В качестве крепежных элементов применяют гвозди, саморезы, деревянные нагеля, металлически скобы и накладки.
Стационарное крепление

Важно! Деревянный сруб обладает уникальной способностью «дышать», он сам регулирует влажность в помещении, поэтому не имеет жестко фиксированных размеров. Подвижные крепления, откликающиеся на усадку стен и термическое расширение материала – оптимальный вариант фиксации стропил к срубу.

Способы сборки

После полной усадки деревянного сруба мастера приступают к налаживанию стропильного каркаса и возведению кровли. Этот процесс кропотливый и сложный, особенно если выполнять ту задачу в одиночку. Существует 2 способа установить каркас на мауэрлат:

Установка готовых стропильных ферм. Эта технология заключается в сборке стропильных ферм «на земле» и дальнейшем подъеме их на место установки в готовом виде. Поднять массивные и тяжелые конструкции требуется специальная техника (автовышка, кран или трактор). Таким способом устанавливают наслонные стропила, которые весят меньше.
Сборка ферм «на высоте». Если конструкция стропильной системы отличается большим весом и размером, а в распоряжении строителей нет специальной техники, то фермы собирают прямо на месте. Недостатком этой технологии считают сложность и неудобство производства работ.

Учтите, что опытные мастера редко пользуются технологией установкой готовых стропильных ферм, так как она не позволяет выполнять точную подгонку элементов, хотя значительно экономит время.

Способы крепления стропильных ног

Последовательность работ

Главные факторы качества стропильного каркаса – точность расчетов высоты конька и длины стропил и детальное следование технологии производства работ по возведению кровли. Чтобы крыша хорошо защищала сруб от проникновения атмосферных осадков, необходимо выполнять крепление стропильных ног следующим образом:

Сначала нужно взять ровные доски из древесины хвойных пород без трещин или сучков. Для увеличения срока службы стропильных ног они обрабатываются антисептическим средством и антипиреном. Чтобы снизить расход пропитки, лучше острогать древесину.
Затем изготавливают шаблон стропильной ноги, который служит образцом для производства остальных стропил.
Сначала устанавливают первую и последнюю стропильную пару, а затем натягивают между ними шнурку, чтобы выровнять остальные стропила.
Крепят остальные стропильные пары, подрезают концы ног, чтобы они были ровными, а затем устанавливают обрешетку.

Опытные мастера рекомендуют контролировать правильность крепления стропильных ног с помощью строительного уровня, чтобы крыша была ровной, без перекосов.

Технология установки стропильных ног на сруб

Видео-инструкция

Сечение стропил, обрешетки — оптимальные размеры для кровли

Вы можете выполнить расчет сечения стропил с помощью онлайн-калькуляторов на нашем сайте – перейдите на страницу соответствующего инструмента и заполните поля.

В качестве исходных величин необходимо ввести данные некоторых параметров стропильной системы:

шаг стропил (расстояние между ними) – шагом регулируют нагрузку на систему стропил;
размеры стропил (сечение стропил) – толщина × ширина доски/бруса.

Стоит отметить, что доска – более доступный вариант для устройства системы кровли, так как она выдерживает значительные нагрузки, и что немаловажно – стоит в разы бюджетнее.

В таблицах ниже, мы собрали оптимальные размеры сечения стропильных ног и обрешетки, в зависимости от типа кровельного покрытия, угла наклона крыши и расстояния между ними элементами. Все параметры приведены согласно СНИП.

Таблица сечения стропил

Тип кровли	Оптимальный уклон кровли, градусов	Шаг стропил, см	Сечение стропил, см
Профнастил	20-30	< 100	5×15
Ондулин	15	60-90	5×20
Цементно-песчаная черепица	22-30	75-110	5×15
Керамическая черепица	22-30	60-80	5×15, 6×18
Мягкая кровля (рулонная, битумная черепица)	> 7	60-150	5×15
Металлочерепица	> 15	60-95	5×15, 5×20
Шифер	14-60	80-130	5×15
Асбестоцементные листы обыкновенного профиля
Асбестоцементные листы унифицированного профиля

Следующая таблица содержит данные по обрешетке, контробрешетке и материалу кровли:

Тип кровли	Параметры кровельного материала, мм	Уклон кровли, градусов	Шаг обрешетки, см	Сечение обрешетки, см	Контробрешетка, см	Нахлест кровли, см
Профнастил:		20-30	соответственно углу уклона	доска 3×10	2,5-4	10-20
НС-20	толщина 0,55	30-45	40, 60
НС-20	толщина 0,75	30-45	50, 70
НС-35	толщина 0,55	30-45	100, 100
НС-35	толщина 0,75	30-45	120, 130
С-44	толщина 0,55	30-45	90, 150
С-44	толщина 0,75	30-45	110, 140
Цементно-песчаная черепица и керамическая черепица	зависит от производителя и типа	22-30	31,2-33,5	3×5, 4×5, 4×6, 5×5	> 3×5	8,5-10,8
Цементно-песчаная черепица и керамическая черепица	зависит от производителя и типа	30-90	32,1-34,5	5×15, 6×18	> 3×5	7,5-10,8
Мягкая кровля (рулонная, битумная черепица)	зависит от производителя	> 7	1. рулонная — на сплошной обрешетке 3-5 мм зазор; 2. мягкая черепица — 30 см шаг досок обрешетки под ОСБ	1.сплошная 2.обрешетка из доски 2.5×10-15 + ОСБ 9 мм	> 3×5	для рулонная 15-30 для мягкая > 15
Металлочерепица	4500×1160-1190×0,5	> 20	80-100 (от волны)	доска 5×20; брус 4×6	> 3×5	в зависимости от марки 6-9
Шифер	3600х1500х8-10 3000х1500х8-10 2500х1200х6-8-10	25-45	лист должен опираться на 2 бруса обрешетки		> 3×5	12-30
Асбестоцементные листы обыкновенного профиля			50-54	доска 5-6×10 брус > 5×5		должна перекрывать волну
Асбестоцементные листы унифицированного профиля			60-75	доска 5-6×10 брус > 7,5×7,5		должна перекрывать волну
Ондулин	2000x950x3	5-10	5	сплошная (зазор до 5 см)	> 3×5	3; боковой — 2 волны
		10-15	45	доска 5×20; брус 4×5, 5×5		2; боковой — 1 волна
		> 15	60	доска 5×20; брус 4×5, 5×5		1,7; боковой — 1 волна

Чтобы самостоятельно определить размерность всей системы стропил необходимо произвести расчеты основного влияния ветра, снеговых масс, а также веса кровельных материалов и конструктивных несущих элементов крыши в совокупности.

Опять же напоминаем, что расчет приведен для ознакомления в значительно упрощенном формате, так как для точного расчета необходимо учитывать вертикальные и горизонтальные нагрузки на стропильные ноги, рассчитывать дополнительно сопротивление стропил изгибу, сжатию и растяжению, проверить конструкции на способность противостоять скалыванию и смятию.

Если у вас не сложная архитектурная конструкция, вы вполне сможете построить крышу самостоятельно, опираясь на оптимальные размеры бруса или доски, на стандартизированные параметры конструкции крыши.

На рисунке и в таблице ниже указаны стандартные сечения элементов стропильной конструкции:

Сечения деревянных балок перекрытия в зависимости от пролёта и шага установки балок, на примере случая с полной нагрузкой 400кг/м²:

Пролёт (м)	2,0	2,5	3,0	4,0	4,5	5,0	5,5	6,0	6,5	7,0
Шаг установки (м)	2,0	2,5	3,0	4,0	4,5	5,0	5,5	6,0	6,5	7,0
0,6	75х100	75х150	75х200	100х200	100х200	125х200	150х200	150х225	150х250	150х300
1,0	75х150	100х150	100х175	125х200	150х200	150х225	150х250	175х250	200х250	200х275

Еще раз напомним, что вы можете выполнить расчет стропил самостоятельно – также там вы сможете рассчитать количество пиломатериалов, кровельного покрытия, обрешетки и остальные элементы.

Проверить подключение и работу электрощитка в г. Москва недорого

Замыкает дифавтомат в щитке, не нажимается кнопка тест

Когда: , 20:30

Адрес: Нововладыкинский проезд, 1к3, Москва

Хотите найти лучшего мастера по ремонту?

Последние добавленные задания

Цена договорная
Помощь летом на стройке дома

Строим дачу ,нужна помощь в строительстве .

Ольга Г. улица Роз, Воскресенск
Цена договорная
Ищу рабочих. Ремонт ванной комнаты

В деревянном доме нужно обшить стены гипсокартоном, сделать поддон для душевой кабины и уложить плитку

Марина Е. СНТ Рябинка-1, рабочий посёлок Свердловский
Цена договорная
Положить ламинат на одну стену

Есть ламинат, есть клей момент для нагрузки 100 кг, стена выравнена

Алена Р. Европейский проспект, Кудрово
Цена договорная
Декоративная шпатлёвка

Нанесение декоративной шпатлёвки в два слоя(МАСКАРАДЕ)-300м2 цена 200₽м2 Стены подготовленные и покрашенные

Сергей С. улица Маршала Тухачевского, 49, Москва
1 500 руб
Подсобный рабочий

Нужен один человек. Требуется сделать штробы для прокладки кабеля и монтажа подрозетников. Весь необходимый инструмент есть на объекте. Оплата по факту выполнения

Владимир П. Донецкая улица, 4, Москва

Игровой комплекс «Спортивный Городок 3» Санкт Петербург

ООО «Красивый город»

ПАСПОРТ

Игровой комплекс «Спортивный Городок 3»

Санкт – Петербург

Содержание

Основные сведения об изделии
Основные технические данные
Комплектная ведомость
Свидетельство о приёмке
Свидетельство о консервации
Свидетельство об упаковке
Гарантийные обязательства
Рекламации
Сведения о хранении
Сведения о консервации и расконсервации при эксплуатации
Учёт неисправностей при эксплуатации
Учёт технического обслуживания
Сведения о ремонте
Рекомендации по монтажу
Правила безопасной эксплуатации
Инструкция по осмотрам, обслуживанию и ремонтам оборудования
Особые отметки
Чертежи и схемы

1. Основные сведения об изделии

Наименование: Игровой комплекс «Спортивный Городок 3»;
Предприятие ООО «Красивый город»;
Артикул :3203
Дата выпуска: 30.11.2015г.
Создает условия:

— обеспечивающие физическое развитие ребенка,

— развивающие координацию движений, преодоление страха высоты, ловкость и смелость.

2. Основные технические данные

Размеры комплекса 3600*2700 мм;
Максимальная высота от уровня поверхности площадки до верхней точки: 2500 мм;

2.3 Климатическое исполнение: зона умеренного климата;

3. Комплектная ведомость

№ п/п	Артикул	Наименование элемента	Кол-во. (шт.)
1	5.0.002	Горка на кубах 900	1
2	5.0.002	Горка на кубах 900	1
3	1.013	Закладная простая 500	15
4	5.1.003	Лестница на пальцах кубич. (левая)	1
5	5.1.004	Лестница на пальцах кубич. (правая)	1
6	2.3.176	Столб М 1530 тип-1	2
7	2.3.177	Столб М 1530 тип-2	1
8	2. 3.180	Столб М 1730 тип-3	1
9	2.3.178	Столб М 2130 тип-1	3
10	2.3.179	Столб М 2130 тип-2	1
11	5.1.032	Шест Змейка на пальцах без шайбы 1800	1
12	5.1.159	Штанга простая 520	1
13	5.1.465	Штанга простая с крючком 520	1
14	5.2.049	Боковина рукохода деревянного	2
15	4.2.076	Заглушка фанерная	4
16	4. 2.029	Заполнение простое тип-1 (400х600 мм)	4
17	4.2.026	Подлокотник тип-1 (600 мм)	2
18	4.2.030	Подлокотник угловой (738х738мм)	1
19	6.2.038	Подстропильник крыши Спорт городок 1100х1100	2
20	3.2.010	Пол на кубах 1100х1100 тип-1	1
21	4.2.577	Проставка 138х138 лам	8
22	4.2.075	Проставка 138х138 мм	7
23	4.2.408	Проставка тип-2 200х140 мм	2
24	6. 2.036	Скат крыши Спорт городок 1100х1100	2
25	6.2.037	Стропила крыши Спорт городок 1100х1100	2
26	5.2.041	Ступень лестницы верхняя 570	1
27	5.2.045	Ступень лестницы нижняя 590	3
28	4.3.004	Доска 630	9
29	198	Болт DIN 933 М10х100	8
30	4	Болт DIN 603 М6х30	30
31	3	Болт DIN 603 М6х25	10
32	294	Саморез сантех. 76х6 с буром	4
33	213	Гайка DIN 1587 М06 колпачковая	20
34	170	Шайба DIN 9021 D06	72
35	17	Болт DIN 912 М10х35	10
36	253	Уголок 60х60 с покрытием	10
37	6	Болт DIN 603 М6х40	2
38	186	Шуруп DIN 571 М6х80 сантех.	24
39	24	Гайка DIN 934 М06	44
40	168	Шайба DIN 125 М10	9
41	74	Кубик пласт. зеленый	50
42	48	Колпачок пласт. для болта М10 дек. составной, белый	12
43	75	Кубик пласт. красный	50
44	73	Кубик пласт. желтый	50
45	53	Колпачок пласт. для болта М6 дек. составной, белый	26
46	46	Канат д/лазания L-2,5 м, ф 30 мм	1

4. Свидетельство о приемке

Игровой комплекс «Спортивный Городок 3», Артикул 3203, соответствует ГОСТ Р 52168-2012, ГОСТ Р 52169-2012 и признан годным к эксплуатации.

М.П. Дата выпуска:30.11.2015
____________ ___________________

Личная подпись Инициалы, фамилия

5. Свидетельство о консервации
Игровой комплекс «Спортивный Городок 3» артикул КГ-3203

(наименование изделия)
Артикул 3203 подвергнуто консервации на ___________
_________Консервации не подвергалось_______________________

(наименование предприятия, проводившего консервацию согласно требованиям нормативных документов)

Дата консервации ____________________
Срок консервации ____________________ М. П.
Консервацию произвел ___________……………………….(Ф И О.)

подпись

6. Свидетельство об упаковке

Игровой комплекс «Спортивный Городок 3» артикул КГ-3203

(наименование изделия)
_________________ООО «Красивый город»______________________ (наименование предприятия, проводившего упаковку)

согласно требованиям нормативных документов

Дата упаковки: 30.11.2015

МП.

Упаковку произвел _____________ (Ф. И. О.)

(подпись)
7. Гарантийные обязательства

7.1 Изделия не подлежат обязательной сертификации;

7.2 Гарантия на изделие действует в течение 24 месяцев, со дня поставки при обязательном условии соблюдения правил монтажа и эксплуатации.

7.3 Если в течение гарантийного срока будут выявлены дефекты изделия, завод-изготовитель обязуется устранить обнаруженные дефекты в течение сорока дней с момента получения гарантийной рекламации.

7.4 Гарантии завода-изготовителя не распространяются на дефекты, возникшие вследствие:

-неправильного хранения и обслуживания;

-использования изделия не по назначению;

-недостаточного или (и) неправильного монтажа;

-несоблюдения технических инструкций завода-изготовителя, касающихся монтажа, сборки, пуска и эксплуатации.

8. Рекламации

В случае обнаружения дефектов или поломок игрового комплекса в период гарантийного срока по вине изготовителя (поставщика) составляется Акт-рекламация

Акт-рекламация должен содержать:

-наименование детского игрового оборудования, Артикул и дату выпуска:

— дату получения, монтажа и ввода в эксплуатацию;

общее число часов работы;

сведения об имевшихся неисправностях.

Детали, вышедшие из строя и послужившие причиной поломки детского игрового оборудования, должны быть сохранены до приезда представителя изготовителя.
9 Сведения о хранении

Дата		Условия хранения изделия	Должность ФИО и подпись ответственного лица
Установка на хранение	Снятие с хранения

10 Сведения о консервации и расконсервации при эксплуатации

Дата консервации

Дата расконсервации

Наименование

организации,

проводившей

консервацию (расконсервацию)

Должность ФИО и подпись

Ответственного

лица

11. Учет неисправностей при эксплуатации.

Дата проверки или отказа изделия, его составной части или элемента конструкции	Характер (внешнее проявление) неисправности и замечания по техническому состоянию	Принятые меры по устранению неисправности (расход ЗИП, направление Акта-рекламации)	Должность, ФИО и подпись ответственного лица	Примечание

12 Учет технического обслуживания

Дата	Замечания по техническому состоянию	Наименование проведенных работ	Должность, ФИО и подпись ответственного лица

13. Сведения о ремонте

Наименование составной части изделия или элемента конструкции	Основание для проведения ремонта	Дата		Количество времени наработки до ремонта	Наименование организации, проводившей ремонт	Должность, инициалы, фамилия и подпись ответственного лица
		Поставлено в ремонт	Выход из ремонта

14. Рекомендации по монтажу детского игрового оборудования:
14.1.Монтаж игрового оборудования должен проводиться силами специализированных организаций, располагающих необходимой материально-технической базой и квалификацией.

ВНИМАНИЕ! Завод-изготовитель не берет на себя ответственности за возникшие в ходе транспортировки или монтажа механических повреждений, а также за ущерб, обусловленный игнорированием правил установки оборудования.

14.2. Установка оборудования проводится на ровной площадке свободной от насаждений, с предварительно подготовленным ударопоглощающим покрытием, размеры которой обеспечивают зону безопасности в соответствии с ГОСТ Р 52168-2012, 52169-2012.

14.3. Перед началом монтажа необходимо:

— Получить у производителя техническую документацию

— изучить документацию;

— законсервированные поверхности — расконсервировать;

-определить качество грунта перед установкой и выбрать способ монтажа основания под оборудование

-при проведении монтажных работ соблюдать требования безопасности;

15. Правила безопасной эксплуатации игрового оборудования

Оборудование представляет собой модульную конструкцию.
Оборудование на детских игровых площадках без постоянного наблюдения оперативным персоналом. Поэтому, для безопасной эксплуатации, владелец должен производить регулярный визуальный осмотр ежедневно.
Если во время осмотра обнаружатся какие-то неполадки, то они должны быть немедленно устранены, а если это невозможно, то оборудование должно быть закрыто для детей.
Поверхность игровой площадки не должна содержать посторонних предметов, острых элементов, выступов и травмирующих включений.
Материалы поверхности игровой площадки с низкими ударопоглощающими свойствами используют только вне области приземления.
Срок службы изделия при надлежащей эксплуатации и обслуживании до 5 лет.

16. Инструкция по осмотрам, обслуживанию и ремонтам оборудования

Регулярный визуальный осмотр детского игрового оборудования необходимо проводить ежедневно. При ежедневном осмотре проверяют прочность деревянных конструкций, а также узлы крепления.
Функциональный осмотр детского игрового комплекса необходимо проводить один раз в три месяца. При функциональном осмотре проверяют устойчивость конструкции, степень износа узла шарнира, прочность узлов крепления, износ фанерного пола.
Ежегодный основной осмотр проводят с периодичностью 12 месяцев.

17. Особые отметки

________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

18. Чертежи и схемы

Рис. 1: Внешний вид игрового комплекса «Спортивный Городок 3»

3203 ИК «СГ-3» — схема сборки

1. Разметка закладных

В соответствии со схемой (см. рис.). Размеры указаны по центрам столбов.

2. Установка закладных

Закладные бетонируются в соответствии со схемой.

3. Сборка

3.1. На столбы 1-8 надеть по одной проставке (138х138) (рис.1).

Рис. 1

3.2. На столбы 1 – 8 надеть по 7 кубиков + по 1 проставке (на столбы 3 и 7 по удлиненной проставке) (рис.2).

Рис.2
3.3. На столбы 1 – 8 надеть по одному кубику. Установить пол из ламината (шершавой стороной вверх) (рис. 3).

Рис. 3

3.4 На столбы 1-8 надеть по 6 кубиков. Между столбами 2 – 7, 1 – 8, 5 – 4, 4 – 6 установить фанерные заполнения. Сверху установить подлокотники (на столбы 4-5-6 установить угловой подлокотник). На столб 5 надеть одну проставку (рис. 4).

Рис. 4
3.5. На столбы 5, 6 надеть по 7 кубиков. Между столбами 3 – 7 и 2 – 8 установить стяжку под канат и стяжку для горки соответственно, просверлив грань кубика сверлом d32 мм. На столб 4 надеть 1 кубик, на столб 1 надеть 3 кубика и зафиксировать их фанерной заглушкой + болт din 912×45 мм + шайба + пластиковый колпачок. Кубики столбов 2,3 зафиксировать сверху фанерной заглушкой + болт din 912×45 мм + шайба + пластиковый колпачок. На столбы 7,8 надеть еще по 6 кубиков (рис. 5 -8).

Рис. 5

Рис. 6

Рис. 7

Рис. 8

3.6. В горизонтальные пазы стропила установить основания крыши. В наклонные пазы стропила установить скаты крыши и закрепить саморезами. Скаты крыши и стропила зафиксировать между собой с помощью мебельных уголков и болтов М6х25+шайба+гайка+пластиковый колпачок. Закрепить крышу к столбам с помощью болтов din 912×45 + шайба + пластиковый колпачок (рис. 9-11).

Рис. 9

Рис. 10

Рис. 11

3.7 После установки боковин рукохода между проставкой и полом комплекса, закрепить сантехническими саморезами 80мм + шайба + колпачок первую и последнюю ступень рукохода.

Закрепить саморезами 80мм оставшиеся ступени рукохода.

Рукоход крепится к ламинированному полу с помощью мебельных уголков и болтом М6х30+шайба+гайка+пластиковый колпачок.

К фанерному основанию рукохода прикрутить мебельный уголок с внутренней стороны. Канат крепится к стяжке хомутом (рис. 12-13).

Рис. 12

Рис. 13

3.8. Ступени (шершавой стороной вверх) лестницы крепятся к уголкам с помощью болтом М6х25+гайка+колпачковая гайка.

Лестница крепится к столбам болтами DIN 912/45 (рис. 13).

Рис. 13.
3.9 Между столбами 1-5 установить шест «Змейка» и зафиксировать в отверстиях столбов болтами дин 912/45.

3.10. К полу между столбами 2 и 8 установить горку и зафиксировать болтами М6х30+шайба+гайка к ламированному полу.

3.11. К основанию фанерного рукохода прикрутить мебельные уголки и под них вбить закладные. Приварить основания к закладным.

Проектирование рубленого деревянного дома. Часть 2. От фундамента до интерьера

Проект фундамента

Деревянный дом более «снисходителен» к своему фундаменту, чем каменный, в силу нескольких факторов:

Первый — масса здания. Очевидно, что деревянный дом весит на порядок меньше каменного (кирпичного).
Второй — структура стен. При возможных перегибах фундамента стены каменных домов с их мелкоячеистой структурой неизбежно дадут трещины. Стены деревянных домов избавлены от этих недостатков. Любые подвижки фундамента они легко компенсируют за счет своей горизонтальной структуры и свойств самого дерева.

Естественно, это не означает, что фундамент может быть абы каким. Просто в общей смете он будет занимать меньший процент, чем при сооружении кирпичного дома.

Фундамент рассчитывают под конкретный дом с учетом свойств грунта и гидрогеологии на месте застройки. Один из путей решения проблемы выпучивания — применение мелкозаглубленных ленточных или столбчатых, с балками, фундаментов. Они образуют достаточно жесткую горизонтальную раму, которая перераспределяет неравномерные деформации основания. Подробно об их конструкции и технологии сооружения можно прочесть в статье Какой фундамент выбрать?

Проектируем бревенчатые стены

Помимо архитектурно-планировочных и конструктивных решений, на долговечность стен влияет климат — атмосферные осадки, ветровые нагрузки, солнечная радиация.

А также разность температур внутри и снаружи дома, влажность воздуха внутри отапливаемого помещения и т.п. Если конструкция дома недостаточно продумана, сильный косой дождь или подтаивающий снег могут увлажнить стены. Создаются благоприятные условия для их загнивания, для появления различных насекомых и развития плесневых, деревоокрашивающих или дереворазрушающих грибков и бактерий.

Кроме того, при увлажнении древесины:

увеличивается ее способность к деформации,
снижается ее прочность.

Впрочем, даже простое изменение относительной влажности воздуха приводит к набуханию, усыханию, растрескиванию, загниванию древесины и другим нежелательным явлениям. Поэтому очень важно строить дом так, чтобы вода не могла проникнуть в древесину. Причем особое внимание уделяют углам и поперечным швам. Они должны быть хорошо защищены от попадания влаги.

Один из вариантов такой защиты — сооружение удлиненного (от 1,2 м) свеса кровли. Конструктивно это можно выполнить с помощью подстропильника — балки, на которую опираются стропила. Она вынесена за габариты дома, и стропила держит не мауэрлат, а подстропильник. Это позволяет сделать свес гораздо большего размера.

Безусловно, такой свес защитит стены от дождей, включая «косые». Однако мы тут же сталкиваемся с другими проблемами — дополнительной нагрузкой на конструкцию крыши и снижением освещенности в комнатах (по-крайней мере, верхнего этажа). И это лишь один пример возникающих перед конструктором задач. Ему нужно гармонично объединить в одном объекте противоречивые, иногда взаимоисключающие аспекты. И ведь надо совместить их не в ущерб облику здания! Поистине, это работа для опытных профессионалов.

Какие еще «неприятности» могут угрожать деревянному дому? — Поражение вредоносными грибками и насекомыми, а также пожары. Поэтому необходимо использовать химический метод защиты древесины, т.е. качественно обработать ее специальными водорастворимыми составами — огнезащитными, антисептическими и лакокрасочными. При правильном применении такой способ эффективен, недорог и безопасен. Проще всего это сделать еще на этапе строительства, пока есть доступ ко всем местам, которые впоследствии будут закрыты коробами, панелями, обшивками, но останутся доступными для насекомых. Причем состав нужно наносить равномерно, с соблюдением правил и пропорций, указанных в инструкции.

Планировка: от мелочей до генплана

Генеральный план — это профессиональная работа, где неискушенному человеку подчас непонятно обилие линий и цифр. На нем присутствуют:

детально прорисованный дом с перспективой общего вида, фрагментами продольных и поперечных разрезов, положений бревен, конструктивных узлов и решений фундаментов, стен, полов и перекрытий, стропил и крыши;
планы этажей;
участок с проектом благоустройства (дорожки, приусадебное хозяйство, лужайки, подъезды и пр.) и расположением всех построек.

Шум влияет на проект

При проектировании рубленого дома не бывает мелочей.

Это касается и конструкций, которые видны невооруженным глазом, и тех его особенностей, которые выявляются только при реальной эксплуатации. Возьмем для примера проблему звукоизоляции помещений. Она неизбежно возникает в доме, где живет больше одного человека. Проблема надежной межэтажной звукоизоляции дорого стоит в бревенчатом доме. Чтобы исключить проникновение шума с одного этажа на другой, требуется выполнить двухслойное (двухуровневое) перекрытие между этажами:

Нижний слой — это бревенчатый потолок первого этажа.
Верхний — пол второго этажа.

То есть практически приходится дополнительно увеличивать число венцов на 1–2 единицы, и дом растет в высоту. Соответственно, это ведет к увеличению длины марша лестницы, числа ступеней и пр.

Проблему звукоизоляции требуется решать проектно-планировочными методами, сразу исключая соседство (пусть даже межэтажное) «громких» помещений и тихих спален.

Конкретные рекомендации

План этажа — это только маленькая часть полного генерального плана, указывающая лишь на общие габариты дома и расположение комнат.

Часто такие планы не включают в себя множества деталей и выполняются не в масштабе. Вы видели их в журналах и рекламных проспектах домов.

Но для выполнения срубов особенно важны качественные чертежи. Потому как часто вначале сруб собирается не на участке, и мастера не видят территории, где будет впоследствии стоять деревянный дом.

Вот несколько общих рекомендаций для предварительного планирования, которые помогут избежать часто встречающихся ошибок:

Планируйте открытые, плавно перетекающие из одного в другое пространства, чтобы зрительно расширить помещение.
Используйте преимущества окон: выбирайте окна гармоничного размера (применяйте золотое сечение). Это оптимизирует интенсивность естественного освещения и увеличит размер комнаты. Правильно расположенные окна позволят свету проникать в положенные для конкретного помещения часы. Окна в небольшом деревянном доме лучше группировать в один большой оконный проем. В странах с умеренным климатом их чаще ориентируют на юг и юго-восток. На севере – и на юг и юго-запад. Применение низкоэмиссионных стекол заметно повысит теплоизоляционные характеристики окон.
Относитесь творчески к высоте помещения. Высокие потолки, независимо от того, плоские они или сводчатые, могут зрительно увеличить даже стандартное помещение. Однако тут таится серьезнейшая проблема. А хватит ли энергии, чтобы отопить такие пространства? И нужно ли идти на такие «жертвы»? Тут современные проблемы энергосбережения входят в прямое противоречие с желанием иметь «готические» потолки.
Чаще применяйте встроенные приспособления — такие, например, как полки, «утопленные» в повал бревен. Причем они не будут выходить за вертикальные габариты стены. Чем не конструктивное решение проблемы хранения всякой «мелочевки»? Другие способы эффективного использования пространства — встроенные скамейки для сна за занавесками (шведская кровать), альков, шкаф, размещенный под скосом скатной крыши, стол, занимающий весь небольшой угол и т. д.
Не забывайте о дополнительных пространствах нежилых помещений. Так, если превратить цокольное помещение в часть жилого пространства, увеличится общая площадь дома. Это легко сделать, если обеспечить там естественное освещение. Там же можно сделать и выходы на улицу.
Приобретайте крупную мебель вместо множества мелких предметов. Она добавит элегантности и уравновесит масштаб бревенчатых стен дома.
Создайте пространство для бесед в гостиной. Группировка мест для сидения здесь будет поощрять беседу и сделает дом гостеприимным.
Никогда не пренебрегайте устройством входной террасы. Редакция портала полна письмами-вопросами о том, как сделать непредусмотренную ранее террасу. Ее можно использовать почти три сезона в году. Потратьте столько же времени на планировку входной зоны, как и на планировку интерьера, чтобы пространство дома стало более «дружелюбным».
Специалисты рекомендуют делать выход в сад или на террасу прямо из жилой комнаты, тогда сад или терраса будут как бы продолжением жилого пространства. Комнату общего пользования можно увеличить с помощью двери-перегородки.

Подведем итог. Понятно, что такой интеллектуальный продукт не может быть дешевым уже на уровне конструкторской разработки, учитывающей сотни традиционных ремесленных истин и современные инженерные знания. Но только хорошо и всесторонне продуманный индивидуальный проект может обеспечить долговечность дома и комфортное проживание в нем.

Касаясь материальной стороны дела, можно с уверенностью сказать, что дом, добротно построенный для себя (а не на продажу), с годами только увеличивает капитализацию. Его рыночная цена неизбежно превысит сумму вложенных в него средств. И опыт строительства в России высококачественных бревенчатых домов в конце прошлого и начале этого века это доказывает.

Что такое подкрепление в оперантном кондиционировании?

Один из множества различных способов, которыми люди могут учиться, — это процесс, известный как оперантное обусловливание (также известный как инструментальное обусловливание). Он включает обучение через подкрепление или наказание. Тип используемого подкрепления может сыграть важную роль в том, как быстро будет усвоено поведение, и в общей силе результирующей реакции.

Общие сведения об армировании

Подкрепление — это термин, используемый в оперантном обусловливании для обозначения всего, что увеличивает вероятность возникновения реакции.Психолог Б.Ф. Скиннер считается отцом этой теории. Обратите внимание, что подкрепление определяется влиянием, которое оно оказывает на поведение — оно увеличивает или усиливает реакцию.

Например, поощрение может включать в себя похвалу (поощрение) сразу после того, как ребенок убирает свои игрушки (ответ). Подкрепляя желаемое поведение похвалой, ребенок с большей вероятностью будет выполнять те же действия снова в будущем.

Подкрепление может включать в себя все, что усиливает или усиливает поведение, включая конкретные материальные награды, события и ситуации.В классе, например, типы поощрения могут включать похвалу, отказ от нежелательной работы, символические награды, конфеты, дополнительное время для игр и веселые занятия.

Первичное и вторичное армирование

Вот некоторые сведения о двух основных типах армирования.

Первичное армирование

Первичное армирование иногда называют безусловным армированием. Это происходит естественно и не требует обучения, чтобы работать.Первичные подкрепления часто имеют эволюционную основу, поскольку они помогают выживанию вида.

Примеры первичных усилителей включают:

Генетика и опыт также могут сыграть роль в том, как работает такое усиление. Например, в то время как один человек может найти определенный вид еды очень полезным, другому может совсем не понравиться эта еда.

Вторичное армирование

Вторичное подкрепление, также известное как условное подкрепление, включает стимулы, которые стали полезными, будучи соединенными с другим подкрепляющим стимулом.Например, при дрессировке собаки похвала и угощения могут использоваться в качестве основных подкреплений. Звук кликера может ассоциироваться с похвалой и угощением, пока звук самого кликера не начнет работать как вторичное подкрепление.

Виды армирования

В оперантном обусловливании есть два разных типа подкрепления. Обе эти формы подкрепления влияют на поведение, но делают это по-разному. Эти два типа включают:

Положительное подкрепление : Это включает в себя добавление чего-либо для усиления реакции, например, дайте ребенку немного конфет после того, как он уберет свою комнату.
Отрицательное подкрепление : Здесь описывается удаление чего-либо для увеличения реакции, например, отмена викторины, если учащиеся сдают все свои домашние задания за неделю. Убирая неприятный стимул (викторину), учитель надеется усилить желаемое поведение (выполнив все домашние задания).

Хотя эти термины включают слова «положительный» и «отрицательный», важно отметить, что Скиннер не использовал их для обозначения «хорошо» или «плохо». Вместо этого подумайте, что означают эти термины при математическом использовании.

Позитив — это знак плюса, означающий, что что-то добавляется к ситуации или применяется к ней. Отрицательный — эквивалент знака минус, означающего, что что-то удаляется или вычитается из ситуации.

Примеры из реальной жизни

Вот несколько реальных примеров того, как можно использовать подкрепление для изменения поведения.

Положительное армирование

Во время тренировки вашей офисной команды по софтболу тренер кричит: «Отличная работа!» после того, как вы бросите подачу.Из-за этого у вас больше шансов снова подать мяч таким же образом. Это пример положительного подкрепления.

Другой пример: на работе вы превышаете квоту продаж вашего менеджера за месяц и получаете бонус как часть своей зарплаты. Это повышает вероятность того, что вы снова попытаетесь превысить минимальную квоту продаж в следующем месяце.

Отрицательное армирование

Вы идете к врачу, чтобы сделать ежегодную прививку от гриппа, чтобы не заболеть гриппом.В этом случае вы ведете себя так (делаете прививку), чтобы избежать неприятного стимула (заболеть). Это пример отрицательного подкрепления.

Другой пример: нанесите гель алоэ вера на солнечный ожог, чтобы он не повредил. Нанесение геля на ожог предотвращает неблагоприятный исход (боль), поэтому это пример отрицательного подкрепления. Поскольку такое поведение сводит к минимуму неблагоприятный исход, вы с большей вероятностью снова воспользуетесь гелем алоэ вера в будущем.

Отрицательное подкрепление также можно увидеть, если вы приняли парацетамол, чтобы избавиться от ужасной головной боли. Примерно через 15-20 минут боль в голове наконец утихает. Поскольку прием таблеток позволил вам устранить неприятную ситуацию, это повышает вероятность того, что вы снова будете принимать обезболивающие в будущем, чтобы справиться с физической болью.

Сила отклика

То, как и когда доставляется подкрепление, может повлиять на общую силу реакции.Эта сила измеряется следующими характеристиками реакции после остановки армирования:

Точность
Продолжительность
Частота
Стойкость

Непрерывное армирование

В ситуациях, когда настоящее подкрепление находится под контролем, например, во время обучения, можно изменить время предъявления подкрепления. На ранних этапах обучения часто используется постоянное подкрепление, например, когда вы впервые обучаете собаку новому трюку.Этот график предполагает усиление реакции каждый раз, когда она возникает.

Частичное армирование

После того, как поведение приобретено, часто бывает полезно переключиться на график частичного подкрепления. Четыре основных типа частичного армирования включают:

Слово от Verywell

Подкрепление играет жизненно важную роль в оперантном процессе обусловливания. При правильном использовании подкрепление может стать эффективным инструментом обучения, чтобы поощрять желаемое поведение и препятствовать нежелательному.

Важно помнить, что то, что представляет собой подкрепление, может варьироваться от одного человека к другому. Например, в классе один ребенок может найти поощрение за угощение, в то время как другой может быть безразличен к такой награде. В некоторых случаях то, что укрепляет, может даже стать неожиданностью.

Если ребенок получает внимание от родителей только тогда, когда его ругают, это внимание может фактически усилить проступок. Узнав больше о том, как работает подкрепление, вы сможете лучше понять, как различные типы подкрепления способствуют обучению и поведению.

Глава 4.2: Армирование и графики армирования

Глава 4.1: Классическое и оперантное кондиционирование
Глава 4.2: Армирование и графики армирования

Термин усиливать означает усиливать и используется в психологии для обозначения любых стимулов, которые усиливают или увеличивают вероятность определенной реакции. Например, если вы хотите, чтобы ваша собака сидела по команде, вы можете угощать ее каждый раз, когда она садится за вас.В конце концов, собака поймет, что сидение, когда ей велят, приведет к угощению. Это лакомство укрепляет, потому что собаки любят угощения.

Это простое описание поощрения (угощения), которое увеличивает реакцию (сидение). Мы все применяем подкрепления каждый день, большую часть времени даже не осознавая, что делаем это. Вы можете сказать своему ребенку, что он хорошо поработал, после того, как он уберет свою комнату; возможно, вы скажете своему партнеру, как хорошо он или она выглядят, когда одеваются; или, может быть, вы получили повышение на работе после того, как хорошо поработали над проектом.Все это увеличивает вероятность повторения одного и того же ответа.

Есть четыре типа подкрепления: положительное, отрицательное, наказание и исчезновение. Мы обсудим каждый из них и приведем примеры.

Положительное армирование

Приведенные выше примеры описывают то, что называется положительным подкреплением. Думайте об этом как о добавлении чего-то, чтобы увеличить отклик. Например, добавление угощения увеличит реакцию сидения; добавление похвалы увеличит шансы вашего ребенка убрать свою комнату.Наиболее распространенные типы положительного подкрепления или похвалы и награды, и большинство из нас испытали это как дающий, так и получающий.

Отрицательное армирование

Думайте о негативном подкреплении как о том, что что-то отнимает, чтобы усилить реакцию. Примерами этого являются отбор игрушки до тех пор, пока ваш сын не заберет свою комнату, или удержание оплаты до завершения работы. По сути, вы хотите удалить или удержать что-то ценное, чтобы усилить определенный ответ или поведение.

Наказание (положительное наказание)

Большинство людей обычно называют наказанием положительное наказание . Это когда добавляется что-то отталкивающее, чтобы уменьшить поведение. Самый распространенный пример этого — наказание (например, ругательство) ребенка за плохое поведение. Причина, по которой мы делаем это, заключается в том, что ребенок начинает ассоциировать наказание с негативным поведением. Наказание не нравится, и поэтому, чтобы избежать его, он или она перестанут вести себя подобным образом.

Отрицательное наказание

Когда вы удаляете что-то, чтобы уменьшить поведение, это называется негативным наказанием. Вы что-то убираете, чтобы уменьшить реакцию или нежелательное поведение. Например, предоставление ребенку тайм-аута до тех пор, пока он не сможет уменьшить свое агрессивное поведение, является примером негативного наказания. Вы удаляете взаимодействие с другими, чтобы уменьшить нежелательное поведение.

Исследования показали, что положительное подкрепление является самым мощным из них.Добавление положительного для усиления реакции не только работает лучше, но и позволяет обеим сторонам сосредоточиться на положительных аспектах ситуации. Наказание, применяемое сразу после негативного поведения, может быть эффективным, но могут возникнуть проблемы, если оно не применяется последовательно. Наказание также может вызывать другие негативные эмоциональные реакции, такие как гнев и негодование.

График подкрепления

Зная, что мы понимаем четыре типа подкрепления, нам нужно понимать, как и когда они применяются (Ferster & Skinner, 1957).Например, применяем ли мы положительное подкрепление каждый раз, когда ребенок делает что-то положительное? Наказываем ли мы ребенка каждый раз, когда он делает что-то плохое? Чтобы ответить на эти вопросы, нужно разбираться в графиках армирования.

Применение одного из четырех типов подкрепления каждый раз, когда происходит какое-либо поведение (получение повышения после каждого успешного проекта или получение шлепков после каждого отрицательного поведения), называется непрерывным графиком. Это непрерывно, потому что приложение появляется после каждого проекта, поведения и т. Д.Это лучший подход при применении наказания. Непоследовательность в наказании детей часто приводит к замешательству и негодованию. Проблема с этим расписанием заключается в том, что мы не всегда присутствуем при возникновении какого-либо поведения или не можем применить наказание.

Есть два типа непрерывных графиков:

Фиксированный коэффициент. График с фиксированным соотношением относится к применению подкрепления после определенного количества действий. Примером может служить шлепание ребенка, если вам нужно трижды попросить его убраться в своей комнате.Проблема в том, что ребенок (или кто-то другой в этом отношении) начнет понимать, что ему может сойти с рук две просьбы, прежде чем ему придется действовать. Таким образом, поведение не изменится до тех пор, пока не появится предустановленный номер.

Фиксированный интервал. Применение подкрепления через определенное время называется расписанием с фиксированными интервалами. Примером может быть повышение зарплаты каждый год, а не между ними. Основная проблема с этим графиком состоит в том, что люди стремятся улучшить свою работу прямо перед истечением периода времени, чтобы «хорошо выглядеть», когда приходит обзор.

Когда армирование применяется нерегулярно, они называются переменными графиками.

Переменное соотношение. Это относится к применению подкрепления после переменного количества ответов. Было установлено, что графики с переменным соотношением лучше всего работают во многих обстоятельствах, и знание примера объяснит почему. Представьте, что вы зашли в казино и направились к игровым автоматам. После того, как вы положите третью монету, вы получите две обратно. Еще два, и вы получите три обратно. Еще пять монет, и вы получите еще две обратно.Насколько сложно перестать играть?

Переменный интервал. Окончательное расписание — это подкрепление кого-то по прошествии определенного времени. Если у вас есть начальник, который периодически проверяет вашу работу, вы понимаете силу этого графика. Поскольку вы не знаете, когда может прийти следующий «осмотр», вам нужно постоянно много работать, чтобы быть готовым.

В этом смысле расписания переменных более эффективны и приводят к более последовательному поведению. Это может быть не так верно для наказания, поскольку последовательность в применении очень важна, но для всех других типов подкрепления они, как правило, приводят к более сильным ответам.

Спасибо А. Кенту Ван Кливу младшему, доктору философии. за комментарии к этой статье.

Введение в обучение с подкреплением | MarkTechPost

источник: louiskirsch.com

Обучение с подкреплением — это область машинного обучения, цель которой — научиться выполнять определенные действия в среде, которая приводит к нахождению правильных действий, которые необходимо предпринять в различных ситуациях для достижения абсолютной цели. Агент учится достигать цели в неопределенной сложной среде посредством повторных испытаний, чтобы максимизировать совокупное вознаграждение.Агент использует методологию проб и ошибок, чтобы найти решение проблемы, и получает либо вознаграждение, либо штрафы за свои действия. Обучение с подкреплением используется для поиска наилучшего поведения или пути, который следует выбрать в данной ситуации.

Обучение с подкреплением отличается от обучения с учителем тем, что не требует представления помеченных пар ввода / вывода, чтобы модель чему-то научилась. В обучении с подкреплением ответа нет, но агент подкрепления решает, что делать для выполнения данной задачи.В отсутствие набора данных для обучения основное внимание уделяется поиску баланса между исследованием, эксплуатацией и обучением на собственном опыте.

Основные элементы модели обучения с подкреплением

Агент — это учащийся и принимающий решение модели для выполнения указанной работы. Среда — это мир, с которым Агент взаимодействует и выполняет действия на основе полученной информации. Агент получает состояние S ⁰ от Среды, и впоследствии Агент и Среда постоянно взаимодействуют.Агент выбирает действия, а Среда реагирует на эти действия и представляет агенту новые ситуации.

Действие — это действие Агента, которое вызывает изменение статуса в Среде. Агент может совершить любое случайное действие и перейти в новое состояние. Лучшее действие определяется исходя из максимальной награды. Награда — это оценка действия, данного Окружением, и может быть положительной или отрицательной. Основная цель нашей модели — выбрать действия, которые максимизируют общую награду.

источник: Stanford-edu Docs

Подходы к проблеме обучения с подкреплением

К проблеме обучения с подкреплением можно подойти разными способами:

В подходе к обучению с подкреплением на основе значений отсутствует функция политики, и цель состоит в том, чтобы жадно выбирать действия для максимизации функции ценности V (s).

В подходе на основе политики действие, выполняемое в каждом состоянии для получения максимального вознаграждения в будущем, основано на функции политики.Здесь не используется функция ценности. Функция политики может быть детерминированной, которая производит одно и то же действие A в любом состоянии s, или стохастической, где каждое действие A имеет определенную вероятность возникновения.

Подход на основе модели создает виртуальную модель для каждой среды, и агент учится производить действия в этой конкретной среде. Поскольку модель отличается для каждой среды, для этого подхода не существует единственного решения или алгоритма.

Реализация модели обучения с подкреплением

OpenAI Gym — это платформа для разработки алгоритмов обучения с подкреплением.OpenAI Gym предоставляет различные игровые среды, в которых агент может действовать. Каждая среда имеет начальный статус, и статус обновляется каждый раз, когда агент предпринимает действия.

Здесь мы реализуем нашу модель обучения с подкреплением в игре с шестом тележки от OpenAI и получим высокий балл !!

Напишите следующий код для реализации модели:

  # импорт основных библиотек
импортный тренажерный зал
импортировать numpy как np
импортировать matplotlib.pyplot как plt
импорт ОС
из коллекций import deque
из кераса.модели импортируют Последовательный
из keras.layers import Плотный
от keras.optimizers импорт Адам
случайный импорт

#Creating Agent
класс Агент:
    def __init __ (self, state_size, action_size):
        self.state_size = state_size
        self.action_size = размер_ действия
        self.memory = deque (maxlen = 2000)
        self.gamma = 0.95 #Discount Factor
        self.epsilon = 1.0 # Скорость исследования: сколько случайных действий,
        self.epsilon_decay = 0,995
        self.epsilon_min = 0,01
        self.learning_rate = 0.001
        self.model = self._create_model ()
        
 # Создание модели
    def _create_model (сам):
        #Neural Network To Approximate Q-Value function
        model = Последовательный ()
        # 1-й скрытый слой
        model. add (Dense (24, input_dim = self.state_size, активация = 'relu'))
        model.add (Dense (24, activate = 'relu')) # 2-й скрытый слой
        model.add (Плотный (self.action_size, Activation = 'linear'))
        model.compile (loss = 'mse', optimizer = Adam (lr = self.learning_rate))
        модель возврата

 # вспоминая предыдущий опыт
    def запомнить (self, state, action, reward, next_state, done):
        себя.memory.append ((состояние, действие, награда, next_state, выполнено))


# Создание функции действия
    def act (self, state):
        # Исследование против эксплуатации
        если np.random.rand () <= self.epsilon:
            вернуть random.randrange (self.action_size)
        # прогнозировать значение вознаграждения на основе текущего состояния
        act_values = self.model.predict (состояние)
        return np.argmax (act_values [0]) # Влево или вправо

# метод, который тренирует NN с опытом, взятым из памяти
    def train (self, batch_size = 32):
        minibatch = случайный. образец (self.memory, batch_size)
        для состояния, действия, награды, next_state, выполненного в мини-батче:
            
            если не сделано: #boolean
                цель = награда + self.gamma * np.amax (self.model.predict (next_state) [0])
            еще:
                цель = награда
            target_f = self.model.predict (состояние)
            target_f [0] [действие] = цель
            self.model.fit (состояние, target_f, эпохи = 1, подробный = 0)
            
        если self.epsilon> self.epsilon_min:
            себя.epsilon * = self.epsilon_decay
    
    def load (self, name):
        self.model.load_weights (имя)
    def сохранить (себя, имя):
        self.model.save_weights (имя)


# Запуск модели
n_episodes = 1000
output_dir = "cartpole_model /"
агент = Агент (state_size = 4, action_size = 2)
done = Ложь
state_size = 4
action_size = 2
batch_size = 32
agent = Agent (state_size, action_size) # инициализировать агент
done = Ложь
для e в диапазоне (n_episodes):
    состояние = env. reset ()
    state = np.reshape (состояние, [1, state_size])
    
    для времени в диапазоне (5000):
        окр.оказывать()
        action = agent.act (state) # действие равно 0 или 1
        next_state, reward, done, other_info = env.step (действие)
        вознаграждение = вознаграждение, если не было сделано еще -10
        next_state = np.reshape (next_state, [1, state_size])
        agent.remember (состояние, действие, награда, next_state, выполнено)
        состояние = next_state
        
        если сделано:
            print ("Эпизод игры: {} / {}, Рекорд: {}, Скорость исследования: {:. 2}". format (e, n_episodes, time, agent.epsilon))
            перемена
            
    если len (agent.память)> размер партии:
        agent.train (размер_пакета)
    
    если e% 50 == 0:
        agent.save (output_dir + "weights _" + '{: 04d}'. format (e) + ". hdf5")
        
env.close ()

Посетите тренажерный зал OpenAI Gym, чтобы найти много интересных сред для работы и узнать больше об обучении с подкреплением.

Счастливого обучения !!

Предлагается
Алгоритмы обучения с подкреплением набирают больше очков, чем люди, другие системы ИИ в классических видеоиграх
Команда исследователей из Uber AI Labs в Сан-Франциско разработала набор алгоритмов обучения, которые оказались лучше при игре в классические видеоигры, чем люди или другие системы искусственного интеллекта.В своей статье, опубликованной в журнале Nature , исследователи объясняют, чем их алгоритмы отличаются от других и почему, по их мнению, они могут применяться в робототехнике, обработке языков и даже в разработке новых лекарств.
Алгоритмы обучения с подкреплением учатся делать что-то, синтезируя информацию из большого набора данных — они распознают закономерности и используют их, чтобы делать предположения о новых данных. Вот как алгоритмы обучения с подкреплением используются для выявления рака легких с помощью рентгеновских лучей. Но, как отмечают исследователи с этим новым усилием, такие алгоритмы имеют тенденцию сталкиваться с проблемами, когда они сталкиваются с данными, которые не соответствуют другим данным в наборе данных. Вот почему такие системы иногда могут возвращать неверные результаты.
В этом новом усилии исследователи преодолели эту проблему, добавив алгоритм, который запоминает все пути, пройденные предыдущим алгоритмом, когда он пытался решить проблему.Когда он находит точку данных, которая кажется неправильной, он возвращается к своей карте памяти и пробует другой маршрут. Что касается видеоигр, он сохраняет захваты экрана во время игры, а когда проигрывает, возвращается к другому моменту в игре и пробует другой подход. Алгоритм также группирует изображения, которые выглядят похожими, чтобы выяснить, в какой момент времени он должен вернуться, если что-то пойдет не так.
Исследователи протестировали свой новый подход, добавив правила игры и цель — набирать как можно больше очков и каждый раз стараться набирать больше очков. Затем они использовали свою систему, чтобы сыграть в 55 игр Atari, которые со временем стали эталоном для тестирования систем искусственного интеллекта. Новая система превосходит другие системы искусственного интеллекта в 85,5% случаев. Особенно хорошо он проявил себя на Месть Монтесумы, набрав больше очков, чем любая другая система ИИ, и побив рекорд для человека.
Исследователи полагают, что их алгоритм может быть перенесен роботами в другие приложения, такие как обработка изображений или языка.

Исследователи используют слабые стороны основных игровых ботов.
Дополнительная информация: Адриен Экоффет и др. Сначала вернитесь, затем исследуйте, Nature (2021). DOI: 10.1038 / s41586-020-03157-9
© 2021 Сеть Science X
Цитата : Алгоритмы обучения с подкреплением набирают больше очков, чем люди, другие системы искусственного интеллекта в классических видеоиграх (2021, 25 февраля) получено 4 марта 2021 г. из https: // techxplore.ru / news / 2021-02-алгоритмы-оценка-выше-люди-ai.html
Этот документ защищен авторским правом. За исключением честных сделок с целью частного изучения или исследования, никакие часть может быть воспроизведена без письменного разрешения. Контент предоставляется только в информационных целях.
3 способа начать обучение с подкреплением
Когда я учился в аспирантуре в 1990-х, одним из моих любимых занятий были нейронные сети.Тогда у нас не было доступа к TensorFlow, PyTorch или Keras; мы вручную программировали нейроны, нейронные сети и алгоритмы обучения по формулам из учебников. У нас не было доступа к облачным вычислениям, и мы кодировали последовательные эксперименты, которые часто проводились в одночасье. Не существовало таких платформ, как Alteryx, Dataiku, SageMaker или SAS, которые позволяли бы проверять концепцию машинного обучения или управлять сквозными жизненными циклами MLops.
Меня больше всего интересовали алгоритмы обучения с подкреплением, и я помню, как писал сотни функций вознаграждения для стабилизации перевернутого маятника.Мне так и не удалось заставить его работать, и я никогда не был уверен, неправильно ли я закодировал алгоритмы, выбрал менее оптимальные функции вознаграждения или выбрал несовершенные параметры обучения. Но сегодня я могу найти примеры обучения с подкреплением, применяемые к проблеме перевернутого маятника, и даже схемы для его построения.
Объяснение обучения с подкреплением
Обучение с подкреплением — это обучающий алгоритм. Субъект работает в среде с текущим состоянием и действиями, которые он может выполнять. В данном случае объект представляет собой перевернутый маятник, помещенный на тележку, которая может двигаться влево или вправо по прямой.Положение и скорость маятника и тележки, удерживающей маятник, представляют состояние. Тележка может двигаться только в одном направлении, влево или вправо, чтобы уравновесить маятник.
Вместо того, чтобы программировать действие тележки с помощью набора правил, тележке дается функция вознаграждения для оценки результатов на основе ее действий. По мере движения тележки функция вознаграждения вычисляет балл, и более высокие баллы даются, когда маятник находится в вертикальном положении. Алгоритм обучения с подкреплением использует функцию вознаграждения для настройки нейронной сети на основе оценок функции.
Первые попытки не удастся, так как маятник продолжает падать. Однако при наличии достаточного количества попыток, хорошо подобранной функции вознаграждения и оптимально выбранных параметров настройки алгоритм изучает правильные действия для управления тележкой и балансировки маятника.
Доступно множество статей, которые помогут вам подробнее изучить основы обучения с подкреплением. Вы можете прочитать обзоры обучения с подкреплением, изучить основы, погрузиться в математику и алгоритмы, просмотреть исследовательские статьи или открыть для себя реальные приложения.
Для получения более подробной информации или экспериментов потребуется выбрать язык программирования, выбрать фреймворк, выбрать инструменты и настроить облачную среду. Признаюсь, это непростая задача, поэтому я искал возможности учиться, не пачкая руки.
Вот что я нашел:
1. Совместите работу и отдых с AWS DeepRacer
AWS представила DeepRacer в ноябре 2018 года как «самый быстрый способ начать работать с машинным обучением». В декабре 2020 года у них было более 10 000 участников и главный приз, который включал 10 000 долларов США в виде рекламных кредитов AWS.
Не позволяйте конкуренции пугать вас, потому что DeepRacer — превосходный инструмент обучения. Ваша цель — научить гонщика автономно перемещаться по выбранной гоночной трассе.
Когда вы подписываетесь на DeepRacer, вы получаете доступ к симулятору, где вы можете выбрать трек, запрограммировать функцию вознаграждения и настроить параметры настройки. Существует функция вознаграждения по умолчанию с настройками параметров, чтобы начать тренировку вашего гонщика и оценку его результатов. Оттуда вы отправляетесь на гонки, чтобы улучшить свои модели и настроить алгоритмы.
У вас есть более 20 треков на выбор, от простых испытаний на время до гонок лицом к лицу. Вы также можете приобрести физический DeepRacer, загрузить в него свои алгоритмы и спроектировать трассы для проведения соревновательных гонок.
Мне не потребовалось много времени, чтобы придумать способы улучшить предусмотренную функцию вознаграждения. Базовая функция оценивает, как далеко DeepRacer находится от центра трассы, с наивысшими оценками, когда гонщик находится на центральной линии. Я улучшил алгоритм, приняв во внимание углы поворота гонщика, давая ему более высокую награду, когда он движется к центральной линии.
Я чувствовал себя довольно хорошо, что всего за мою вторую модель и 10 минут тренировки мой DeepRacer преодолел около 26% трассы. Конечно, моя простая модель не работает, когда вы учитываете препятствия и других гонщиков. Вы можете сделать это в одиночку, чтобы улучшить производительность DeepRacer, или вы можете учиться на чужих библиотеках кода и опыте гонок.
2. Вдохновляйтесь недавними достижениями
Нетрудно найти реальные примеры деловых, академических и государственных организаций, экспериментирующих и преуспевающих в обучении с подкреплением.Обратите внимание на эти недавние заголовки:
Несколько хороших веб-сайтов отслеживают новости в области ИИ и обучения с подкреплением, включая AI Trends, AI News, AI Business, страницу MIT News по AI, страницу ScienceDaily по AI и блог Berkeley AI Research.
3. Поэкспериментируйте с примерами кода
Перед тем, как приступить к обучению с подкреплением, вы можете ознакомиться с примерами кодирования или книгами, особенно применительно к знакомым задачам. Стоит рассмотреть следующие варианты:
Наконец, если вы готовы развить опыт обучения с подкреплением, рассмотрите эти курсы от Coursera, Гарварда, Массачусетского технологического института, Стэнфорда, Udacity, Udemy или просмотрите эти бесплатные варианты.
Учитывая, насколько сложно учить и учиться на собственном примере, обучение с подкреплением и другие методы обучения без учителя являются областями роста и возможностей. Даже если вы на пару шагов отстали в освоении методов машинного обучения, понимание обучения с подкреплением — это шанс развить опыт, пока ученые, промышленность и правительство развивают науку и алгоритмы.
Авторские права © IDG Communications, Inc., 2021.
Обучение с подкреплением, ориентированное на конструктора — Microsoft Research
В видеоиграх неигровые персонажи, боты и другие игровые агенты помогают оживить цифровой мир и его историю. Они могут помочь сделать миссию спасения человечества неотложной, превратить каждый поворот в потенциальную гибель геймера и усилить ажиотаж за рулем сверхбыстрой гоночной машины. Эти агенты тщательно спроектированы и запрограммированы, чтобы внести свой вклад в захватывающий игровой процесс.
Теперь, что, если бы эти же самые агенты могли бы научиться вести себя реалистично и интересно без разработчика, который должен был жестко кодировать все возможные естественные поведения в каждом сценарии? Представьте, что агенты в игре-боевике изучают различные наступательные стратегии, чтобы бросить вызов главному герою, или агенты в приключенческой игре учатся помогать игроку в получении информации о незнакомой среде. Обучение с подкреплением (RL), в котором агенты учатся действовать, когда они должны последовательно выполнять действия с течением времени, обеспечивает основу для достижения этой цели.С помощью RL агенты могут быть обучены разрабатывать свои собственные решения задач, трансформируя роль игровых дизайнеров от определения поведения к определению задач и предоставлению агентам возможности учиться. Такой сдвиг может привести к неожиданным откликам, которые, возможно, даже не вообразил геймдизайнер, помогая создавать более привлекательных персонажей и миры.
Обучение с подкреплением уже дает многообещающие результаты. Например, мы продемонстрировали способность агентов эффективно взаимодействовать друг с другом в игре Ninja Theory Bleeding Edg e в рамках исследовательского сотрудничества Project Paidia, которое в конечном итоге направлено на обеспечение командной работы между агентами и людьми-игроками (для RL обзор, посетите наш веб-сайт Project Paidia и ознакомьтесь с интерактивным опытом). В то же время многие эксперты считают, что использование RL в индустрии коммерческих игр все еще намного ниже своего предельного потенциала. Причин тому множество, в том числе необходимость определенного уровня знаний для реализации технологии. Из нашего предыдущего исследования опыта создателей игровых агентов мы пришли к выводу, что для использования техник RL в игровой индустрии мы должны разрабатывать их с учетом потенциальных пользователей, их существующих рабочих процессов и требований. В недавней работе мы сосредоточились на трех конкретных задачах:
осуществление авторского контроля, когда дело доходит до определения эстетического стиля игровых агентов
балансировка нескольких ограничений дизайна, в частности выполнения задачи и поведения в желаемом стиле
разработка инструментов и инфраструктуры RL, которые являются более значимыми с точки зрения дизайнера, что позволяет дизайнерам для внесения желаемых изменений без формального инженерного обучения
В этой работе мы делаем первые шаги к подходу, ориентированному на дизайнера, к RL , что упрощает дизайнерам определение стиля агента через обучение предпочтениям, автоматически, надежно объединенное вознаграждение сигналы, которые удовлетворяют различным конструктивным ограничениям, и контекстуально значимый рабочий процесс.
Мы показываем наши результаты в задаче навигации, поскольку навигация — одна из самых фундаментальных возможностей агента. В наших экспериментах мы начинаем с агента, которого награждают за максимально быстрое приближение к цели — в нашем случае это синий кружок за двумя «стенами». Это приводит к тому, что агент учится выбирать кратчайший путь к синему кругу, заставляя агента врезаться в стены и волочиться по ним. В этом исследовании мы берем на себя роль дизайнера, стремящегося к движениям, более отражающим то, как игрок-человек может подойти к задаче, выбрав более центральный путь.
Видео 1. В задаче навигации, подобной описанной выше, агенты обычно тянутся вдоль стен, особенно если они получают вознаграждение за приближение к цели (синий кружок). Мы хотим настроить этого агента так, чтобы он не так сильно прижимался к стенам и вел себя так, чтобы больше отражать то, как игрок-человек может выполнить задачу, используя более центральный путь.
Обучение предпочтениям как метод определения вознаграждений за стиль
Алгоритмы
RL обучаются с помощью функции вознаграждения. К сожалению, очень сложно определить эстетический стиль с помощью вычислений. Если мы создаем стелс-игру, мы можем захотеть, чтобы наши агенты подкрались к краю здания, но если мы делаем игру о воинах-киборгах, мы бы предпочли, чтобы они прорывались через сцену. Однако неясно, как можно было написать награду в стиле RL за «скрытность» или «шумность». Даже если бы это было так, дизайнеры, которые решают и настраивают эстетические аспекты игры, часто отделены от инженеров, которые реализуют базовое поведение ИИ, требуя, чтобы дизайнеры стали достаточно опытными в RL, чтобы настроить кодовую базу ИИ для достижения желаемого стиля.Такое ожидание нереально для больших команд и непрактично для большинства используемых сегодня рабочих процессов дизайнеров.
Видео 2: В этой управляемой человеком демонстрации (преувеличенной, чтобы проиллюстрировать, как будет вести себя агент RL) персонаж, двигающийся к своей цели в Bleeding Edge, выглядит шокирующим. Это не отражает того, как вероятнее всего будет двигаться игрок-человек, и такое поведение не имеет смысла с точки зрения эстетического стиля игры. Однако с точки зрения агента RL никаких проблем не возникнет! Агент выберет самый быстрый путь к поставленной цели.(Это видео предназначено только для демонстрационных целей. Не представляет агентов, используемых в Bleeding Edge или Project Paidia. Не представляет окончательный игровой процесс или визуальные эффекты.)
Традиционный метод достижения нашей цели — достичь синего круга так быстро, как Возможно, выбрав более центральный путь, было бы написать расширение функции вознаграждения, также известное как формирование вознаграждения. Мы можем наказать агента за то, что он слишком близко подошел к стенам, но при этом вознаградить его за достижение цели.Однако даже с помощью обширных экспериментов трудно добиться именно того поведения, которое мы хотим, поскольку на самом деле нам нужно не просто «держаться подальше от стен», а более детализированный стиль движения, который трудно уловить математически.
Видео 3: Чтобы достичь более центрального пути с традиционным подходом к формированию награды, агент получает штраф за то, что он слишком близко к стенам, в дополнение к исходной награде за задание. Однако это может привести к другому типу нежелательного поведения, если вознаграждение за формирование будет иметь слишком большой вес, как в этом видео.Следовательно, найти правильный баланс между задачами и стилем вознаграждения — непростая задача.
Было бы намного проще распознать желаемый стиль, чем описывать его математически. Из-за этого мы реализовали метод обучения на основе предпочтений, чтобы позволить дизайнерам определять желаемый стиль через простой пользовательский интерфейс — кодирования не требуется!
Предлагаемый нами метод работает следующим образом:
Политика, предварительно обученная на вознаграждении за задачу, взаимодействует с окружающей средой и создает набор траекторий.
Дизайнеру показывают сегменты этих траекторий, и они выбирают, какой сегмент ближе к их желаемому стилю.
Сеть вознаграждений, которой поручено запечатлеть стиль, обновляется в соответствии с предпочтениями дизайнера.
Сеть вознаграждений предсказывает, насколько государство демонстрирует усвоенный стиль. Это прогнозируемое вознаграждение в стиле плюс исходное вознаграждение за задачу используется для оптимизации исходной политики.
Собран новый набор траекторий с обновленной политикой для получения новых предпочтений.
Поскольку обучение RL требует времени, мы настраиваем уже компетентного агента, резко сокращая количество итераций по сравнению с обучением агента с нуля; все, что нам нужно сделать, это добавить к нему стиля. Кроме того, это упрощает применение разных стилей к одному и тому же базовому агенту, позволяя инженерам ИИ обучать базовую модель, а затем дизайнерам точно настраивать предпочтения стиля.
Видео 4: Математически описать эстетический стиль сложно. Наш прототип пользовательского интерфейса позволяет дизайнерам выбирать поведение, наиболее близкое к их желаемому стилю, из серии траекторий, генерируемых агентом, взаимодействующим со своей средой.
В исследовании эффективности обратной связи мы показываем, что можем надежно обучить успешного агента выполнению поставленной задачи. Для нашей задачи обучение считается успешным только в том случае, если агент выполняет задачу с достаточно высоким стилевым вознаграждением (измеряется средним расстоянием от ближайшей стены) и приемлемым вознаграждением за выполнение задания (приблизительным эквивалентом времени, необходимого для достижения цели. ). Мы достигли желаемого поведения в 50 сравнениях. Мы ожидаем, что количество требуемых предпочтений будет увеличиваться по мере увеличения сложности среды и желаемого стиля.
Видео 5: В нашей задаче навигации агент слева был настроен на максимальное расстояние до стен, а агент справа был настроен с использованием обучения предпочтениям. Благодаря изучению предпочтений мы смогли добиться более детального поведения, которое лучше отражало наш предполагаемый стиль.
Формирование на основе потенциала для сочетания стиля и вознаграждения за выполнение заданий
Выше представлен общий рабочий процесс при объединении нескольких источников вознаграждения. Агент RL пытается оптимизировать общее вознаграждение. Дизайнер должен выбрать правильное соотношение вознаграждения за стиль к вознаграждению за выполнение задания, указав здесь вес каждого элемента, A и B. Этот рабочий процесс требует большого количества итераций и предлагает мало контроля.
Указание награды, соответствующей желаемому стилю, — это только первый шаг; затем вознаграждение стиля должно быть интегрировано в вознаграждение за ранее существовавшую задачу агента. Это отнюдь не тривиальная задача. Если отношение вознаграждения за стиль к вознаграждению за задачу слишком велико, вознаграждение за стиль превосходит вознаграждение за задание, и производительность навигации страдает.Если коэффициент слишком низкий, то заметных изменений в поведении не наблюдается. Подход по умолчанию к решению этой проблемы — итерация — немного изменить соотношение и провести еще один эксперимент. Поскольку каждый тренировочный прогон RL может занимать часы, попытки вручную настроить стиль и соотношение вознаграждения за выполнение задач трудоемки и утомительно скучны.
Видео 6: В приведенном выше видео агент демонстрирует «взлом с вознаграждением», перемещаясь к точке, наиболее удаленной от стен, вместо достижения цели. Это происходит, когда комбинация вознаграждений за задачи и стиль неправильно сконфигурирована таким образом, что простое увеличение вознаграждения стиля, чтобы избежать стен и игнорирование вознаграждения за задание для достижения цели, дает наивысшее вознаграждение.
Когда мы впервые попытались настроить нашего агента с нашим новым стилем, у него не получилось добиться успеха в первоначальной задаче, так как он придавал слишком большое значение демонстрации стиля! Для решения этой проблемы мы использовали формирование вознаграждения на основе потенциала (PBRS). PBRS гарантирует, что, когда вводится формирующее вознаграждение, то есть поощрение, поощряющее поведение, отличное от начальной задачи, например, наше вознаграждение в стиле стиля, оптимальная политика для начальной задачи остается неизменной.
PBRS — это простой, но эффективный метод, при котором на каждом шаге мы вычитаем вознаграждение стиля предыдущего шага из общего вознаграждения (вознаграждение за задание плюс вознаграждение за стиль) текущего шага. Это означает, что агент получает вознаграждение за то, что он находится в определенном состоянии и не переходит в определенное состояние. Интуиция, лежащая в основе PBRS, может быть выражена следующим примером: представьте, что агент получает вознаграждение за пересечение финишной черты в гонке. После первоначального пересечения финишной черты агента можно побудить сделать шаг назад за финишную черту и снова вперед несколько раз, эффективно получая бесконечные награды. Однако с PBRS мы вознаграждаем агента только за то, что находится на финише , а не пересекает ее: всякий раз, когда агент отступает, мы забираем награду, которую мы ему дали, предотвращая накопление большего вознаграждения, просто пересекая ее и вперед.
Хотя различие тонкое, это не позволяет агенту «взломать вознаграждение», чтобы максимизировать вознаграждение, не выполнив первоначальную задачу. Когда мы начали использовать PBRS для интеграции нашего стиля вознаграждения в вознаграждение за задание, обучение было более успешным как с точки зрения сохранения высоких вознаграждений за исходные задания, так и с отображением желаемого стиля. Эта альтернатива трудоемкой задаче точной настройки соотношения вознаграждения за стиль к вознаграждению за задание вручную означает, что дизайнеры могут исследовать гораздо больше вариантов стиля вместо того, чтобы тратить свои ресурсы на то, чтобы один стиль работал должным образом.
Рис. 1. Формирование вознаграждения на основе потенциала (PBRS) упрощает интеграцию вознаграждения стиля в вознаграждение за задачу, не позволяя вознаграждению стиля ухудшать выполнение задания даже при высоком соотношении вознаграждения стиля к вознаграждению за задание. На приведенном выше графике показан процент успешных испытаний с определенным соотношением вознаграждения. В нашей навигационной задаче успешное испытание определялось как агент, выполняющий задачу с достаточно высокой стилевой наградой, измеряемой средним расстоянием от ближайшей стены, и приемлемой наградой за выполнение задачи, приблизительно равной времени, необходимому для достижения Цель.Как показано, когда PBRS не используется, агент успешен только при соотношении вознаграждения стиля к выполнению задачи 0,1. Когда используется PBRS, агент успешен при соотношении от 0,5 до 100.
Автоматическая корректировка соотношения вознаграждения для увеличения контроля дизайнера
Несмотря на то, что использование PBRS значительно упростило поиск приемлемого соотношения между вознаграждением за стиль и вознаграждением за выполнение задания, мы по-прежнему просим дизайнеров настроить поведение, изменив произвольное числовое соотношение. Не существует интерпретируемого дизайнером смысла в словах «объединение вознаграждения за задание, состоящее из одной части, и вознаграждения в стиле четырех частей».”
Награды, особенно если они созданы намеренно, могут иметь значение с точки зрения дизайна. Например, если агент наказывается 1 очком каждую секунду, мы можем увидеть, насколько быстро агент достигает цели, просто посмотрев на окончательное вознаграждение. Награда за задание –15 означает, что агенту потребовалось 15 секунд, чтобы достичь цели. В сценариях, где можно предоставить аналогичные типы значимых вознаграждений, для дизайнера было бы гораздо эффективнее указать минимальную приемлемую производительность — нижнюю границу вознаграждения , порог вознаграждения — по сравнению с настройкой произвольных числовых соотношений.
С этой целью мы реализовали автоматический график соотношения вознаграждений, который пытается максимизировать вознаграждение за стиль при соблюдении порогового значения, указанного дизайнером. Автоматический планировщик увеличивает отношение вознаграждения за стиль к вознаграждению за выполнение задачи, в то время как вознаграждение за выполнение задачи превышает пороговое значение, заданное разработчиком, и уменьшает это соотношение, когда производительность задачи начинает ухудшаться. Чтобы быть более конкретным, мы линейно масштабируем отношение вознаграждения за стиль от максимального числа до 0 — между начальным и пороговым показателем.В приведенном выше примере, если разработчик хотел, чтобы его агент достиг цели не более чем за 15 секунд, автоматический планировщик увеличивал отношение вознаграждения стиля к вознаграждению за задачу до тех пор, пока агент не начал работать дольше, чем указанные 15 секунд. В этот момент планировщик затем уменьшит вес вознаграждения за стиль до тех пор, пока время выполнения не будет достигнуто 15 секунд. Этот автоматизированный график будет продолжаться в течение всего обучения.
Рисунки 2a и 2b. На рисунках выше показано, как заданные разработчиком минимальные пороговые значения вознаграждения за выполнение задач влияют на обучение.На рис. 2а (вверху) показано вознаграждение за выполнение задачи по общим временным шагам (длине эксперимента) при пяти различных минимальных пороговых значениях вознаграждения, от 150 до 110. График показывает, что обучение начинается с того же начального вознаграждения за задачу, равного 150, но снижается до минимальный порог задачи для каждого из экспериментов. Планировщик автоматического соотношения вознаграждения эффективен для удержания вознаграждения за задачу выше указанного порогового значения. На рис. 2b (внизу) показано среднее расстояние от стен (наша прокси для награды за стиль) по общим временным шагам при тех же пяти пороговых значениях награды.Среднее расстояние от стены увеличивается с уменьшением порога со 150 до 110. В частности, агент не может отойти от стен с порогом награды 150, поскольку у него нет слабины, чтобы пожертвовать наградой за задание.
На рис. 2а показано вознаграждение за задачу с различными заданными дизайнером минимальными порогами вознаграждения за выполнение задачи. Автоматическая корректировка соотношения вознаграждения эффективна для удержания вознаграждения за задание выше указанного порога производительности.
На рис. 2b показано среднее расстояние до ближайшей стены, простая аппроксимация нашего целевого стиля при различных порогах вознаграждения.Когда минимальный порог вознаграждения за задачу очень высок (150), изменение поведения довольно невелико, поскольку агент ставит вознаграждение за выполнение задачи выше демонстрации стиля. Однако по мере того, как дизайнер ослабляет ограничения, появляется больше стиля поведения.
Этот метод определения желаемой награды гораздо более значим, чем итеративное изменение числового отношения для достижения желаемой цели. Мы считаем, что этот рабочий процесс значительно упрощает работу дизайнера.
Открытые вопросы и продолжение сотрудничества
Хотя эти результаты обнадеживают, есть несколько открытых исследовательских вопросов. Во-первых, нам нужно подтвердить наши выводы с помощью пользовательского исследования. Хотя рабочий процесс высокого уровня установлен, есть еще кое-что, что нужно узнать о его специфике. В контексте предлагаемых нами решений, дизайнеры постоянно следят за обучением или дают обратную связь по частям? Какая информация отображается дизайнерам, чтобы они могли сделать правильный выбор?
Еще один открытый вопрос — изучение различных методов определения стиля. Хотя предпочтения полезны, есть много других методов, которые мы можем использовать.Дизайнеры могут продемонстрировать желаемый стиль, взяв на себя управление агентом, или они могут аннотировать отдельные состояния для управления точной настройкой. Неясно, какой из этих методов (или какая комбинация) предлагает дизайнерам наибольший контроль.
Путь к RL, который можно легко и органично включить в коммерческий игровой дизайн, долог. Мы чувствуем, что подход, ориентированный на дизайнера, как продемонстрировали прототипы выше, предлагает многообещающие средства для достижения этой цели, и мы с нетерпением ждем продолжения сотрудничества с профессионалами игровой индустрии для предоставления практических и расширяющих возможностей решений.
Дополнительные ресурсы и возможности
Эта работа была начата докторантом Калифорнийского университета в Санта-Крузе Бату Айтемизом во время стажировки в Microsoft Research в Кембридже. Члены команды Михаил Джейкоб, Сэм Девлин и Катя Хофманн выступали в качестве консультантов в работе.
Reinforcement — Scholarpedia
Действия после публикации
Куратор: Рой Уайз
Подкрепление — это термин, используемый теоретиками обучения для описания основного процесса ассоциативного обучения.
История
Термин подкрепление был введен Павловым в 1903 году для описания усиления связи между безусловным и условным стимулом, возникающего при их совместном представлении. Если ассоциация периодически не «подкрепляется» таким спариванием, эффективность условного раздражителя падает: условный ответ угасает . Для Павлова любой безусловный раздражитель, такой как еда или дуновение воздуха в глаза, был потенциальным подкреплением; соединение такого стимула с нейтральным стимулом составляло подкрепление. Этот термин для Павлова обозначал усиление (и установление) связи между условным раздражителем и его безусловным родительским раздражителем (Павлов, 1928).
Термин «подкрепление» в настоящее время используется больше по отношению к обучению реагированию, чем к обучению по стимулам. Торндайк первым ввел концепцию подкрепления реакции, предположив, что ответы, «за которыми следует удовлетворение», будут «более прочно связаны с ситуацией, так что, когда она повторится, они будут более вероятно повторяться.В этом заключается суть Закона Торндайка (Thorndike, 1911) , более формальной формулировки «вдавливания» связей между стимулами и ответами, которые он ввел десятью годами ранее (Thorndike, 1898). Хотя Торндайк обсуждал сущностное понятие подкрепления, только в 1933 году Торндайк (Thorndike, 1933) и Скиннер (Skinner, 1933) приняли термин Павлова «подкрепление» для обозначения усиления ассоциаций «стимул-реакция».
В то время как Скиннер первоначально думал об инструментальном поведении и использовал термин «подкрепление» в рамках павловской обусловленности, он вскоре (Скиннер, 1937) пришел к выводу, что стимульное (павловское) и ответное («оперантное» или «инструментальное») обучение включают различные принципы и требуя различных рамок. Он пришел к отрицанию того, что то, что мы считаем «целенаправленным» поведением, изначально вызывается внешним стимулом, и вместо этого утверждал, что первоначальные действия, которые впоследствии формируются в инструментальное поведение, испускаются организмом случайным образом, подобно тому, как случайным образом испускаются частицы. радиоактивной молекулой. Он переименовал то, что раньше называлось «ответом», назвав его «оперантом», но теперь этот термин включал контролирующий стимул в так называемую трехчленную непредвиденную ситуацию : подкрепление усиливает реакцию в присутствии контролирующей или «различительный» стимул.Его новая формулировка была «Если за появлением операнта следует предъявление подкрепляющего стимула, сила увеличивается» (Скиннер, 1938), стр. 21. Одна проблема с формулировкой Скиннера заключается в том, что он не уточняет в своем формальном утверждении. , что именно усилено. В другом месте он указывает, что «оперант» усиливается. Под этим он подразумевает, что частота его увеличилась.
Для Павлова была усилена ассоциация между двумя стимулами (S-S-обучение).
Для Торндайка была усилена ассоциация между стимулом и реакцией (обучение S-R).
Для Скиннера нет отношений, которые нужно укреплять; нет стимула к участию в ассоциации. Есть только оперант, связанный только вероятностно, а не причинно, с любым предшествующим событием, с которым он мог бы быть связан.
Однако через несколько страниц определения интересующего поведения как «операнта» Скиннер возвращается к общепринятому термину «ответ»:
«В первой главе указывалось, что существует два типа условных рефлексов, определяемых в зависимости от того, коррелирует ли подкрепляющий раздражитель с ответом» (Скиннер, 1938), стр. 62.
На протяжении его третьей и последующих глав на ординатах его графиков появляются «ответы» или «ответы в час». Просто прямо заявив, что оперант является поведенческой эмиссией, а не реакцией на вызывающий стимул, Скиннер продолжает предполагать, что животное узнает взаимосвязь между его поведением и его последствиями, форма обучения, обозначенная как «реакция-результат» ( RO) обучение более молодыми работниками. Таким образом, в рамках теории Скиннера именно связь между ответом и его результатом усваивается и «подкрепляется».”
Механизмы
Первая великая теория подкрепления заключалась в том, что оно запечатлевается в памяти, уменьшая физиологические потребности или дисбаланс (Hull, 1943). Идея была привлекательной, потому что говорила об очевидном факте, что обучение было механизмом, с помощью которого высшие животные могли удовлетворять свои потребности, несмотря на изменения окружающей среды, которые бросали вызов механизму инстинктов. Однако он был близоруким, поскольку имел дело только с обучением по реакции, а не со стимулированным обучением, для которого этот термин был впервые применен.Даже в случае обучения реагированию вскоре стало ясно, что уменьшение потребности не является необходимым условием подкрепления. Наиболее показательной была демонстрация того, что крысы научатся работать с подсластителями, не имеющими пищевой ценности (Sheffield and Roby, 1950), или с прямой электрической стимуляцией определенных мозговых путей (Olds and Milner, 1954). Жаждущие крысы навязчиво слизывают воздушный поток, который испаряет слюну и еще больше обезвоживает животное (Freed and Mendelson, 1974). Действительно, поведение животных изобилует примерами подкрепления, которое не снижает очевидной физиологической потребности (Harlow, 1953).
Теории подкрепления, которые постулируют физиологические механизмы, делятся на две категории: одна, которая пытается охарактеризовать анатомический субстрат (Glickman and Schiff, 1967; Gallistel et al., 1981; Wise, 2002: см. Раздел «Дифференциация от вознаграждения» ниже), и вторая, которая пытается охарактеризовать анатомический субстрат. для характеристики критических нейрофизиологических или нейрохимических событий. Внимание к критическим событиям сосредоточено вокруг понятия консолидации памяти; штампование или усиление памяти и консолидация памяти концептуально неразличимы (Landauer, 1969).
Доказательства того, что подкрепления усиливают консолидацию памяти, получены в исследованиях, в которых подкрепление вводится после несвязанного тренировочного эпизода. Прототипная демонстрация включала в себя задачу избегания понижения; животные, которым был предоставлен доступ к пище после тренировочных испытаний, показали более сильное сохранение тренировки избегания, чем животные, которым не давали немедленную пищу (Huston et al., 1974). По аналогии,
Пост-испытательный удар ногой может усилить консолидацию памяти (White and Legree, 1984).
Пост-испытательный прием сахарозы также очень эффективен;
содержание сахарина после испытаний меньше, несмотря на сравнение изогедонических концентраций (Messier and White, 1984).
Клеточная основа консолидации памяти — область активных исследований и гипотез. Ряд доказательств подтверждает, что дофамин важен для инструментального обучения с едой, стимуляции мозга и подкрепления лекарствами (Wise, 2004). Более того, высвобождение дофамина после испытаний может улучшить консолидацию памяти (White, 1996).Наконец, дофамин, по-видимому, играет важную роль в долгосрочной потенциации и долгосрочной депрессии у млекопитающих, моделях обучения и памяти на клеточном уровне (Wise, 2004), точно так же, как серотонин играет такую роль в аплизии (Kandel, 2001). . Однако дофамин не играет абсолютно важной роли. В то время как крысы, получавшие антагонисты дофамина, ведут себя так, как будто еда, стимуляция мозга и вызывающие привыкание психомоторные стимуляторы больше не усиливают, нокаутированные мыши, которым не хватает дофамина с рождения, могут научиться вкусовым предпочтениям (Cannon and Palmiter, 2003), и, если им дают кофеин, пища вознаграждается. Привычки реагирования на Т-образный лабиринт (Robinson et al., 2005). Таким образом, другие системы способны брать на себя эти функции у мышей, рожденных с дефицитом дофамина.
Отличие от «награды»
Различить понятия подкрепление и вознаграждение сложно из-за допущений здравого смысла, часто связанных с последним. Многие ученые используют термин «подкрепление» и избегают термина «вознаграждение» на основании точности и объективности, в то время как другие ученые, также во имя точности, предпочитают термин «вознаграждение» (Wise, 1989).
Наиболее широко распространенное различие состоит в том, что награды — это положительное подкрепление , объекты или события, к которым приближаются, но не отменяются, в то время как подкрепление не обязательно. Связанный с этим подтекст состоит в том, что вознаграждение часто воспринимается как психологически гедонистское, тогда как подкрепление не обязательно. Термин «вознаграждение» с этой точки зрения является синонимом фразы «положительное подкрепление» (White, 1989). Класс подкреплений включает отрицательное подкрепление , фраза со своими собственными ошибками в определениях.Отрицательное подкрепление — это подкрепление, которое возникает в результате прекращения продолжающегося — обычно отталкивающего — состояния. В таком случае, называем ли мы отвращение отрицательным подкреплением или наказанием? В общепринятом понимании этого вопроса нет единого мнения, но в специальной литературе предъявление болезненного стимула обозначается как наказание, а не отрицательное подкрепление.
Одна группа специалистов, которая часто использует термин «вознаграждение», а не термин «подкрепление», включает тех, кто изучает животных, обученных нажимать на рычаг для прямой электрической стимуляции мозга. В этом случае стимуляция имеет зависящий от памяти усиливающий эффект, но также не зависящий от памяти мгновенный «затравочный» эффект. Эффект прайминга заряжает животное энергией и ненадолго увеличивает вероятность того, что вызванный им ответ будет повторяться. Этот эффект не сохраняется в памяти. Эффективность прайминга снижается в течение нескольких десятков секунд, тогда как усиливающие (после испытания) эффекты стимуляции запоминаются на несколько дней (Gallistel et al., 1974). Усиливающий эффект пост-пробного подкрепления находит свое отражение в долговременной памяти, тогда как прайминговый эффект досудебного предъявления той же стимуляции — нет.Поскольку животное обычно отвечает на стимуляцию 50–100 раз в минуту, в этих исследованиях стимулирующий эффект каждой стимуляции весьма значителен. По этой причине стимуляцию часто называют «вознаграждением за стимуляцию мозга» — фразой, которая не различает стимулирующие и подкрепляющие действия, которые вместе определяют скорость реакции животного (Wise, 1989). Тот факт, что физиологические психологи предпочитают термин вознаграждение, в то время как поведенческие фармакологи предпочитают термин подкрепление (несмотря на тот факт, что препараты, принимаемые самостоятельно, например, стимуляция мозга самостоятельно, обладают как прижигающим, так и подкрепляющим действием: Пикенс и Харрис, 1968). добавляет к неуверенности неспециалистов в том, какой термин следует предпочесть.
Субъективные корреляты
Хотя положительные подкрепления часто ассоциируются с осознанным удовольствием, неясно, действительно ли они таковы. Также неясно, должны ли отрицательные подкрепления ассоциироваться с сознательной болью или дистрессом. Неясно, есть ли у подкрепления необходимые субъективные корреляты. Действительно, субъективные оценки двух наборов подкрепляющих стимулов не обязательно предсказывают, какой набор субъект будет нажимать на рычаг, чтобы просмотреть (Aharon et al., 2001).Люди сообщают, что субъективное удовольствие от инъекций героина или кокаина резко уменьшается при повторном употреблении наркотиков, но инъекции по-прежнему оказывают сильное влияние на их поведение, связанное с поиском наркотиков. Возможно, что не существует сознательной корреляции фундаментального процесса подкрепления, и что удовольствие (или боль) сообщается просто как наилучшее предположение субъекта о том, что повлияло на его поведение. Например, исследования на людях субъективных коррелятов мотивации и подкрепления и попытки смоделировать субъективные состояния у животных привели к выводу, что желание стимула и симпатия к стимулу не обязательно являются сознательными переживаниями (Berridge and Winkielman, 2003).
Список литературы
Aharon I, Etcoff N, Ariely D, Chabris CF, O’Connor E, Breiter HC (2001) Красивые лица имеют переменную ценность вознаграждения: фМРТ и поведенческие доказательства. Нейрон 32: 537-551.
Берридж К.С., Винкельман П. (2003) Что такое бессознательная эмоция? (Случай неосознанной «симпатии»). Познание и эмоции 17: 181-211.
Берридж К.С., Робинсон Т.Э. (2003) Награда за парсинг. Trends Neurosci. 26 (9): 507-13. Рассмотрение. Ошибка в: Trends Neurosci. 26 (11): 581.
Cannon CM, Palmiter RD (2003) Награда без дофамина.Журнал неврологии 23: 10827-10831.
Freed WJ, Mendelson J (1974) Airlicking: Жаждущие крысы предпочитают теплый сухой воздушный поток теплому влажному воздушному потоку. Физиология и поведение 12: 557-561.
Gallistel CR, Stellar JR, Bubis E (1974) Параметрический анализ вознаграждения за стимуляцию мозга у крысы: I. Переходный процесс и процесс, содержащий память. Журнал сравнительной и физиологической психологии 87: 848-859.
Gallistel CR, Shizgal P, Yeomans J (1981) Портрет субстрата для самостимуляции.Психологический обзор 88: 228-273.
Glickman SE, Schiff BB (1967) Биологическая теория подкрепления. Психологический обзор 74: 81-109.
Harlow HF (1953) Мыши, обезьяны, люди и мотивы. Психологический обзор 60: 23-32.
Hull CL (1943) Принципы поведения. Нью-Йорк: Appleton-Century-Crofts.
Huston JP, Mondadori C, Waser PG (1974) Содействие обучению вознаграждением за процессы памяти после испытаний. Experietia 30: 1038-1040.
Kandel ER (2001) Молекулярная биология хранения в памяти: диалог между генами и синапсами.Наука 294: 1030-1038.
Ландауэр Т.К. (1969) Армирование как уплотнение. Психологический обзор 76: 82-96.
Мессье С., Уайт Н.М. (1984) Случайные и непредвиденные действия сахарозы и усилителей сахарина: влияние на вкусовые предпочтения и память. Физиология и поведение 32: 195-203.
Olds J, Milner PM (1954) Положительное подкрепление, производимое электрической стимуляцией области перегородки и других областей мозга крысы. Журнал сравнительной и физиологической психологии 47: 419-427.
Павлов И.П. (1928) Лекции по условным рефлексам. Нью-Йорк: Международные издательства.
Пикенс Р., Харрис В.К. (1968) Самостоятельное введение d-амфетамина крысами. Психофармакология 12: 158-163.
Робинсон С., Сандстром С.М., Дененберг В.Х., Палмитер Р.Д. (2005) Определение того, регулирует ли дофамин пристрастие, желание и / или узнавание о наградах. Поведенческая неврология 119: 5-15.
Sheffield FD, Roby TB (1950) Наградная ценность непитательного сладкого вкуса.Журнал сравнительной и физиологической психологии 43: 471-481.
Скиннер Б.Ф. (1933) Скорость установления дискриминации. Журнал общей психологии 9: 302-350.
Скиннер Б.Ф. (1937) Два типа условных рефлексов: ответ Конорскому и Миллеру. Журнал общей психологии 16: 272-279.
Скиннер Б.Ф. (1938) Поведение организмов. Нью-Йорк: Appleton-Century-Crofts.
Торндайк Е.Л. (1898) Животный интеллект: экспериментальное исследование ассоциативных процессов у животных.Психологические монографии 8: 1-109.
Торндайк Е.Л. (1911) Животный интеллект. Нью-Йорк: Макмиллан.
Торндайк Э.Л. (1933) Теория воздействия на нее последствий связи. Психологический обзор 40: 434-439.
White NM (1989) Награда или поощрение: в чем разница? Neurosci Biobehav Rev 13: 181-186.
Уайт Н.М. (1996) Наркотики как усиливающие средства: множественные частичные действия на системы памяти. Наркомания 91: 921-949.
White NM, Legree P (1984) Влияние посттренировочного воздействия отталкивающего стимула на удержание.Физиологическая психология 12: 233-236.
Мудрый Р.А. (1989) Мозг и награда. В: Нейрофармакологическая основа вознаграждения (Либман Дж. М., Купер С. Дж., Ред.), Стр. 377-424. Оксфорд: Издательство Оксфордского университета.
Мудрый Р.А. (2002) Схема вознаграждения за мозг: понимание бессмысленных стимулов. Нейрон 36: 229-240.
Мудрый Р.А. (2004) Дофамин, обучение и мотивация. Nature Reviews Neuroscience 5: 483-494.
Внутренние ссылки
Говард Эйхенбаум (2008) Память.Scholarpedia, 3 (3): 1747.
Вольфрам Шульц (2007) Награда. Scholarpedia, 2 (3): 1652.
Внешние ссылки
См. Также
Классическое обусловливание, оперантное обусловливание, обучение с подкреплением, вознаграждение, сигналы вознаграждения
.
No related posts.