Количество слоев гидроизоляции нормы


Гидроизоляция фундамента ЕНИР: СНиП и ГОСТ


При выполнении гидроизоляции фундаментов и конструкции пола придерживаются определённых правил и норм, которые оговариваются в регламентирующих документах: СНиП, ГОСТ и ЕНиР. Только придерживаясь этих норм, можно быть уверенным, что гидроизоляционные работы выполнены по всем правилам. В таких нормативных документах, как СНиП и ГОСТ, описаны основные виды гидроизоляции, перечислены требования к используемым материалам и факторы, влияющие на выбор конструкции фундамента. Также там перечисляются методики и последовательности выполнения различных гидроизоляционных работ. ЕНиР – это сборник, в котором собраны единые нормы и расценки на выполнение строительных и ремонтных работ.

Нормативные документы

Гидроизоляция фундаментов должна выполняться с соблюдением норм, описанных в СНиП, где перечисляются нормативы проектирования и строительства оснований зданий и различных сооружений

Гидроизоляция фундаментов должна выполняться с соблюдением норм, описанных в СНиП с обозначением 2.02.01-83, где перечисляются нормативы проектирования и строительства оснований зданий и различных сооружений. В этом документе говорится, что все подземные части построек, а также заглублённые помещения, стены, колонны и конструкции фундаментов нуждаются в защите от капиллярной, поверхностной и грунтовой влаги. Последовательность выполнения гидроизоляционных работ регламентируется СНиП с обозначением 3.04.01-87.

Важно: гидроизоляция необходима в том случае, когда все другие меры защиты от воды (дренаж, цементация, битумизация и т.п.) экономически нецелесообразны или малоэффективны.

Что касается ГОСТ, то в вопросах выполнения гидроизоляции фундамента и пола руководствуются документом номер 12.03.009-76, в котором описываются правила подбора и работы с различными гидроизоляционными материалами.

ЕНиР состоит из сорока сборников, в которых устанавливаются единые расценки и нормы на следующие виды работ:

  • монтажные операции;
  • общестроительные работы;
  • ремонтно-строительные мероприятия.

Все тарифы в ЕНиР рассчитаны, исходя из семичасового рабочего дня. Однако условия работы могут быть иными, поэтому делаются поправки. В любом случае при составлении сметной документации по ЕНиР должны оговариваться условия выполнения работ.

Основные нормы СНиП

Оклеечная изоляция – это сплошной ковёр рулонных или плёночных изоляционных материалов, который клеится на подготовленную поверхность основания при помощи мастик

Согласно СНиП гидроизоляция фундамента бывает нескольких видов:

Рекомендуем к прочтению:

  1. Штукатурная изоляция – это сплошное влагостойкое покрытие толщиной от 6 до 50 мм. Для выполнения гидроизоляции фундамента используются холодные и горячие смеси на основе битума, полимеров или цементных вяжущих с наполнителем. Смеси могут наноситься механизированным (торкретирование) или ручным способом. Методика подходит для обработки конструкций из монолитного бетона.
  2. Окрасочная гидроизоляция – это водонепроницаемое, сплошное покрытие толщиной не менее 3-6 мм. Допускается механизированное нанесение окрасочной изоляции. Недостаток – недолговечность полученного защитного слоя. В зависимости от используемого сырья такие покрытия делятся на следующие разновидности:
  • битумные составы – пасты, эмульсии, растворённые и горячие битумные смеси;
  • битумно-полимерные смеси – наиритовые мастики, латексные эмульсии, составы на основе резины;
  • полимерные материалы – ЛКМ и синтетические смолы;
  • полимерно-цементные вещества – это различные составы на основе смеси латекса и цемента.
  1. Оклеечная изоляция – это сплошной ковёр рулонных или плёночных изоляционных материалов, который клеится на подготовленную поверхность основания при помощи мастик. Согласно ГОСТ, основное требование к этим материалам – высокая влагостойкость и устойчивость к гниению. Применение для этих целей материалов на картонной основе (толь, пергамин) недопустимо. Хотя для гидроизоляции пола в некоторых случаях они подходят.

Внимание: количество наклеиваемых слоёв (согласно ГОСТ) зависит от уровня влажности и гидростатического напора жидкости.

  1. Монтируемая гидроизоляция по СНиП может выполняться из листовых стальных материалов и специальных матов. Она крепится к поверхности фундаментных конструкций на анкерных болтах. Данная методика довольно дорогая и требует много трудозатрат, но согласно ГОСТ использование таких изоляционных материалов оправдано в условиях высоких гидростатических нагрузок, значительного механического воздействия, высоких температур.

Для выполнения гидроизоляционных работ при устройстве пола и фундамента используются следующие материалы:

  1. Различные полимерные, битумные и битумно-полимерные составы.
  2. Листовые и рулонные изоляционные материалы.
  3. Специальные бентонитовые экраны и другие плитные материалы.
  4. Асфальт.
  5. Цементные смеси со специальными влагостойкими добавками.

Важно: все используемые материалы должны соответствовать требованиям ГОСТ.

Выбор изоляционного материала и методики

Выбор марки и добавок для цемента с учётом химического состава воздействующих вод производится по СНиП

Способы и материалы для выполнения гидроизоляции фундамента и пола согласно СНиП выбираются с учётом следующих параметров:

  • Уровень влажности грунта.
  • Разновидность гидравлического воздействия влаги.
  • Химический состав и агрессивность воздействующих вод.
  • Наличие блуждающих токов.
  • Трещиностойкость конструкций фундамента или пола.

Выбор марки и добавок для цемента с учётом химического состава воздействующих вод производится по СНиП с маркировкой 2.03.11-85. Защита от блуждающих токов выполняется согласно действующим нормам.

Воды, оказывающие негативное воздействие на строительные подземные конструкции, делятся на три вида:

  • Фильтрационная (капиллярная) – это влага, которая накапливается внутри строительных конструкций.
  • Грунтовые воды – наличие подземных вод обусловлено гидрогеологическими условиями, рельефом местности. Здесь важно учитывать высоту стояния водоносных горизонтов.
  • Поверхностные воды (осадочные). Это воды, которые просачиваются в почву после осадков и таяния снега.

Важно: фильтрационные и осадочные воды в отличие от грунтовых вод не оказывают гидростатического давления на строительные конструкции.

Согласно ГОСТ при наличии гидростатического давления можно использовать не каждый вид гидроизоляции фундамента. Так подбор материала в зависимости от условий эксплуатации делается так:

Рекомендуем к прочтению:

  1. При уровне влажности не более 60 % и капиллярном подсосе вод подойдёт окрасочная изоляция фундамента. В условиях гидростатического напора можно использовать только комбинацию оклеечной и облицовочной изоляции.
  2. Если уровень влажности находится в пределах 60-75 процентов, то при капиллярном подсосе применяют любые окрасочные материалы, а при гидростатическом напоре составы на полимерной основе, цементную и асфальтовую штукатурку, а также комбинацию оклеечной и облицовочной гидроизоляции.
  3. При влажности выше 75 % и капиллярном подсосе используются окрасочные материалы. В условиях гидростатического напора подходят только комбинированные методы и материалы на базе полимеров, цемента и асфальта.

Важно: при использовании цементной штукатурки в условиях напора грунтовых вод состав наносится методом торкретирования с двух сторон фундамента. А со стороны напорного воздействия выполняют второй окрасочный слой поверх цементной штукатурки.

Согласно СНиП при выборе материала для гидроизоляции необходимо учитывать трещиностойкость фундаментных конструкций. Они бывают трёх категорий:

  • когда трещины недопустимы в любом случае;
  • допускаются небольшие трещины размером не более 0,2 мм;
  • допускаются два вида трещин (временного раскрытия – не больше 0,4 мм, длительного раскрытия – не больше 0,3 мм).

Внимание: цементная штукатурка и окрасочная изоляция не могут использоваться для защиты фундаментных поверхностей второй и третьей категории трещиностойкости.

Гидроизоляция пола по СНиП

Гидроизоляционные мероприятия по защите пола регламентируются СНиП с маркировкой 2.03.13-85

Гидроизоляционные мероприятия по защите пола регламентируются СНиП с маркировкой 2.03.13-85. В данном документе гидроизоляционные меры не озвучиваются как обязательные. Эти мероприятия рекомендуется проводить при высокой и средней интенсивности воздействия следующих жидкостей:

  • нейтральных растворов и вод;
  • органических растворителей;
  • масляных эмульсий и минеральных маслянистых составов;
  • чистых щелочей и их растворов;
  • кислотосодержащих составов;
  • различных жидкостей животного происхождения.

Для защиты пола от воды и различных жидкостей используют следующие материалы:

  • изол, гидроизол, бризол;
  • поливинилхлоридную пену;
  • полиизобутилен;
  • полиэтилен.

При выполнении гидроизоляции пола придерживаются следующих рекомендаций нормативных документов:

  1. Оклеечная изоляция из битумных материалов делается в два слоя при средней интенсивности воздействия воды. При укладке полимерных материалов достаточно одного слоя. Если интенсивность воздействия высокая, то битумные материалы укладываются в четыре слоя, а полимерные – в два.
  2. Оклеечные битумные составы нельзя использовать при воздействии на пол маслянистых составов и органических растворителей. Материалы на базе дёгтя не подходят в случае воздействия растворителей на базе органики.
  3. Если нужно выполнить гидроизоляцию стяжки, то состав наносится сплошным слоем с заведением на высоту 30 см на стены, колонны и другие строительные конструкции, а также оборудование, примыкающее к полу.
  4. В условиях низкой интенсивности воздействия вод допускается устройство гидроизоляционного слоя под подстилающей прослойкой в конструкции пола.
  5. В условиях высокой и средней интенсивности воздействия кислотосодержащих составов гидроизоляция прокладывается под бетонным подстилающим слоем. Если он находится ниже поверхности отмостки, то гидроизоляция делается в любом случае.

Испытание на целостность кровельных и гидроизоляционных мембран | WBDG

Введение

Проверка целостности - это «святой Грааль» строительных работ. Обеспечить уверенность в том, что части здания, которые могут намокнуть из-за погодных условий, находятся в состоянии, предотвращающем проникновение воды внутрь, является целью каждого подрядчика, а также каждого владельца. В результате была создана целая индустрия испытательных лабораторий. Поиск методов тестирования, обеспечивающих такую ​​уверенность, развивался на протяжении десятилетий, и каждое новое достижение в тестировании давало либо более точные результаты, либо результаты за меньшее время, либо и то, и другое.Этот документ предоставит информацию как об исторических, так и о современных методах тестирования. В этой статье не обсуждаются полевые испытания оконных проемов, жалюзи или дверей.

Исторически существовало пять широко используемых методов тестирования горизонтальных мембран: испытание распылением, испытание затоплением, испытание емкости (импеданса), ядерные измерения и инфракрасное (ИК) тепловидение. За последние два десятилетия два новых метода тестирования произвели революцию в области обнаружения утечек и тестирования целостности.Эти методы используют электричество и простую электрическую схему для обнаружения и определения проблемных условий в кровельных и гидроизоляционных системах. Обычно они называются «испытание на электрическую проводимость низкого напряжения» и «испытание искровым разрядом высокого напряжения». Для объяснения или рассмотрения всех принципов и тонкостей того, как следует применять каждый метод тестирования для получения точных результатов, потребуется больше времени и места, чем разрешено. В этом документе основное внимание уделяется методологиям тестирования, научным принципам, а также их преимуществам и ограничениям.Особое внимание будет уделено ограничениям. Это в значительной степени связано с тем, что внимание автора было обращено на то, что возможности методов высокого и низкого напряжения часто переоцениваются, что приводит к не оправданным ожиданиям со стороны владельцев и подрядчиков, что приводит к скептицизму и возможно, плохая репутация новой технологии.

Как и в случае с большинством исследовательских инструментов, выбранный метод тестирования зависит от опыта человека, использованного для проведения теста.Знание всех вариантов методов тестирования - это только первый шаг. Знание преимуществ и, что более важно, ограничений каждой системы поможет знающему человеку быстро и с минимальными затратами найти и устранить все нарушения в мембране.

Описание

На этой странице ресурсов обсуждаются следующие методы проверки целостности и обнаружения влаги:

Проверка целостности :

  1. Испытания низкого напряжения
  2. Испытания высокого напряжения
  3. Испытание на наводнение
  4. Испытания на распыление

Обнаружение влажности :

  1. Тестирование емкости
  2. Инфракрасная термография
  3. Счетчик ядер

Испытания низкого напряжения

Низковольтное тестирование - это окончательный тест, так как после исключения ложных срабатываний тестирование позволяет определить точные места пробоин в тестируемой мембране.Оборудование показывает, где ток следует за водой через мембрану к нижнему субстрату.

Низкое напряжение - это жизнеспособный вариант тестирования, когда непроводящая мембрана установлена ​​над сборкой токопроводящей палубы. Эта конфигурация дает простую электрическую цепь, в которой мембрана является электрическим изолятором, и любое нарушение в мембране закрывает путь цепи и позволяет току течь. (см. Диаграмму 1)

Схема 1. Электрическая цепь низкого напряжения

Электрическая цепь создается с помощью токопроводящей палубы, такой как бетон или сталь, к которой присоединяется заземляющий провод от испытательного оборудования.Затем оголенный металлический провод помещается в круг / петлю на мембране и присоединяется к положительной стороне испытательного оборудования. Затем вся площадь крыши смачивается водой, что создает электрическую пластину на всей верхней стороне мембраны при зарядке испытательной установкой. В этой электрической цепи мембрана действует как изолятор между положительно заряженной электрической пластиной на поверхности мембраны и проводящей площадкой, которая считается землей. Если есть разрыв в мембране, цепь замыкается, и ток будет течь к разрыву и в конечном итоге на землю / палубу.Чувствительный измеритель, подключенный к двум зондам, может определять направление тока, направляя тестирующего оператора к точному месту нарушения. (См. Фото 1 и 2). Как только нарушение обнаружено, оно должно быть электрически изолировано от испытательной зоны, поместив вокруг него круговую петлю со скрученным проводом, подключенным к петле, которая эффективно удаляет эту область из области, которая проходит испытания.

Фото 1 и 2. Низковольтное испытательное оборудование

Новое доступное низковольтное испытательное оборудование не требует отдельного контура и испытательного щупа.Конфигурация тестирования, аналогичная описанной выше, только в миниатюре создается платформой сканирования размером приблизительно 18 x 24 дюйма. (см. Диаграмму 2 и фото 3) Эта платформа содержит петлю по периметру, состоящую из металлических цепей, свисающих с краев платформы сканирования, и дополнительную линию цепей в центре, которые оба подключены к источнику питания. Счетчики прикреплены к двум цепям, и когда нарушение находится в пределах платформы, существует разность потенциалов между двумя цепями, которая создает ток, который активирует звуковой сигнал, чтобы предупредить специалиста по тестированию.

Диаграмма 2. Низковольтная испытательная платформа
Фотография любезно предоставлена ​​компанией Detec Systems, LLC

Фото 3. Низковольтная платформа в действии
Фотография любезно предоставлена ​​компанией Detec Systems, LLC

Как и у всех методов тестирования, есть ограничения. Самая важная часть этого и любого протокола тестирования - специалист по тестированию. Многолетний опыт работы не гарантирует наличия квалифицированного специалиста, и, к сожалению, для этого типа тестирования нет курсов или сертификатов.Испытательное оборудование является «немым», обеспечивая технику звуковыми сигналами и числовыми показаниями или показаниями датчиков. Задача техника - расшифровать эти показания и действовать соответствующим образом. Если технический специалист не понимает принципов процедуры тестирования, он не сможет понять показания в случае уникальных полевых условий или в маловероятном случае неисправности оборудования.

Другие ограничения включают:

  • Электропроводящие мембраны, такие как черный EPDM и модифицированные битумные мембраны с фольгированным покрытием, не могут быть испытаны.

  • Если пролом находится ниже большого количества покрывающей породы / почвы, сигнал, считываемый измерителем, будет слабым, и его легко пропустить.

  • Если в случае мембраны, покрытой покрывающим слоем, между мембраной и покрывающей поверхностью находятся электроизоляционные материалы (например, пенопластовая изоляция, пластиковые дренажные маты, полимерные листы для физической защиты или корневые барьеры и т. Д.), Точность испытаний будет ограничиваться половиной наименьшего размера барьера, вокруг которого должен проходить ток.

  • Если вода не попала из бреши на палубу, например, если брешь новая и / или не подвергалась воздействию погодных условий, цепь не будет замкнута и брешь не будет идентифицирована.

  • Если под мембраной присутствует замедлитель парообразования, и через него не проникают механические крепления, настил электрически изолирован, и никаких разрывов в открытой кровельной мембране обнаружено не будет.

  • Если несколько проникновений существуют в непосредственной близости друг от друга, может стать физически невозможным изолировать известные нарушения и повторно протестировать области, непосредственно прилегающие к нарушениям.

  • Некоторый скопившийся мусор, особенно на крышах с гравийным покрытием, эффективно отталкивает воду и не создает непрерывную электрически заряженную пластину на поверхности мембраны. Любая не влажная поверхность не может проводить ток и поэтому не проверяется.

  • Вертикальные обшивки чрезвычайно трудно поддерживать во влажном состоянии, и поэтому их трудно проверять.

Испытания высокого напряжения

Концепция испытания высокого напряжения аналогична концепции испытания низкого напряжения и изображена на схеме 3.При испытании высоким напряжением для создания разности электрических потенциалов используется заряженная металлическая метла над мембраной, а не электрическая пластина из воды. (См. Фото 4 и 5) Источник питания снова заземлен на токопроводящую платформу и создает высокую разность потенциалов с очень малым током. Когда металлическая головка метлы проходит через брешь в поверхности электроизоляционной мембраны, цепь замыкается, позволяя течь току. Этот поток тока обнаруживается испытательным устройством, которое отключает питание щетки и издает звуковой сигнал, чтобы предупредить оператора испытания.Затем область, где находилась головка метлы, когда был слышен звуковой сигнал, затем снова осторожно перемещается под углом девяноста градусов к исходному направлению движения, чтобы определить точное место разрыва. Этот процесс продолжается до тех пор, пока не будут проверены все участки мембраны, включая вертикальные отложения основания и отводы с проникновением.

Схема 3. Электрическая цепь высокого напряжения

Фото 4 и 5. Испытательное оборудование высокого напряжения

Отсутствие воды, а также относительная скорость и простота испытания высокого напряжения делают его предпочтительнее, чем низкое напряжение в большинстве условий.При очень высоких температурах поддерживать влажность мембраны для испытаний при низком напряжении часто невозможно. Когда температура очень низкая, работа с водой может быть опасной, а иногда и невозможной. Испытания под высоким напряжением позволят определить точное местоположение разрывов в мембране и, поскольку вода не используется, позволяют немедленно устранить их и повторно проверить.

Уникальное преимущество этой процедуры испытания заключается в том, что для мембран, наносимых жидкостью, она может обнаруживать места, где толщина мембраны не соответствует минимальным требованиям.Если электроизоляционные свойства мембраны (т.е. диэлектрическая постоянная) известны, оборудование может быть настроено на правильное напряжение, при котором ток будет течь через мембрану и активировать звуковой сигнал, если не присутствует заданная минимальная толщина материала. Эта точность обычно не требуется для проектов ограждающих конструкций; однако это оборудование обычно используется на трубопроводах, где проверяются внутренние покрытия и их толщина.

Опять же, метод тестирования имеет ограничения.Поскольку это относительно новая технология, необходимо соблюдать те же меры предосторожности в отношении квалифицированных технических специалистов. Другие ограничения включают:

  • Мембрана должна быть сухой, что может отложить тестирование на несколько часов, если накануне вечером выпала роса.
  • Мембрана должна быть открыта (нельзя проводить испытания через перекрывающую нагрузку).
  • Из-за более высокого напряжения больше? Ложных срабатываний? возможны, поэтому важны навыки тестировщиков.
  • Можно сжечь очень тонкую мембрану, нанесенную жидкостью, если испытательное напряжение установлено слишком высоким.
  • Электропроводящие мембраны, такие как черный EPDM и модифицированные битумные мембраны, покрытые фольгой, не могут быть испытаны.

Испытание на наводнение

Фото 6. Испытания на наводнение в процессе

Flood-тестирование - это самый простой и базовый из доступных методов тестирования. Он также может быть одним из самых эффективных. Глубокие знания и понимание структурных систем и их безопасной грузоподъемности являются обязательными перед рассмотрением или применением этого метода.Дренажная система временно закрыта или заблокирована, а рассматриваемая область покрыта водой, как правило, на период времени от 12 до 48 часов. Одновременно в этот период проверяется нижняя часть испытательной площадки на предмет проникновения воды. Глубина воды может варьироваться, однако обычно минимум 2 дюйма, чтобы обеспечить достаточный гидравлический напор, чтобы заставить воду проникать в любые небольшие бреши, которые могут произойти в течение периода испытания. (См. Фото 6)

Трудности с тестированием наводнения - это время, необходимое для заполнения, тестирования и последующего слива иногда десятков тысяч галлонов воды, необходимых для правильного тестирования области.Когда тестируемая область имеет уклон более 1/4 дюйма на фут, глубина воды, необходимая для тестирования этой области, резко увеличивается. Иногда требуемая глубина воды может превышать допустимую допустимую нагрузку конструкции. каркас или палуба и может потребовать, чтобы территория была разбита на несколько меньших секций за счет строительства водозадерживающих дамб. По завершении испытания воду необходимо безопасно удалить из мембраны. Если глубина воды достаточна и стоки просто полностью открыть, чтобы осушить зону, катастрофические результаты, такие как выдувание колен в дренажном трубопроводе, могут привести к тому, что вся тестовая вода попадет внутрь здания, что приведет к значительным повреждениям.Еще одно серьезное ограничение этого типа тестирования заключается в том, что при возникновении утечки с помощью тестирования ее необходимо обнаружить в верхней части либо визуальным осмотром, либо одним из других методов, описанных в этой статье.

Испытание распылением

Испытание на разбрызгивание - это использование контролируемого потока воды, осаждаемого на компоненты здания способом, имитирующим нормальные и суровые погодные условия. Методы испытаний ASTM E1105 и AAMA 501.2 являются хорошими общими методами, обычно используемыми для испытания внешних стен, наклонного остекления и неглубоких скатных крыш для выявления источников утечки.В этой процедуре тестирования ASTM используется откалиброванная распылительная стойка с определенным давлением воды, форсунками и расстояниями для увлажнения стены водой со скоростью пять галлонов на квадратный фут в час. Между внутренней и внешней частью здания создается перепад давления, имитирующий ветер, и внутренняя часть проверяется на наличие утечек. Тестирование AAMA включает калиброванное распылительное сопло, которое подает воду с известной скоростью и давлением в очень ограниченные и определенные области.

Менее формальные испытания шлангов могут проводиться на горизонтальных и вертикальных участках с аналогичными результатами при условии, что распыление воды контролируется таким образом, чтобы смачивать только участки, предназначенные для испытаний.Испытание на распыление начинается с самой низкой отметки ниже зоны предполагаемой утечки. Путь отвода тестовой воды на нижних участках крыши или стен необходимо проверить, чтобы убедиться, что они не содержат места утечки. Если тестируется более высокая возвышенность, а более низкие промывочные зоны не проверяются, чтобы убедиться, что они водонепроницаемы, невозможно определить, куда поступала вода. После тестирования самых нижних областей, распыление направляется на все более высокие компоненты здания, при этом промывочная вода течет по компонентам на более низкой высоте, которые уже были протестированы.С помощью этой методики можно точно определить место входа в воду. После того, как место обнаружено, рекомендуется несколько раз начать и остановить утечку, изолировав и опрыскивая только предполагаемое нарушение, при этом по стене или крыше мало или совсем не стекает промывочная вода. Это снижает вероятность того, что нижние компоненты здания содержат брешь, которая позволяет проникнуть воде, и если задержка в обнаружении утечки может ошибочно показаться, что указывает на то, что компонент, расположенный выше, который проверяется через несколько минут в процессе испытания, позволяет воде течь. войти.

Этот тип тестирования может быть особенно эффективным, когда тестирование любым из других методов затруднено из-за ограничений доступа или состава сборки. Это может произойти, когда залив воды для испытания на наводнение нецелесообразен или наличие нескольких металлических проникновений затрудняет электрические испытания. (См. Фото 7 и 8) Кроме того, испытание распылением идеально подходит для получения быстрых и простых результатов, поскольку материалы и методы довольно просты и могут быть освоены довольно быстро.

Фото 7 и 8. Зоны, подходящие для испытаний на распыление

Наиболее важным ограничением испытаний на распыление является то, что утечка может за несколько часов смочить весь путь, прежде чем она будет обнаружена внутри. Кроме того, активация утечки может привести к большему повреждению внутренних компонентов / отделки, что может быть неприемлемо для владельца здания. Другими ограничениями испытаний на опрыскивание является то, что в период холодной погоды использование воды может быть непрактичным, а испытания на опрыскивание могут не воспроизводить все условия, т.е.е. направление, перепад давления и т. д., необходимые для повторного создания утечки.

Тестирование емкости

При испытании емкости используется электрическое поле для определения относительной влажности мембранного узла. Создается электрическое поле, и датчик затем считывает силу электрического поля, когда измеритель помещается над мембраной. Напряженность поля и чувствительность датчика могут быть изменены в зависимости от тестируемой подложки, чтобы получить показания, обеспечивающие наибольшие отклонения, оставаясь в пределах аналогового считывания или цифрового дисплея.Этот тип калибровки расходомера на каждой рабочей площадке обеспечивает наиболее точное обследование, которое может позволить оборудование.

Фото 9 и 10. Измерители емкости Tramex

Показания обычно снимаются в виде сетки с помощью портативного устройства и записываются, хотя можно снимать непрерывные показания с помощью некоторых измерителей, установленных на колесах. (см. Фото 9 и 10)

Этот метод тестирования является интерпретирующим, а не окончательным в том смысле, что он не определяет конкретно место разрыва мембраны, а скорее определяет участки с повышенным содержанием влаги, что в большинстве случаев может указывать на наличие разрыва.Однако это нарушение уже могло быть исправлено или отремонтировано, или это могло быть попадание воды в систему во время строительства. Оборудование не указывает на наличие утечки и не определяет ее местонахождение. Это просто указывает на то, что вода находится под мембраной. После завершения измерения исследуемой зоны испытания образцы должны быть взяты в точках с высокими и низкими показаниями, а их влажность точно установлена ​​путем лабораторных измерений после контролируемой сушки. Этот метод обеспечит корреляцию между показаниями счетчика и абсолютным содержанием влаги в сборке.Удаление дополнительных образцов в местах промежуточных показаний счетчика обеспечит более точную корреляцию между показаниями счетчика и фактическим содержанием влаги.

Подготовка и калибровка, необходимые для описанного выше испытания, могут показаться длительными и обременительными, поскольку результаты обследования доступны только после того, как будут предоставлены результаты лабораторного определения влажности. Однако квалифицированный техник может быстро откалибровать электрическое поле и датчик, чтобы получить относительные показания, которые предоставляют информацию, позволяющую нанести на карту области с повышенным содержанием влаги, прежде чем покинуть место проведения испытания.Знание участков с повышенным содержанием влаги позволяет определить участки, которые следует осмотреть с целью обнаружения бреши в мембране.

Могут быть случаи, в которых испытание емкости даст повышенные показания, которые не связаны с утечкой. Конденсация в системе изоляции крыши является типичным примером, в котором показания измерителя емкости будут повышены без связанной утечки через крышу как причины завышенных показаний.

Этот метод испытаний требует, чтобы испытательная мембрана была сухой, сборка была однородной по материалам и толщине, а в системе присутствовала вода для обеспечения дифференциальных показаний в относительно сухих и влажных областях.

Инфракрасная термография (IR)

Инфракрасная термография - это интерпретирующий метод тестирования, основанный на том принципе, что влажные и сухие компоненты здания имеют разную степень теплоотдачи и удержания тепла. Влажные материалы имеют значительно большую массу и медленную теплопередачу, что означает, что они набирают и теряют тепло медленнее, чем сухой образец того же материала. Эта физическая характеристика используется таким же образом, как и в тестировании емкости, описанном ранее, для количественной оценки местоположения влажных компонентов здания.Используемое испытательное оборудование, как правило, представляет собой портативную ИК-камеру с возможностью подключения записывающих устройств или содержащихся в устройстве, чтобы информация могла быть сохранена и представлена ​​в более позднее время в отчете. (см. Фото 11 и 12)

Фото 11 и 12. ИК-камера FLIR ThermaCAM ES и ИК-фото

Чаще всего инфракрасное изображение используется в вечерние часы после солнечного дня, когда внешняя часть здания, подвергающаяся воздействию солнца, становится теплее, чем температура окружающего воздуха из-за солнечного излучения.Величина этой разницы температур имеет прямое отношение к цвету и отражательной способности поверхности: чем темнее и менее отражающая поверхность, тем больше разница температур; или чем светлее цвет и выше отражательная способность поверхности, тем меньше будет разница температур. Как описано выше, коэффициент теплового увеличения при первоначальном воздействии солнца и коэффициент тепловых потерь при заходе солнца будет варьироваться между двумя участками одного и того же материала, которые имеют разное содержание влаги.Если инфракрасное изображение проводится после захода солнца, открытые участки крыши и стен с повышенным содержанием влаги сохранят значительно больше тепла, чем окружающие сухие участки. Эту разницу температур можно легко обнаружить с помощью ИК-сканирования. Предполагается, что участки с повышенной температурой внутри однородной конструкции крыши и стены связаны с присутствием влаги. Лабораторная сушка пробных срезов, снятых с участков с низкой, средней и высокой температурой, позволит провести калибровку ИК-изображения по абсолютной влажности строительных материалов.

Как и в случае емкостного сканирования, опытный исследователь может использовать области повышенной температуры, обнаруженные ИК-оборудованием, предположить, что это связано с повышенным содержанием влаги, и, таким образом, сконцентрировать подробные визуальные осмотры в этих областях, чтобы изолировать источник утечки.

Как и в случае с измерителем емкости, ИК-сканирование выявит участки влажной изоляции, которые могут быть вызваны конденсацией или другими проблемами, кроме повреждения мембраны крыши.

Препятствия к использованию ИК-излучения при обнаружении утечек заключаются в том, что сканирование обычно проводится в сумерках или ранним вечером и должно выполняться при благоприятных погодных условиях.После выявления участков с подозрением на повышенную влажность необходимо провести визуальный осмотр на предмет повреждения мембраны на следующий день в светлое время суток. Кроме того, необходимо сделать допущения в отношении таких элементов, как однородность материалов, толщина и внутренняя температура здания в сканируемых областях. Как и при тестировании емкости, ИК-оборудование не указывает на наличие утечки и не определяет ее местонахождение. Он просто предполагает, что разница температур вызвана присутствием воды под мембраной.

Ядерный счетчик

Тестирование ядерных счетчиков

- это также метод интерпретирующего тестирования, в котором используются относительные показания, которые интерпретируются для определения участков идентичных материалов подложки с различным содержанием влаги.

Ядерный счетчик испускает поток высокоскоростных нейтронов, которые сталкиваются с атомами водорода и отдают некоторую энергию, а затем отскакивают к измерительному устройству с меньшей скоростью. Следует помнить, что каждая молекула воды состоит из двух атомов водорода и одного атома кислорода.Затем измеритель регистрирует эти более медленные нейтроны и выдает цифровые показания по предварительно установленной калиброванной шкале. Считывание обычно занимает от семи до шестидесяти секунд каждое и выполняется в виде сетки, которая варьируется от трех футов до десяти футов в центре. (см. Фото 13 и 14)

Фото 13 и 14. Ядерный счетчик (желтый) и сетка на крыше

Как и в случае с другими интерпретирующими методами испытаний, испытательное оборудование должно быть откалибровано на каждой отдельной рабочей площадке, а также для различных сборок крыш и различных толщин в пределах одного объекта для получения точных результатов.Относительные показания снова могут быть использованы квалифицированным исследователем для обнаружения участков с предположительно влажными материалами, чтобы ограничить границы подробного визуального осмотра для определения источника утечки.

В отличие от метода ИК-сканирования, ядерные испытания могут проводиться в дневное время, чтобы обеспечить немедленную проверку, идентификацию и ремонт предполагаемых источников утечки.

Трудности с этим методом испытаний заключаются в том, что транспортировка радиоактивных материалов, содержащихся в счетчике, стала намного более сложной и интенсивной с 11 сентября 2001 года, а использование измерительного устройства, содержащего радиоактивный материал, может быть проблематичным из-за предполагаемой опасности часть населения и жителей здания.Как и в случае ИК и емкостных испытаний, источник или источники утечки должны быть визуально обнаружены в пределах области, которая определена как содержащая повышенные показания после завершения ядерных испытаний.

Опять же, оборудование не указывает на наличие утечки и не определяет ее местонахождение. Он просто выделяет места неоднородностей в количестве атомов водорода в определенных местах, которые предполагается или интерпретируются как вода.

Приложение

Методы испытаний, описанные выше, лучше всего подходят для проверки целостности или испытаний, которые должны проводиться сразу после установки кровельных или гидроизоляционных мембран.Эти методы испытаний также можно использовать для поиска утечек. Однако в случае гидроизоляции, покрытой перекрывающим слоем, процесс становится менее точным и более сложным, а следовательно, более дорогим.

, описанный выше. Они включают, но не ограничиваются:

Дополнительные ресурсы

WBDG

Руководства и спецификации

Руководство по проектированию ограждающих конструкций здания

Публикации

.

Пример Tensorflow для нормализации пакетов Keras | Кори Маклин

Машинное обучение - это такая активная область исследований, что вы часто можете увидеть официальные документы, на которые есть ссылки в документации библиотек. В следующей статье мы рассмотрим пакетную нормализацию, которая была описана Лоффе и Сегеди. Если вы из тех, кто любит получать информацию прямо из источника, просмотрите ссылку на их официальный документ.

Пакетная нормализация используется для стабилизации и, возможно, ускорения процесса обучения.Это достигается путем применения преобразования, которое поддерживает среднее значение активации, близкое к 0, и стандартное отклонение активации, близкое к 1.

На высоком уровне обратное распространение модифицирует веса, чтобы снизить значение функции стоимости. Однако, прежде чем мы сможем понять причины пакетной нормализации, очень важно понять фактическую математику, лежащую в основе обратного распространения ошибки.

Чтобы упростить задачу, предположим, что у нас есть нейронная сеть, состоящая из двух слоев, каждый с одним нейроном.

Мы можем выразить выход каждого нейрона с помощью следующих формул:

Где:

  • L = уровень в нейронной сети
  • w = вес, на который умножаются исходящие ребра нейрона
  • a = выход от нейрона в предыдущем слое (значение входящего фронта)
  • σ = функция активации
  • b = выход из нейрона смещения (значение входящего фронта)

Типичный пример функции стоимости составляет среднеквадратическая ошибка .Для отдельной выборки мы вычитаем фактическое значение (то есть y) из предсказанного значения и возводим результат в квадрат, чтобы учесть случаи, когда предсказанное значение больше или меньше фактического значения.

Как мы упоминали ранее, мы модифицируем веса, чтобы минимизировать функцию стоимости. Если бы мы построили график зависимости стоимости от отдельного веса, она была бы наименьшей в нижней части параболы.

Мы можем получить частную производную функции стоимости по весу, используя цепное правило в исчислении.

Частную производную каждого члена можно выразить следующим образом.

Обратите внимание, как мы используем производную функции активации.

Если мы используем сигмовидную функцию для нашей функции активации, то, если z (выход нейрона до функции активации) очень большой или очень маленький, производная будет приблизительно равна 0. Следовательно, когда мы переходим к вычислению градиента и обновлению весов, изменение будет настолько бесконечно малым, что модель не улучшится.Последняя известна как проблема исчезающего градиента t t.

Нормализуя выходной сигнал нейрона до того, как он войдет в функцию активации, мы можем гарантировать, что он остается близким к 0, где производная самая высокая.

Случайные процессы в природе имеют тенденцию следовать колоколообразной кривой, известной как нормальное распределение.

Среднее значение - это сумма всех точек данных, деленная на общее количество точек. Увеличение среднего значения смещает центр кривой формы колокола вправо, а уменьшение среднего значения смещает центр кривой формы колокола влево.С другой стороны, стандартное отклонение (квадратный корень из дисперсии) описывает, насколько далеко выборки отличаются от среднего. Увеличение стандартного отклонения расширяет кривую.

Чтобы нормализовать данные, мы вычитаем среднее значение и делим на стандартное отклонение.

Независимо от того, с какими данными мы работаем, после их нормализации среднее значение будет равно 0, а стандартное отклонение будет равно 1.

Примечание: это то же самое, что сказать, что это гарантирует, что дисперсия будет равно 1, поскольку стандартное отклонение равно квадратному корню из дисперсии.

Пакетная нормализация

Предположим, мы построили нейронную сеть с целью классификации изображений в оттенках серого. Интенсивность каждого пикселя в изображении в градациях серого варьируется от 0 до 255. Перед вводом в нейронную сеть каждое изображение будет преобразовано в одномерный массив. Затем каждый пиксель входит в один нейрон из входного слоя. Если выходной сигнал каждого нейрона передается сигмоидной функции, то каждое значение, отличное от 0 (то есть от 1 до 255), будет уменьшено до числа, близкого к 1.Поэтому перед обучением принято нормализовать значения пикселей каждого изображения. С другой стороны, пакетная нормализация используется для применения нормализации к выходным данным скрытых слоев.

Давайте посмотрим, как мы можем реализовать пакетную нормализацию в Python.

 импортировать matplotlib.pyplot как plt 
импортировать matplotlib.image как mpimg
plt.style.use ('dark_background') из keras.models импортировать Sequential
из keras.preprocessing.image импортировать ImageDataGenerator
из keras.Layers import BatchNormalization
из keras.layers import Conv2D, MaxPooling2D, Dense, Flatten
из keras.datasets import cifar10
from keras.utils import normalize, to_categorical

Набор данных cifar10 состоит из 60000 изображений размером 32 × 32 пикселей. 10 классов. Классы и соответствующие им стандартные целочисленные значения перечислены ниже.

  • 0: самолет
  • 1: автомобиль
  • 2: птица
  • 3: кошка
  • 4: олень
  • 5: собака
  • 6: лягушка
  • 7: лошадь
  • 8: корабль
  • 9: truck

Перед обучением нашей модели мы нормализуем входные данные по тем же причинам, перечисленным выше, и кодируем метки.

 (X_train, y_train), (X_test, y_test) = cifar10.load_data () X_train = normalize (X_train, axis = 1) 
X_test = normalize (X_test, axis = 1)
y_train = to_categorical (y_train)
y_test = to_categorical (y_test)

Чтобы улучшить способность нашей модели к обобщению, мы будем случайным образом сдвигать, переворачивать и увеличивать / уменьшать изображение.

 train_datagen = ImageDataGenerator (
shear_range = 0,2,
zoom_range = 0,2,
horizontal_flip = True
) train_datagen.fit (X_train) train_generator = train_datagen.flow (
X_train,
y_train,
batch_size = 32
)

Мы устанавливаем количество шагов, используя следующее уравнение, но мы могли бы использовать любое произвольное значение.

 steps = int (X_train.shape [0] / 64) 

Мы определяем функцию для построения моделей с и без использования пакетной нормализации, а также функцию активации по нашему выбору.

 def build_model (batch_normalization, активация): 
model = Sequential ()
model.add (Conv2D (32, 3, Activation = Activation, padding = 'same', input_shape = (32, 32, 3)))
если batch_normalization: model.add (BatchNormalization ())
model.add (Conv2D (32, 3, активация = активация, дополнение = 'то же', kernel_initializer = 'he_uniform'))
, если batch_normalization: model.add (BatchNormalization ())
model.add (MaxPooling2D ())
model.add (Conv2D (64, 3 , Activation = Activation, padding = 'same', kernel_initializer = 'he_uniform'))
, если batch_normalization: model.add (BatchNormalization ())
model.add (Conv2D (64, 3, активация = активация, padding = 'same', kernel_initializer = 'he_uniform'))
если batch_normalization: model.add (BatchNormalization ())
model.add (MaxPooling2D ())
model.add (Flatten ())
model.add (Dense (128, Activation = Activation, kernel_initializer = 'he_uniform'))
model.add (Dense (10, Activation = 'softmax')) return model

Чтобы подчеркнуть преимущества Используя пакетную нормализацию, мы собираемся обучить и сравнить производительность модели с и без использования пакетной нормализации.

 sig_model = build_model (batch_normalization = False, activate = 'sigmoid') 

Мы используем rmsprop в качестве нашего оптимизатора и категориальную кроссентропию в качестве функции потерь, поскольку мы пытаемся предсказать классы.

 sig_model.compile (
optimizer = 'rmsprop',
loss ='ategorical_crossentropy ',
metrics = [' precision ']
)

Затем мы обучаем нашу модель.

 sig_history = sig_model.fit_generator (
train_generator,
шагов_per_epoch = шаги,
эпох = 10,
validation_data = (X_test, y_test)
)
.

Объяснение нормализации веса и нормализации уровня (нормализация в глубоком обучении, часть 2)

Пакетная нормализация - одна из причин, по которым глубокое обучение добилось такого выдающегося прогресса в последние годы. Основываясь на его успехе, появились другие методы нормализации, такие как нормализация слоев и нормализация веса, которые также находят применение в этой области.

В этой серии публикаций предпринимается попытка дать целостное представление о методах нормализации в глубоком обучении.В предыдущем посте я говорил о пакетной нормализации и интуитивном понимании того, почему она улучшает производительность моделей глубокого обучения. В этом посте я обсуждаю ограничения пакетной нормализации, нормализации веса и нормализации уровня, которые являются недавно предложенными методами для преодоления этих ограничений.

1. Ограничения пакетной нормализации

Хотя пакетная нормализация - эффективный инструмент, она не лишена ограничений. Ключевым ограничением пакетной нормализации является то, что она зависит от мини-партии .

Если вы помните, пакетная нормализация вычисляет среднее значение и дисперсию каждого мини-пакета и нормализует каждую функцию в соответствии со статистикой мини-пакета. Это означает, что среднее значение и дисперсия будут отличаться для каждой мини-партии. Эта зависимость вызывает две основные проблемы:

1. Он устанавливает нижний предел для размера партии

Очевидно, что нормализация пакета не может использоваться, когда размер пакета равен 1, но даже немного большие размеры пакета могут вызвать проблемы. В идеале мы хотим использовать глобальное среднее значение и дисперсию для нормализации входных данных для слоя.Однако вычисление среднего значения для всего набора данных после каждого обновления сети слишком дорого. Вот почему мы, , оцениваем как среднее значение и дисперсию, используя статистику минипакетов. Тот факт, что среднее значение и дисперсия являются просто оценками, означает, что они содержат определенную ошибку и будут варьироваться от мини-партии к мини-партии. Меньшие размеры мини-партий увеличивают дисперсию этих оценок, а это означает, что мы должны быть особенно осторожны с размером партии при использовании SGD с нормализацией партии.

2. Это затрудняет применение пакетной нормализации к повторяющимся соединениям в повторяющейся нейронной сети

В рекуррентной нейронной сети периодические активации каждого временного шага будут иметь разную статистику. Это означает, что мы должны установить отдельный слой пакетной нормализации для каждого временного шага. Это усложняет модель и, что более важно, заставляет нас хранить статистику для каждого временного шага во время обучения.

Нижний предел размера пакета может быть проблемой в таких настройках, как онлайн-обучение (где отдельные примеры обрабатываются индивидуально) и обучение с подкреплением, которое очень чувствительно к шуму. Сложность применения пакетной нормализации к повторяющимся слоям - огромная проблема, учитывая, насколько широко используются повторяющиеся нейронные сети.

Учитывая, насколько мощна нормализация, очень жаль, что пакетную нормализацию нельзя использовать в определенных настройках.К счастью, некоторые выдающиеся исследователи разработали альтернативы пакетной нормализации, которые решают эти проблемы. Нормализация веса и уровня - это подходы к нормализации, в которых используется статистика, не зависящая от мини-пакета. Давайте рассмотрим их подробнее.

2. Нормализация веса

Нормализация веса - это метод, разработанный Open AI, который вместо нормализации мини-пакета нормализует веса слоя .

Нормализация весов изменяет параметры весов любого слоя в нейронной сети следующим образом:

Подобно пакетной нормализации, нормализация веса не снижает выразительную мощность сети.Что он делает, так это то, что отделяет норму весового вектора от его направления . Затем он оптимизирует оба и использует градиентный спуск. Это изменение в динамике обучения упрощает оптимизацию, как я объяснил в предыдущем посте.

Преимущества

За исключением того, что среднее значение и дисперсия не зависят от партии, нормализация веса часто намного быстрее, чем нормализация партии. В сверточных нейронных сетях количество весов, как правило, намного меньше, чем количество входных данных, а это означает, что нормализация весов дешевле в вычислительном отношении по сравнению с пакетной нормализацией.Пакетная нормализация требует прохождения всех элементов ввода, что может быть чрезвычайно затратным, особенно когда размерность ввода высока, например, в случае изображений. Свертки используют один и тот же фильтр в нескольких местах, поэтому пропускание весов происходит намного быстрее.

Хотя нормализация веса сама по себе может помочь в обучении, авторы статьи предложили использовать метод, называемый «нормализация партии только по среднему», в сочетании с нормализацией веса.Этот метод аналогичен пакетной нормализации, за исключением того, что он не делит входные данные на стандартное отклонение и не масштабирует их. Хотя этот метод противодействует некоторому ускорению вычислений при нормализации веса, он дешевле, чем пакетная нормализация, поскольку не требует вычисления стандартных отклонений. Авторы утверждают, что этот метод дает следующие преимущества:

1. Это делает среднее значение активаций независимым от

.

Нормализация весов независимо не может изолировать среднее значение активаций от весов слоя, вызывая высокоуровневые зависимости между средними значениями каждого слоя.Нормализация пакета только для средних значений может решить эту проблему.

2. Добавляет "более мягкий шум" к активациям

Одним из побочных эффектов пакетной нормализации является то, что она добавляет некоторый стохастический шум к активациям в результате использования зашумленных оценок, вычисленных для мини-пакетов. Это имеет эффект регуляризации в некоторых приложениях, но может быть потенциально вредным в некоторых областях, чувствительных к шуму, таких как обучение с подкреплением. Шум, вызываемый оценками среднего значения, однако, более «мягкий», поскольку закон больших чисел гарантирует, что среднее значение активаций распределено приблизительно нормально.

Экспериментальные результаты, представленные в документе, показывают, что нормализация веса в сочетании с пакетной нормализацией только на среднее дает наилучшие результаты на CIFAR-10, наборе данных классификации изображений. Подробные экспериментальные результаты см. В исходной статье.

3. Нормализация уровня

Нормализация слоев - это метод, разработанный Geoffery Hinton. По сравнению с нормализацией веса, нормализацию слоев немного сложнее понять интуитивно.

Чтобы понять нормализацию слоев, вспомните, что

.

Выбор правильных гиперпараметров для простого LSTM с помощью Keras | Карстен Экхардт

Фото Мика Баумейстер на Unsplash

Создание моделей машинного обучения никогда не было таким простым, и многие статьи дают отличный общий обзор того, что такое Data Science и удивительные вещи, которые она может делать, или подробно излагают действительно меньшая деталь реализации. Это заставляет честолюбивых специалистов по данным, как и я некоторое время назад, часто смотреть на ноутбуки и думать: «Это выглядит великолепно и работает, но почему автор выбрал этот тип архитектуры / количества нейронов или эту функцию активации вместо другой? В этой статье я хочу дать некоторую интуицию о том, как принимать некоторые решения, такие как поиск правильных параметров при построении модели, продемонстрированной на очень простом LSTM для прогнозирования пола по заданному имени.Поскольку существует множество отличных курсов по математике и общим концепциям повторяющихся нейронных сетей (RNN), например Эндрю Нг специализируется на глубоком обучении или здесь, на Medium, я не буду углубляться в них и воспринимать эти знания как данность. Вместо этого мы сосредоточимся только на высокоуровневой реализации с использованием Keras. Цель состоит в том, чтобы получить более практическое представление о решениях, которые необходимо принять при построении такой нейронной сети, особенно о том, как выбрать некоторые из гиперпараметров.

Полную статью с кодом и выводами можно найти на Github в виде блокнота.

На Keras: последняя версия с момента появления поддержки TensorFlow в 2017 году, Keras произвела огромный фурор как простой в использовании и интуитивно понятный интерфейс в более сложные библиотеки машинного обучения. В результате построение настоящей нейронной сети, а также обучение модели будут самой короткой частью в нашем скрипте.

Первым шагом является определение типа сети, которую мы хотим использовать, поскольку это решение может повлиять на наш процесс подготовки данных. Порядок символов в любом имени (или слове) имеет значение, а это означает, что если мы хотим проанализировать имя с помощью нейронной сети, логическим выбором будет RNN.Сети с долгосрочной краткосрочной памятью (LSTM) - это особая форма RNN, которые особенно эффективны, когда дело доходит до поиска правильных функций, когда цепочка входных блоков становится длиннее. В нашем случае входными данными всегда является строка (имя), а выходными данными - вектор размером 1x2, указывающий, принадлежит ли имя мужчине или женщине.

После принятия этого решения мы начнем с загрузки всех пакетов, которые нам понадобятся, а также набора данных - файла, содержащего более 1,5 млн немецких пользователей с их именем и полом, в кодировке f для женщин и m для мужчин.

Предварительная обработка данных

Следующим шагом в любой обработке естественного языка является преобразование ввода в машиночитаемый векторный формат. Теоретически нейронные сети в Keras могут обрабатывать входные данные переменной формы. На практике работа с фиксированной длиной ввода в Keras может заметно улучшить производительность, особенно во время обучения. Причина такого поведения в том, что эта фиксированная входная длина позволяет создавать тензоры фиксированной формы и, следовательно, более стабильные веса.

Сначала мы конвертируем каждое (первое) имя в вектор. Мы будем использовать метод так называемого One-Hot Encoding.
Здесь каждое слово представлено вектором из n двоичных субвекторов, где n - количество различных символов в алфавите (26 при использовании английского алфавита). Причина, по которой мы не можем просто преобразовать каждый символ в его позицию в алфавите, например a - 1, b - 2 и т. д.) заключается в том, что это приведет к тому, что сеть будет полагать, что символы находятся в порядковой шкале, а не в категориальной шкале - буква Z «не стоит больше», чем A .

Пример:
S становится:
[0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

привет становится:
[[0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
[0, 0, 0, 0, 1, 0, 0, 0, 0 , 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
[0, 0 , 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ],
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]

Теперь, когда мы определили, как должен выглядеть ввод, нам нужно принять два решения: какой длины должен быть вектор символов (сколько разных символов мы разрешаем) и как долго должен быть вектор имени (сколько символов мы хотим посмотреть).Мы допустим только самые распространенные символы в немецком алфавите (стандартный латинский + öäü) и дефис, который является частью многих старых имен.
Для простоты мы установим длину вектора имени равной длине самого длинного имени в нашем наборе данных, но с 25 в качестве верхней границы, чтобы гарантировать, что наш входной вектор не станет слишком большим только потому, что один человек сделал ошибка при вводе имени в процесс.

Scikit-learn уже включает алгоритм One Hot Encoding в свою библиотеку предварительной обработки.Однако в этом случае из-за нашей особой ситуации, когда мы не конвертируем метки в векторы, а разделяем каждую строку на ее символы, создание настраиваемого алгоритма казалось более быстрым, чем предварительная обработка, необходимая в противном случае.

Было показано, что массивам Numpy требуется примерно в 4 раза меньше памяти по сравнению со списками Python. По этой причине мы используем понимание списка как более питонический способ создания входного массива, но уже преобразуем каждый вектор слова в массив внутри списка.При работе с массивами Numpy мы должны убедиться, что все списки и / или массивы, которые объединяются, имеют одинаковую форму.

Теперь, когда у нас есть готовые данные, мы можем приступить к построению нашей нейронной сети. Мы уже определились с моделью (LSTM). В Keras мы можем просто наложить несколько слоев друг на друга, для этого нам нужно инициализировать модель как Sequential () .

Выбор правильного количества узлов и слоев

Не существует окончательного, определенного практического правила о том, сколько узлов (или скрытых нейронов) или сколько слоев следует выбрать, и очень часто метод проб и ошибок дает вам лучшие результаты для вашей индивидуальной проблемы.Наиболее распространенной структурой для этого, скорее всего, является k-кратная перекрестная проверка. Однако даже для процедуры тестирования нам нужно выбрать некоторое ( k ) количество узлов.
Следующая формула может дать вам отправную точку:

Nᵢ - количество входных нейронов, Nₒ - количество выходных нейронов, Nₛ - количество выборок в обучающих данных, а α представляет собой коэффициент масштабирования, который обычно составляет от 2 до 10. Мы можем вычислить 8 различных чисел, чтобы ввести их в нашу процедуру валидации и найти оптимальную модель на основе итоговых потерь валидации.

Если проблема проста и время возникло, есть несколько других правил большого пальца для определения количества узлов, которые в основном просто основаны на входных и выходных нейронах. Мы должны помнить, что, хотя они и просты в использовании, они редко дают оптимальный результат. Вот только один пример, который мы будем использовать для этой базовой модели:

Как уже упоминалось, такая же неопределенность в отношении количества существует и для количества используемых скрытых слоев. Опять же, идеальное число для каждого конкретного варианта использования будет другим, и его лучше всего определять, сравнивая разные модели друг с другом.Как правило, двух слоев достаточно для обнаружения более сложных объектов. Чем больше слоев, тем лучше, но их труднее тренировать. Как правило, один скрытый слой работает с такими простыми задачами, как эта, а два достаточно, чтобы найти достаточно сложные функции.
В нашем случае добавление второго слоя улучшает точность только на ~ 0,2% (0,9807 против 0,9819) после 10 эпох.

Выбор дополнительных гиперпараметров

Каждый уровень LSTM должен сопровождаться слоем Dropout.Этот слой поможет предотвратить переобучение, игнорируя случайно выбранные нейроны во время обучения, и, следовательно, снижает чувствительность к удельным весам отдельных нейронов. 20% часто используется как хороший компромисс между сохранением точности модели и предотвращением переобучения.

После того, как наш слой (слои) LSTM выполнил всю работу по преобразованию входных данных, чтобы сделать возможными прогнозы в направлении желаемого результата, мы должны уменьшить (или, в редких случаях, расширить) форму, чтобы она соответствовала желаемому результату. В нашем случае у нас есть две метки вывода, и поэтому нам нужны устройства с двумя выводами.

Последний слой, который нужно добавить, - это слой активации. Технически это можно включить в слой плотности, но есть причина разделить его. Хотя здесь это не имеет значения, разделение слоя плотности и слоя активации позволяет получить уменьшенный выходной сигнал слоя плотности модели. Какую функцию активации использовать, опять же, зависит от приложения. Для нашей задачи у нас есть несколько классов (мужской и женский), но только один из классов может присутствовать одновременно.Для этих типов проблем, как правило, лучше всего работает функция активации softmax, потому что она позволяет нам (и вашей модели) интерпретировать результаты как вероятности.

Функция потери и функция активации часто выбираются вместе. Использование функции активации softmax указывает нам на кросс-энтропию в качестве нашей предпочтительной функции потерь или, точнее, на двоичную кросс-энтропию, поскольку мы сталкиваемся с проблемой двоичной классификации. Эти две функции хорошо работают друг с другом, потому что функция кросс-энтропии компенсирует плато на каждом конце функции soft-max и, следовательно, ускоряет процесс обучения.

Для выбора оптимизатора было показано, что адаптивная оценка момента, сокращенно _Adam_, хорошо работает в большинстве практических приложений и работает с небольшими изменениями гиперпараметров. И последнее, но не менее важное: мы должны решить, после какой метрики мы будем судить о нашей модели. Керас предлагал несколько функций точности. Во многих случаях оценка производительности моделей с точки зрения общей _ точности_ будет наиболее простым для интерпретации вариантом, а также достаточным для оценки производительности модели.

Построение, обучение и оценка модели

После получения некоторой интуиции о том, как выбирать наиболее важные параметры, давайте соберем их все вместе и обучим нашу модель:

Результат обучения

Точность 98,2% впечатляет и, скорее всего, будет результат того факта, что большинство имен в наборе проверки уже присутствовало в нашем наборе тестов. Используя наш набор для проверки, мы можем быстро взглянуть на то, где наша модель приходит к неверному прогнозу:

Выходные данные проверки модели

Глядя на результаты, по крайней мере, некоторые из ложных прогнозов, похоже, происходят для людей, которые вводили свою фамилию в поле имени.Видя это, кажется, следующий хороший шаг - очистить исходный набор данных от этих случаев. На данный момент результат выглядит многообещающим. С той точностью, которую мы можем достичь, эту модель уже можно использовать во многих реальных ситуациях. Кроме того, обучение модели для большего количества эпох может повысить ее производительность, здесь важно следить за производительностью набора для проверки, чтобы предотвратить возможное переоснащение

Заключительные мысли

В этой статье мы успешно построили небольшую модель для прогнозирования пол от данного (немецкого) имени с точностью более 98%.Хотя Керас освобождает нас от написания сложных алгоритмов глубокого обучения, нам все равно приходится делать выбор в отношении некоторых гиперпараметров на этом пути. В некоторых случаях, например, Выбирая правильную функцию активации, мы можем полагаться на правила большого пальца или можем определить правильный параметр на основе нашей проблемы. Однако в некоторых других случаях лучший результат будет после тестирования различных конфигураций с последующей оценкой результата.

.

Смотрите также