Internet of Things (IoT) предлагает инженерам и разработчикам инновационный способ сбора данных и наблюдения за состоянием их продуктов, услуг или оборудования в полевых условиях. Однако совсем недавно компания IBM сообщила, что почти 90% информации, собираемой через IoT-экосистемы, остается неиспользованной в мертвом море данных. К счастью, одновременно с IoT активно развиваются технологии и алгоритмы машинного обучения, которые могут предотвратить стагнацию в этих застойных озерах данных и вместо этого превратить их в здоровую экосистему полезной информации. Работая с большими данными в алгоритмами машинного обучения, инженеры теперь могут вдохнуть новую жизнь в свои разработки, операции, производство и многое другое.

Дункан Стюарт, директор по исследованиям в Deloitte Canada, объясняет, что существует пять основных тенденций, которые определяют направление развития индустрии машинного обучения. В то же время, эти тенденции предлагают широкие возможности для интеграции машинного обучения и IoT.

1. Рост мобильного машинного обучения 

Самая большая тенденция, которая, безусловно, повлияет на сферу IoT, — уменьшение аппаратных чипов. Стюарт отмечает, что большинство выпущенных в этом году флагманских смартфонов будут включать в себя чипы со встроенными нейронными сетями (напирмер, Apple A11).

Безусловно, эти чипы не будут такими же мощными, как их собратья на основе облачных вычислений, но тем не менее, они будут способны выполнять многие задачи машинного обучения.

«По мере того, как технология становится популярной на мобильных устройствах, через несколько лет она будет мигрировать в IoT», — сказал Стюарт. «Мы уже видели, как некоторые чипы для смартфонов, разработанные Qualcomm, внедряются в интеллектуальные маршрутизаторы, пожарные стены, беспилотные аппараты и устройства IoT».

На данный момент самыми большими препятствиями при внедрении чипов для машинного обучения на IoT-устройствах являются цена, энергопотребление и размер.

Что касается цены, Стюарт сообщает, что сейчас стоимость работы алгоритмов машинного обучения в облаке намного дешевле (подробнее об этом далее), чем стоимость чипа на борту устройства. Но всё чаще у инженеров появляется потребность во внедрении именно бортовых чипов, так как при решении некоторых задач очень важным становится вопрос задержки ответа при вычислениях. «Подумайте о беспилотнике, который должен летать вблизи линий электропередач», говорит Стюарт. «Дрону нужно видеть линии, рассчитывать расстояние до них и определять в реальном времени безопасную зону полёта, тем самым приводя в действие двигатели в течение нескольких десятых секунды». В таких ситуациях облачные вычисления могут не спасти, потому что необходим моментальный ответ от сервера при расчётах, и здесь бортовой чип является идеальным и единственно верным на данный момент решением.

Что касается энергоэффективности и размеров чипов, то тут ведутся масштабные исследования, направленные на разработку чипов меньшего размера с низким энергопотреблением (где мощность измеряется в микроваттах). Такие чипы будут идеальным решением для постоянно подключенных и работающих IoT-устройств.

К сожалению, чипы с ультранизким энергопотреблением все еще находятся в разработке и будут применяться в боевых проектах только через несколько лет. Кроме того, их возможности значительно сократятся, поэтому менее приоритетные для проектов вычисления скорее всего будут продолжать выполняться в облаке. Пока что все IoT-устройства, которые используют встроенные чипы для машинного обучения, требуют аккумулятора с большой емкостью, такого, например, как в смартфоне.

2. Специалисты по анализу данных теперь могут отвлечься от IoT

Еще одна тенденция в машинном обучении, которая, по мнению Стюарта, повлияет на рынок IoT, заключается в том, что многие утомительные задачи в области анализа данных или в ближайшем будущем будут или уже автоматизированы при помощи новых разработок программного обеспечения.

Такие задачи, как очистка данных, удаление тривиальных ошибок и выброс ненужных данных, составляют значительную часть повседневной работы специалистов по анализу данных. Эти задачи повторяются, подвержены влиянию человеческого фактора и занимают много времени, поэтому они должны быть автоматизированы.

«Восемьдесят процентов этих задач можно автоматизировать», — утверждает Стюарт. «Это не значит увольнять специалистов, которые сейчас пользуются большим спросом. Это просто означает, что специалисты в области анализа данных больше не будут тратить своё время на рутинные задачи». «Нынешнее ограничение для машинного обучения в IoT заключается в том, что большую часть времени сотрудники были заняты другими задачами, например, автоматизацией процессов анализа», — добавил Стюарт. «Теперь, когда программное обеспечение автоматизирует большую часть их рутинной работы, специалисты по анализу данных могут сосредоточиться на IoT-приложениях».

3. Синтетические данные развивают машинное обучение в IoT-системах быстрее

Другим трендовым инструментом, который IoT-специалисты должны держать на готове, является идея синтетических данных.
Для создания алгоритма машинного обучения пользователям нужен большой объем данных. Конечно, у вас уже может быть такой объем, накопившийся за годы сбора данных с устройств. Тем не менее, вы можете так же легко создать начальный датасет из «синтетических» данных.

Стюарт объясняет, что специалисты могут использовать данные, похожие на данные, необходимые для начала обучения их алгоритма машинного обучения.

«Синтетические данные смешиваются с реальными; это полезно в IoT-приложениях, где пока нет большого объема «живых» данных», — сказал Стюарт.

Это означает, что специалисты по IoT могут разрабатывать системы, в которых они хотят немедленно использовать алгоритмы машинного обучения. Им просто нужно найти или создать синтетические данные, чтобы начать работу.

4. Новые чипы для машинного обучения сокращают затраты

Стюарт отмечает, что существует несколько новых чипов для машинного обучения, которые делают его намного более доступным. Традиционно в этом пространстве доминировали графические процессоры (GPU), ведь машинное обучение гораздо больше подходит для параллельной обработки на графических процессорах, по сравнению с последовательной обработкой на центральных процессорах (CPU).

Тем не менее, программируемые пользователем вентильные матрицы (FPGA) и специализированные интегральные схемы (ASIC) стали популярными для центров обработки данных, ориентированных на машинное обучение. Стюарт отмечает, что эти инструменты облегчат машинное обучение и сделают его  более доступным.

5. IoT-системы практически не подвержены влиянию «черного ящика» машинного обучения

Дискуссия о том, что алгоритмы машинного обучения являются по сути черным ящиком, к сожалению, мешает технологии сделать прорыв во многих отраслях. Люди действительно не понимают, как это работает. Они просто знают, как строить системы машинного обучения. Мы собираем данные, счищаем их, обрабатываем, рекурсивно представляем в нейронную сеть во время цикла обучения, а затем берем тот цикл, который по нашему мнению готов для вывода конечного результата.

Результирующий алгоритм не был запрограммирован сам по себе — он развился в итоговую модель через обучение. Следовательно, сейчас эти алгоритмы недостаточно понятны или недостаточно объяснены людям. Стюарт замечает, что это может быть большим препятствием для тех, кто пытается реализовать машинное обучение, например, в медицинском устройстве. Хотите создать чипы для машинного обучения, которые могут жить в человеческом теле? Вы столкнетесь с большими сложностями, потому что никто не понимает, как это работает.

Хотите убедить FDA принять это приложение машинного обучения, когда оно по сути является черным ящиком даже для изобретателя? Удачи.

Стюарт объясняет, что для большинства IoT-приложений преимущество заключается в том, что они не подвержены этому ограничению черного ящика по той причине, что для многих руководителей высшего уровня, внутренняя работа их продуктов уже является черным ящиком. Это также можно сказать о большинстве потребителей IoT-устройств.

Насколько трудно IoT-компаниям заставить своих клиентов покупать черные ящики? Мы думает, что это не должно быть слишком сложно.

Добавить комментарий