Искусственный интеллект из облака

Новости

29.07.2020

SberСloud предлагает разработчикам систем искусственного интеллекта облачную платформу AI Cloud, обеспечивающую доступ к Christofari, самому мощному суперкомпьютеру России.

Искусственный интеллект и нейронные сети
 
Различие в смысловом наполнении терминов «искусственный интеллект» (artificial intelligence, AI, ИИ) и «машинное обучение» (machine learning, ML, МО) с каждым годом становится все тоньше, и, пожалуй, в наши дни это различие скорее ситуативное: то, что разработчики и дата-сайентисты называют моделями машинного обучения, для бизнес-пользователей – искусственный интеллект. Структура моделей ИИ может быть принципиально разной, но их объединяет то, что все они содержат миллионы или миллиарды параметров, которые не были запрограммированы вручную, а подбирались автоматически в процессе обучения на основе большого набора данных. 
 
В основном модели ИИ разрабатываются для точечной автоматизации узкого класса творческих задач, с которыми раньше эффективно справлялись исключительно люди, однако иногда появляются прорывные решения, которые на долгие годы определяют направления развития ИИ. В 2012 году таким прорывом стало возникновение сверточных нейронных сетей, положивших начало целому классу задач визуального распознавания объектов (AlexNet, 60 млн параметров). Прорыв 2020 года – появление модели GPT-3 (175 млрд параметров), которая решила задачу генерации осмысленного текста, неотличимого от текста, написанного человеком.
 
Одно из самых перспективных направлений ML – обучение с подкреплением (reinforcement learning, RL). В этом случае система обучается, взаимодействуя с некоторой средой, а не с заранее заданным набором данных, и среда на каждое действие системы дает ответную реакцию. Победить человека в компьютерных играх, научиться безопасно управлять автомобилем или дроном, определить оптимальную 3D-структуру белка, решить задачу комбинаторной оптимизации распределения ресурсов в бизнесе и посадить ракету-носитель на платформу – это все результаты, которых достигли системы RL.
 
Обучение современных моделей, будь то распознавание видеопотока, генерация текста, управление роботами или любой другой ресурсоемкий сценарий, требует десятков или сотен GPU-месяцев, что, в свою очередь, предъявляет высокие требования к вычислительной инфраструктуре. Компании, столкнувшиеся с этим, видят спасение в использовании высокопроизводительных облачных ИИ-сервисов. 
 
От легкого к сложному
 
Относительно легкие сценарии применения ИИ, когда вычисления можно было проводить на обычных компьютерах, в большинстве своем уже реализованы, в том числе в виде готовых рыночных решений. На нынешнем уровне развития ИИ пришло время переходить к сложным ресурсоемким решениям. В первую очередь, это относится к обработке видеопотока в реальном времени. Например, к автоматической проверке того, носят ли работники на производстве каски и перчатки, находятся ли они в безопасной зоне. Или в сегодняшних условиях – носят ли люди маски и соблюдают ли социальную дистанцию, там, где это требуется.
 
Еще одно перспективное направление – Natural Language Processing (NLP) – обработка натурального языка, решение задач, связанных с генерацией текста и речи. ИИ уже создает тексты на заданную тему, причем в требуемой стилистике и даже в стихах. Творческие задачи и приемы, которые раньше считались неавтоматизируемыми, все чаще становятся доступными ИИ.
 
Очевидно, что NLP востребована в бизнесе. В компаниях накапливаются объемные базы неструктурированных знаний и большие наборы текстовых документов. При помощи ИИ данные можно изучить, а затем, не занимаясь поиском документов в архивах, задавая голосом вопросы, получать осмысленные ответы, причем тоже в звуковом формате. Такой помощник быстро и удобно предоставит нужную информацию и подскажет, что делать. 
 
В этом году для NLP появились такие модели, как GPT-3 и Longformer, предназначенные для работы с длинными текстами. Их тоже невозможно обучить на обычных компьютерах, для этого требуются вычислительные ресурсы, эквивалентные десяткам и сотням мощных графических процессоров.
 
Как перейти к использованию ИИ?
 
ИИ для бизнеса не самоцель, а способ повышения прибыли, эффективности или безопасности работы предприятия. Чтобы выбрать технологии ИИ для обработки накопленных на предприятии данных, требуется исходя из поставленной задачи изучить имеющиеся на рынке решения и успешные сценарии их применения. С этой целью разумно сформировать кроссфункциональную команду, состоящую из представителей операционного бизнеса, ИТ-служб и дата-сайентистов.
 
Целесообразно обеспечить дата-сайентистов компании доступом к данным по клику, и для этого лучше всего подходят облачные решения. Например, SberCloud в рамках своей платформы SberCloud.Advanced предлагает все виды хранения данных, включая неструктурированные, и для этих целей предоставляет услуги озера данных компании (Data Lake Insight) и средства анализа Big Data. Озера данных дают дата-сайентистам возможность проводить эксперименты, анализировать данные, находить в них закономерности, обучать модели и разрабатывать на их основе продукты и сервисы.
 
 
Для углубленной работы с данными SberCloud предлагает облачную платформу AI Cloud, сервисы которой позволяют решать задачи машинного обучения, в том числе с помощью нейронных сетей. AI Cloud опирается на вычислительные ресурсы самого мощного в России и СНГ суперкомпьютера Christofari, имеющего эффективную производительность 6,7 петафлопс (согласно тесту Linpack). Christofari расположен в ЦОДе Сбербанка в Сколково и содержит больше тысячи объединенных высокоскоростными соединениями графических процессоров, которые могут быть использованы для параллельного обучения моделей.
 
При этом клиенты развертывают и обучают модели в облаке в удобном для них интерфейсе. Дата-сайентисты одним нажатием кнопки размещают обученную модель в облаке так, чтобы к ней можно было делать запросы и получать ответы, либо интегрируют в существующие корпоративные информационные системы и бизнес-приложения компании.
 
Встраивать обученные модели в технологические цепочки предприятий помогает публичная облачная платформа SberCloud.Advanced, предоставляющая 40 IaaS и PaaS сервисов. В числе этих сервисов – балансировка нагрузки (Elastic Load Balance, ELB), распределяющая запросы к обученной модели между виртуальными машинами (инстансами), и сервис автоматического масштабирования ресурсов (Auto Scaling, AS), особенно полезный при пиковых нагрузках.
 
Примером использования AI Cloud может служить недавно появившаяся система диагностирования пневмонии, в том числе вызванной COVID-19, по снимкам компьютерной томографии. Разработанная специалистами Группы Сбербанк модель, выделяет на компьютерной томограмме изменения в легких, определяет их объем и характер, что важно для установления тяжести заболевания. Отметим, что ИИ не заменяет человека, в данном случае врача, а ускоряет процесс диагностики и дает «второе мнение», помогающее принять правильное решение.
 
Илья Сулейманов, руководитель департамента технологического консалтинга, SberCloud
https://sbercloud.ru