?

Log in

No account? Create an account
 
 
23 February 2018 @ 06:46 pm
Информационно-аналитические инструменты на службе цифровой трансформации (I часть)  
Необходимость и ценность современных информационно-аналитических инструментов (ИАИ) для цифровой трансформации государства и бизнеса не вызывают сомнений. А вот какими должны быть эти инструменты с учетом последних трендов, какие технологии следует разработать для их создания и какие организационные и кадровые вопросы нужно решить, чтобы они эффективно заработали, — на этот счёт единого мнения пока нет. Для обсуждения данной темы мы пригласили экспертов из ведущих компаний и организаций.

Цифровая трансформация и новые технологии

Большие данные, Интернет вещей (IoT), бизнес-аналитика, машинное обучение и искусственный интеллект (ИИ) — все эти технологии неразрывно связаны друг с другом: например, IoT генерирует огромные объемы данных, на которых проходит машинное обучение искусственного интеллекта, применяемого для решения многих аналитических задач. Каким образом эти и другие новые технологии уже сегодня могут быть использованы в России для целей цифровой трансформации государства и бизнеса?

Как утверждает заместитель начальника управления информационных технологий Аналитического центра при Правительстве РФ Анатолий Карпенко, все перечисленные технологии уже используются отечественными госструктурами и в гораздо большей степени — бизнесом. В госсекторе наиболее активно их применяют фискальные органы. Так, в ФНС России создана и введена в штатную эксплуатацию автоматизированная система контроля за уплатой НДС (АСК НДС-2), использующая средства оперативного мониторинга процессов, технологию больших данных и инструменты современной аналитики, что помогло существенно повысить налоговые сборы. По данным ведомства, в первом полугодии 2017-го они выросли на 16% по сравнению с аналогичным периодом предыдущего года.

Руководитель направления современных ECM-решений компании ЭОС Сергей Полтев полагает, что у этих технологий хорошие перспективы в таких областях, как оптимизация транспортных потоков, модернизация ЖКХ и поэтапное внедрение концепции «Умный город».

«Информационные системы призваны автоматизировать рутинные операции, связанные с извлечением и обработкой данных, и обеспечить людей ценной информацией, которая в этих данных хранится, — убеждена директор компании „Терн“ Екатерина Лозовая. — Что касается отдельных способов выполнения этой задачи: нейронных сетей, анализа больших данных, предиктивой аналитики, то они представляют собой конкретные подходы, которые нужно применять в разных ситуациях. Возьмём, к примеру, блокчейн: он позволяет упростить процесс регистрации сделок и обеспечить всех участников рынка единой версией информации. В бизнесе эту технологию активно применяют банки и биржи, а что касается государственных учреждений, то потенциально блокчейн может взять на себя функции любого регистрирующего органа».

«По подсчётам аналитиков, только 20% российских компаний уже работают с большими данными, 17% начинают пилотные проекты, а 27% не выражают к ним особого интереса, — напоминает директор по продажам компании PROMT Никита Шаблыков. — В то же время за рубежом уже есть результаты применения больших данных в бизнесе. Например, опрос Economist Intelligence Unit Survey показал, что только в 2015 г. по всему миру 46% компаний улучшили за счет этого качество клиентского сервиса более чем на 10%. В России большие данные используются в основном в банковской, телекоммуникационной сфере и в ритейле, что объясняется главным образом высокой конкуренцией в этих отраслях. Перед владельцами бизнеса, в какой бы отрасли они ни работали, рано или поздно встают вопросы: как лучше понять клиента и его проблемы, как оперативно анализировать данные о клиентах, о покупках, которые они совершают, об их потенциальных интересах и как использовать полученную информацию для прогнозов и планирования?».

По мнению менеджера проектов по маркетингу и SEO компании Mindscan Веры Холодной, одна из целей подобных технологий — по-новому взглянуть на проблемы, которые раньше казались непреодолимыми. Можно ведь эффективно использовать ИИ вместе с другими алгоритмами. Например, при построении чат-бота, для создания системы поиска злоумышленников в потоке людей, для анализа существующих автоматизированных процессов...

Генеральный директор компании Polymedia Елена Новикова обращает внимание на новые возможности автоматизации различного вида производств. Сегодня вследствие резкого удешевления сенсоров, которые могут быть развернуты на полевом уровне для сбора первичных данных о параметрах производственных процессов, а также благодаря упрощению способов передачи большого количества данных, в том числе с удаленных локаций через беспроводные сети, снижению стоимости хранения больших объемов данных и доступности решений по их продвинутому анализу предприятия реального сектора получают инструмент, кардинальным образом влияющий на эффективность бизнеса. Это и снижение затрат на все виды энергии, необходимые предприятиям, и повышение стабильности при выпуске высококачественной продукции на технологически сложных производствах, и оптимизация численности обслуживающего персонала.

При этом могут собираться данные не только о параметрах технологических процессов. В любом производстве человек по-прежнему играет ключевую роль, и современные способы сбора информации и ее анализа позволяют анализировать и предсказывать поведение и действия работника по отношению к сложным и дорогостоящим технологическим процессам. Если состояние оператора сложной технологической установки перед допуском к работе с ней или во время работы будет распознано системой как неудовлетворительное, то незамедлительно последует рекомендация о замене сотрудника, не доводя дела до выпуска бракованной партии или до крупной аварии.

Елена Новикова убеждена, что промышленный IoT совместно с современными аналитическими инструментами позволит оптимизировать существующие процессы производства без значительных капитальных вложений. В тех же случаях, когда таковые вложения необходимы, эти средства дадут возможность максимально точно прогнозировать, а впоследствии контролировать их окупаемость и эффективное использование.

«Когда речь заходит о Big Data, важны не только объемы, но и разнообразие данных, в том числе неструктурированных», — напомнил Никита Шаблыков. По его словам, автоматический перевод — это один из самых удачных шагов в коммерциализации технологий ИИ, которые успешно применяются практически во всех сферах бизнеса — для перевода деловой и технической документации, для локализации контента (сайты, отзывы, магазины, пользовательская документация), для делового общения. И если до появления больших данных системы автоматического перевода строились на основе аналитических методов и разработка одной языковой пары занимала не один год, то сейчас имеются возможности для развития технологий перевода на основе статистических методов, в том числе нейронных сетей.

«Что касается текстовой аналитики, то понимание, как и для каких целей могут быть использованы такие данные, и у бизнеса, и у госсектора пока еще продолжает формироваться. Тем не менее интерес и потребность есть, например, со стороны СМИ и крупных компаний: для анализа брендов, персон, высказываний, рубрикации обращений в службу поддержки, составления автоматических отчётов по искомому объекту, — отметил Никита Шаблыков. — Технологии ИИ позволяют также решать многие вопросы, касающиеся безопасности. В первую очередь речь здесь идет о распознавании лиц для контроля и обеспечения охраны предприятий, торговых центров и аэропортов. Лингвистические технологии используются в системах DLP для выделения конфиденциального или подозрительного контента во входящих и исходящих данных. Информация из социальных сетей может служить основой для прогнозирования перспектив тех или иных кандидатов на выборах, для анализа настроений в обществе и реакции населения на значимые события».

Технологии искусственного интеллекта для обработки информации на естественных языках

Юлия Епифанцева, директор по развитию PROMT:

Глобальный характер бизнеса и госструктур, экспонентный рост информации на разных языках создают все условия для развития технологий автоматической обработки текстов на естественных языках. Сегодня технологии искусственного интеллекта (ИИ) в области лингвистики используются для решения нескольких типовых задах по автоматизации документооборота:

Перевод рабочих документов

Перевод документов целиком с сохранением оригинальной структуры и форматирования востребован во всех отраслях и сферах деятельности бизнеса и государства. Интеграция функций перевода с СЭД оптимизирует работу отделов переводов, повышает эффективность сотрудников, так как информация на любых языках становится доступной в режиме реального времени. И главное, компания уменьшает риск утечки конфиденциальной информации, отказавшись от использования для перевода публичных облачных сервисов.

Локализация документации по продуктам

Здесь прежде нужно назвать ИТ-индустрию, так как именно в этой отрасли всегда актуален выпуск новых версий продуктов, затрагивающий обновление сопутствующей документации на нескольких языках в короткие сроки. Благодаря автоматическому переводу расходы на перевод уменьшаются на 15-20% и ускоряется процесс подготовки документации.

Перевод в мессенджерах для рабочей коммуникации

Глобальные компании, в которых работает персонал из разных регионов, остро нуждаются в средствах, упрощающих коммуникацию между центральным офисом и дочерними предприятиями. Автоматический перевод, интегрированный в корпоративные мессенджеры, ‒ это надежное средство оперативной коммуникации.

Перевод на сервисах

Все сервисы для изучения языков и онлайн-образования, профессиональные социальные сети, сервисы с отзывами о продуктах и услугах предполагают контент на разных языках. Важно и то, что речь идет о быстро растущем контенте, объемы и скорость появления которого исключают использование профессиональных переводчиков.

Автоматическое выделение значимых сущностей, фактов и их связей из текстового потока

Неструктурированный текстовый контент из СМИ, социальных сетей, блогов, отчетов, договоров содержит уникальные данные, которые могли бы помочь бизнесу в прогнозировании и маркетинге. Но проблема в том, что без автоматической обработки и извлечения ключевых метаданных из неструктурированных текстов трудно увидеть общую картинку. Современные лингвистические технологии позволяют извлекать из текстового потока значимую информацию — упоминание персон, организаций, геоназваний, событий, названия договоров, даты, а также выделять высказывания и определять их эмоциональную окраску, извлекать факты и их участников, прослеживать связи.

Технологии и продукты PROMT позволяют справляться с этими и многими другими задачами по обработке текстов на естественных языках.
PROMT Translation Server 18 — клиент-серверное решение по автоматическому переводу конфиденциальных документов. Программа позволяет обрабатывать документы на 20 языках в более чем 10 форматах и благодаря простому API легко интегрируется в корпоративный портал, любые информационные системы.

PROMT Analyzer SDK — решение для поиска, извлечения, обобщения информации о сущностях, фактах и их связях из неструктурированных текстовых данных на разных языках. Уникальные возможности продукта позволят интеграторам и разработчикам создавать современные решения для бизнес-аналитики и интеллектуального поиска.
ПАРТНЕРСКИЙ МАТЕРИАЛ

«Уже давно объемы документов, содержащихся в информационных базах данных, исчисляются десятками миллионов, если их перевести в бумажный вид, объем будет исчисляться сотнями кубометров. Однако о таких размерах электронных справочников стало возможным говорить только благодаря появлению новых методов анализа и идентификации текста. Автоматическая кластеризация секторов информации по какому-либо признаку или интеллектуальное выявление значимых понятий из текстов, применение машинного обучения и технологии нейросетей в области ранжирования, результаты работы поисковых систем — это открывает новые горизонты для решения задач, связанных с поиском информации, необходимой для решения того или иного вопроса. Современные технологии поиска позволяют быстро ориентироваться и применять ряд аналитических инструментов, существенно упрощая отношения граждан и бизнеса с государством. И действительно, любое действие на рынке урегулировано правовыми нормами. Без знания законодательства построить эффективный бизнес не получится», — считает Юрий Пивоваров, руководитель департамента развития и исследований компании «Гарант».

Корпоративные базы данных: опыт профессионалов

Александр Балалыкин, руководитель отдела внедрения инновационных технологий компании «Гарант»:

— Компания «Гарант» является разработчиком справочной правовой системы ГАРАНТ и одной из ведущих информационных компаний России. Более 27 лет она занимается систематизацией и комплексным анализом правовой информации, а также автоматизацией работы с большими данными.

Сегодня информационный банк системы ГАРАНТ содержит более 63 млн. документов. Для работы с таким огромным банком данных разработаны мощные поисковые и аналитические инструменты, в которых использованы самые современные технологии и способы обработки больших информационных массивов.

Многие организации в своей работе сталкиваются с проблемой навигации в больших объемах внутренней документации. Найти конкретный документ организации, сгруппировать их по теме, выявить взаимосвязи между ними бывает крайне затруднительно. С недавнего времени технологии и программные инструменты ГАРАНТ могут быть использованы самым широким кругом организаций для создания и поддержания корпоративных баз данных «индивидуального» наполнения, включающего именно те документы, которые представляют интерес только в рамках одного предприятия.

«Гарант» предоставит удобные и эффективные инструменты для создания корпоративной базы или возьмет на себя функции по ее созданию и актуализации, поможет и подскажет, как эффективней использовать программные комплексы, обеспечит их внедрение и осуществит техническую поддержку.

По желанию заказчика корпоративная база данных может быть объединена с действующим законодательством и судебной практикой. Таким образом, организация получает удобный и эффективный инструментарий работы как с правовой информацией, так и с внутренними документами. Весь информационный массив связан единым гипертекстовым пространством, а мощные поисковые и аналитические инструменты дадут широкие возможности для работы.

При создании корпоративных баз по технологии ГАРАНТ доступны:

контекстный поиск по документам в базе данных на естественном языке с учетом морфологии и собственной синонимии;
возможность адаптации поисковых инструментов под индивидуальные уникальные критерии;
создание собственных тематических классификаторов;
возможность создания нескольких редакций одного документа с инструментами их сравнительного анализа;
разграничение прав доступа к различным сегментам корпоративной базы, согласно внутренней корпоративной политике;
возможность интеграции базы корпоративных документов с актуальным массивом нормативно-правовых актов РФ и т. д.

Таким образом технологии и программные инструменты ГАРАНТ позволят организациям собрать разрозненные корпоративные документы в единую базу, а удобный интерфейс поможет быстро отыскать нужную информацию, экономя драгоценное время для принятия верных стратегических решений.
ПАРТНЕРСКИЙ МАТЕРИАЛ

В качестве важного современного аналитического инструмента он привел систему лингвистического анализа для проведения антикоррупционной экспертизы документов. Система проводит лингвистический анализ текста документа и решает задачу обнаружения возможных коррупциогенных факторов уже на этапе подготовки документа. Этот инструмент может быть использован в деятельности органов государственной власти, органов местного самоуправления и прокуратуры. В целом, автоматизация поиска потенциальных коррупциогенных факторов — это движение в наступающую эпоху Legal tech, внедрения современных ИТ в сферу юридической деятельности, уверен Юрий Пивоваров.

Директор по исследовательским проектам и руководитель направления Big Data компании «Ай-ФОРС» (ГК ФОРС) Ольга Горчинская обращает внимание на то, что все упомянутые технологии могут использоваться как совместно, обогащая друг друга, так и независимо. Скажем, функциональность системы бизнес-анализа, построенной на BI-инструментах, можно расширить, встроив в нее технологию машинного обучения. В этом случае кроме заданных и простых расчетных показателей можно получать и дополнительные на основе специальных моделей и алгоритмов машинного обучения. Например, дашборд системы анализа эффективности государственных программ помимо затрат и рентабельности может отображать рейтинги отдельной программы по отзывам в социальных сетях.

Быстро развивается направление Интернета вещей, предполагающее специальные технологии сбора и обработки данных с датчиков и приборов. По оценкам некоторых экспертов, объем российского рынка IoT в 2016 г. достиг 1,2 млрд. долл. Очень высок потенциал развития IoT-сервисов в проектах на транспорте, в рамках программ «умного» города и «умной» энергетики, сельского хозяйства и телемедицины. Сейчас идет разработка стандартов и законов, регулирующих эту сферу, что будет способствовать скорейшему формированию цивилизованного рынка.

«С точки зрения практического использования существует важное различие между технологиями классического бизнес-анализа и машинного обучения, — уточняет Ольга Горчинская. — Бизнес-аналитика обычно ориентирована на всесторонний анализ и всегда связана с консолидацией данных из разных источников, с их согласованием и интерактивной визуализацией. Машинное же обучение часто решает конкретную локальную задачу, формирует результат, который может встраиваться в любую систему, не обязательно аналитическую. Примером такой локальной задачи может служить распознавание лиц; для её решения строятся и обучаются нейронные сети, а результат в виде алгоритма встраивается в терминалы аэропорта для прохождения паспортного контроля».

ИАИ в госуправлении

Из сказанного совершенно очевидно, что необходимость применения современных информационно-аналитических инструментов в бизнесе вполне осознана, а их преимущества во многих случаях уже подтверждены практикой. Какие же задачи должны уметь решать современные ИАИ для различных (федерального, регионального, муниципального) уровней госуправления? Какими средствами сбора и обработки данных они должны быть оснащены?

По мнению Веры Холодной, в первую очередь надо уметь решать задачи оперативного извлечения максимально объективной информации. Важный момент для каждого уровня госуправления — межведомственное взаимодействие. Это слабое место многих моделей принятия решений, когда информация из разных департаментов собирается вручную или вообще не собирается. Для всех уровней актуальны задачи расходования бюджетных средств или развития здравоохранения. Целью классификации и дальнейшей обработки данных может быть повышение качества предоставления услуг, выявление наиболее слабых мест в работе различных служб, учёт мнений граждан при приоритизации расходования бюджетных средств. На муниципальном уровне может оказаться полезной информация о том, насколько люди удовлетворены полученными госуслугами, обслуживанием в поликлиниках, состоянием дворовых территорий и иными повседневными бытовыми вещами.

Человеческий разум или искусственный интеллект?

«Не нужны сегодня программисты...» — сказал Герман Греф.

Возможности роботов действительно увеличились. Однако их создатели раньше других поняли, что на самом деле искусственный интеллект (ИИ) не может выполнить всех миссий, но тем не менее его можно эффективно использовать вместе с другими алгоритмами. MINDSCAN придерживается именно такого принципа в своих разработках. Искусственные нейронные сети позволяют создавать уникальные проекты. Они полезны:

для создания чат-ботов, которые будут отвечать на вопросы, помогая найти информацию или выбрать подходящую услугу;
для автоматизации электронного документооборота, когда адресант сможет получать автоматический, но квалифицированный ответ программы;
для оценки эмоций людей в больших массивах фотографий с привязкой к геотегам;
для анализа подписок групп населения в социальных сетях и составления психотипов на этой основе;
для современных моделей медиаизмерения в социальных сетях, с помощью которых можно проводить исследования под неформатные задачи.

Можно, например, исследовать взаимосвязь между интересом, который граждане региона проявляют к политику в Интернете (на основе поисковых запросов в Яндексе и Google), и представленностью этого политика в региональных СМИ.

Такой анализ позволяет понять, насколько эффективна информационная кампания данного политика. Можно рассмотреть ситуацию, когда количество упоминаний персоны в СМИ увеличивается, а количество запросов в Интернете остается на прежнем уровне. Это указывает на то, что аудитория потеряла интерес к персоне либо ей не интересны новости, которые появляются в СМИ.


Рисунок. Публикации и социальная активность

Пропустить возрастающий интерес к совершенствованию машинного интеллекта невозможно. ИИ пытаются задействовать во всех отраслях — от космических исследований до медицины. Крупные компании активно финансируют собственные проекты, где задействованы искусственные «нейроны». Очень привлекает возможность создания оригинальных колл-центров, но, к сожалению, добиться речевой импровизации от робота нелегко.

Подводя итог, можно утверждать, что универсального механизма для решения задач не существует. Любую разработку приходится адаптировать под конкретную цель. И чем более универсальный механизм нужно получить, тем труднее его создать.

Но мы твердо уверены, что решение обязательно найдется!

Команда MINDSCAN
info@midscan.ru
ПАРТНЕРСКИЙ МАТЕРИАЛ

Сегодня у всех на слуху сложная ситуация со свалками мусора. Возможно, она не достигла бы такой остроты, не будь она вовремя выявлена и оценена, например, посредством постоянного мониторинга социальных сетей на предмет сообщений о том, что обнаружена незаконная свалка где-то в лесу. На муниципальном уровне эту информацию можно было бы вовремя отследить и верно оценить масштаб свалки с помощью специальной аэросъемки и анализа видео. На региональном — собранную локально информацию следует учитывать при планировании мероприятий по переработке отходов. На федеральном — сопоставлять территориальные схемы по обращению с отходами, выстраивать систему независимого аудита и оценки с помощью обработки больших массивов данных.

«В настоящее время подавляющее большинство ИАИ, используемых в органах власти России, в основном решают задачи планирования деятельности, мониторинга значений различных социально-экономических показателей и формирования отчетов. Автоматизация процессов принятия управленческих решений в современных условиях должна быть ориентирована на использование инструментов, позволяющих прогнозировать и моделировать те или иные ситуации и варианты развития событий, а именно отвечать на вопросы «что будет, если...?» или «что нужно сделать, для того, чтобы...?», — полагает Анатолий Карпенко. По его словам, лишь около 45% органов государственной власти федерального и регионального уровня в той или иной степени используют инструменты прогнозной аналитики и немногим более 11% применяют средства автоматизированного моделирования для решения своих управленческих задач. На уровне органов местного самоуправления ИАИ используются очень слабо, а информация главным образом анализируется с помощью инструментария офисных приложений.

«Что касается средств сбора и обработки информации, то учитывая специфику деятельности органов государственной власти, нацеленной на работу с официальной информацией, в первую очередь собираются и обрабатываются структурированные и слабоструктурированные данные, представленные в виде текстовых документов. В ряде случаев отдельными госструктурами применяются средства автоматизированной обработки и анализа мультимедийного контента, то есть аудио- и видеоинформации», — добавил Анатолий Карпенко.

По мнению Никиты Шаблыкова, в зависимости от тех задач, которые решаются на том или ином уровне госуправления, могут требоваться разные ИАИ-инструменты. Для федеральных органов часто востребованы решения для эффективной работы с международной документацией и аналитикой, доступной на разных языках. Например, Федеральный институт промышленной собственности не может вести свою деятельность, не обращаясь в международные патентные базы данных. Эксперты ФИПС ищут информацию более чем в 110 млн. патентов, которые хранятся как в собственных базах данных, так и в базах данных международных патентных ведомств или патентных ведомств других стран. Эффективная и точная работа эксперта сегодня невозможна без технологий автоматического перевода. Свыше шестисот экспертов ФИПС для обработки патентных заявок ежедневно используют эти технологии, переводя более 600 тыс. слов в день с английского, китайского и других языков.

«То же самое касается международных судов, где есть острая необходимость в высококачественном и быстром переводе юридически значимой информации.

Правоохранительная деятельность, борьба с терроризмом также требует эффективных инструментов текстовой аналитики и лингвистической обработки данных. Сюда входит перевод пользовательской информации не только из так называемого открытого Интернета, но и из Darknet, Deepweb, а также выделение в автоматическом режиме значимой информации, такой как имена людей, названия организаций, определение событий, с тем чтобы её могли оперативно обрабатывать аналитики и эксперты. Решения всегда принимаются людьми, но они должны быть взвешенными и объективными, а для этого нужна предварительная обработка огромных массивов данных», — добавил Никита Шаблыков.

Елена Новикова уверена, что одних только традиционных BI-инструментов сегодня уже недостаточно — нужны встроенные средства продвинутой обработки больших объемов данных, как проприетарные In-Memory-инструменты, так и их интеграция с распространенными Open Source-решениями, такими как Hadoop (для MPP) и R/Python (для продвинутой аналитики).

Сергей Полтев обращает внимание на необходимость инструментов для извлечения и структурирования данных, объединения информации из различных источников. При этом чем дальше мы уходим от «сырых данных» к обобщенным зависимостям — тем важнее становится обеспечение достоверности, документальной подтвержденности исходной информации.

По мнению Ольги Горчинской, если наряду с инструментами традиционного бизнес-анализа применять технологии больших данных и машинного обучения, то это позволит анализировать отношение населения к федеральным и региональным инициативам, всесторонне оценивать результаты выполнения государственных программ, эффективнее работать с огромными объемами текстовой информации, накопленной в государственных учреждениях.

Руководитель направления аналитики «SAS Россия/СНГ» Александр Ефимов говорит о необходимости инструментов удалённого сбора данных «с полей» сразу же в электронной форме, так, чтобы они были снабжены средствами для логического контроля и проверки достоверности. Кроме того, нужна система контроля версий, поскольку информация со временем может обновляться.

Подробнее: https://www.itweek.ru/idea/article/detail.php?ID=199394