Павленко Майкл - биография и семья

Биография

Цитата

Самое главное препятствие массового распространения BI — недоверие к данным и результатам. Помимо этого распространению BI мешают сложность использования инструментов BI и посредственная производительность систем, предназначенных для самостоятельной работы пользователей. Поэтому многие BI-проекты в России сводятся к созданию некоторого стандартного набора отчетов. Но это никак нельзя назвать операционной бизнес-аналитикой.

Во-первых, результаты в новом инструментарии разнятся с результатами, которые пользователи получали в собственных наработках ранее. Во-вторых, отчет долго формируется, но пользователь не хочет ждать. Он не понимает, что реляционной БД требуется гораздо больше времени для подготовки данных к анализу, чем для обновления транзакции. Такая медлительность настораживает пользователя, и он не доверяет BI. Кроме этого, данные непонятны сотрудникам, так как не отражены в системе BI в привычном для них виде. Получается, что компания покупает дорогие BI-системы, ИТ-отдел их внедряет, а люди ими не пользуются. Это плохо сказывается на распространении технологии бизнес-аналитики внутри компании.

Прежде всего, интерфейс должен быть не только интуитивным, но и простым в использовании: чем меньше кликов, тем лучше. Затем данные и связи между ними должны быть понятными. Если пользователь все понимает и ему легко работать, то ему нравится инструмент и он его будет применять.

Далее, необходимо обеспечить высокое быстродействие. Традиционные реляционные СУБД умеют быстро обрабатывать транзакции, но совершенно не приспособлены для обработки аналитических запросов. Для этого требуются специальные СУБД, которые выпускают некоторые компании. Так, Sybase еще в середине 1990-х разработала систему IQ, работающую с языком SQL, но внутри организованную совершенно не так, как реляционная СУБД.

Нужна специализированная модель данных для создания хранилища, в котором должны храниться два типа данных: детальная информация, например все заказы для всех клиентов за десять лет, и агрегированные данные, необходимые для того, чтобы не пересчитывать основные показатели каждый раз заново. Процесс агрегации называется Extract, Transform and Load (ETL) и для него применяются специальные инструменты. С их помощью, например, можно агрегировать все заказы по клиентам или доход по продукту, т. е. подготовить все ключевые показатели эффективности. А когда потребуется отчет, достаточно просто распечатать эти показатели, построить график по клиенту или по продукту, а также провести более глубокий анализ, путем рассмотрения деталей, формирующих вышестоящие агрегаты (drill-down).

В проекте BI обязательно должны участвовать бизнес-пользователи. В России зачастую это не соблюдается, хотя бывают и исключения. Например, в одном из крупных частных российских банков главным руководителем проекта BI является первый заместитель финансового директора, все делается под запросы бизнес-пользователей и результат положительный.

Если же бизнес не участвует проекте, ИТ-шники делают хранилище так, как считают нужным, и получается система, которая не отвечает задачам пользователей. В результате с этой системой работают только ИТ.

Следует использовать готовые модели данных, которые сейчас предлагают несколько компаний. Например, Sybase предлагает Industry Warehouse Studio (IWF) — набор физических моделей данных для разных отраслей (банков, телекома, ритейла, страховых компаний и т. д.). Причем ядро у всех моделей одинаковое, потому что все применяют одни и те же атрибуты — заказы, поставки, клиенты, сотрудники, договора и т. д., а дальше идут надстройки, специфичные для каждой отрасли. Такую модель можно развернуть на любой СУБД, в том числе и на реляционной. Но на специализированной базе данных (например, Sybase IQ) все будет работать гораздо быстрее.

Поверх этой модели можно использовать любой BI-инструмент. Такой подход значительно упрощает и ускоряет построение BI, а также уменьшает общую стоимость владения, так как не нужно для каждого нового отчета строить отдельные витрины данных или OLAP-кубы. Детальный анализ (drill-down) легко доступен, потому что все связано между собой.

Таким образом, для внедрения BI нужна специализированная СУБД, над ней — модель данных, а поверх — BI-инструмент. В такой конструкции нет ничего лишнего, поэтому ее внедрение будет недорогим, а полученная в результате система будет быстро работать.

Почему BI не имеет массового распространения в России?