Pentaho 8.2 обеспечивает более эффективную интеграцию продуктов Hitachi Vantara и позволяет реализовать ключевые для отрасли сценарии использования за счет доступа к неструктурированным данным из HCP. Платформа также дает возможность использовать новые подходы к управлению гибридной облачной средой и расширяет поддержку аналитической экосистемы.
«Благодаря Pentaho 8.2 и Hitachi Content Platform мы можем использовать на единой платформе как структурированные, так и неструктурированные данные. В результате мы на 20-30% сократим затраты на вычисления и на 50-60% затраты на хранение, – говорит Эндрю Буффон (Andrew Buffone), директор по управлению данными компании CARFAX Canada. – Кроме того, мы можем более эффективно управлять и структурированными, и неструктурированными данными, которые в дальнейшем используют наши специалисты по обработке и анализу данных».
По данным аналитиков Harvard Business Review, в процессе принятия бизнес-решений организации задействуют меньше половины своих структурированных данных. При этом только 1% неструктурированных данных вообще используется каким бы то ни было образом. Эффективная интеграция с HCP позволяет пользователям создавать конвейеры данных, включающие источники структурированных и неструктурированных данных, такие как текст, видео, аудио, изображения, историю посещений сайтов, файлы журналов. Это позволит специалистам по изучению данных получать более глубокие знания, обеспечивающие большие преимущества для бизнеса. Pentaho 8.2 дает возможность использовать разные типы данных, например в таких областях, как:
• Банковская сфера
Благодаря сопоставлению данных о коммерческих транзакциях с сообщениями с электронной почты финансовые учреждения смогут обеспечивать соответствие нормативно-правовым требованиям.
• Здравоохранение
Специалисты, проводящие клинические исследования препаратов, смогут находить новые лекарства, объединяя данные пациентов с неструктурированными данными, поступающими с МРТ.
• Розничная торговля
Компании смогут анализировать покупательские предпочтения каждого посетителя и товаропоток для каждого представленного в магазине бренда, комбинируя материалы видеосъемки с данными, поступающими с кассовых терминалов.
• Общественная безопасность
Органы правопорядка смогут соотносить данные видеонаблюдения с криминальными сводками, что позволит быстрее собирать необходимые материалы и принимать более эффективные решения, оставаясь в рамках нормативно-правовых требований.
Сейчас, когда существует целый ряд возможностей для организации озер данных – таких как базы данных NoSQL, различные виды общедоступных облачных сервисов, собственные объектные хранилища, – организации более тщательно выбирают оптимальные варианты инвестиций в решения по управлению корпоративными данными и обеспечения нормативно-правовых требований. Совместное использование Pentaho 8.2 и Hitachi Content Platform открывает новые, гораздо более эффективные способы управления данными. Теперь пользователи могут разместить данные на платформе HCP, которая функционирует как озеро данных, а затем использовать Pentaho для подготовки, очистки и нормализации данных в HCP. После этого Pentaho позволит определить, какие данные подходят для каждого целевого облака. Это позволит компаниям более эффективно управлять затратами.
Pentaho 8.2 расширяет поддержку экосистемы продуктов и технологий сторонних разработчиков, которые помогают организациям оптимизировать свои конвейеры данных и аналитические проекты.
• Поддержка AMQP. Заказчики Pentaho могут использовать этот популярный протокол сообщений, который позволяет компаниям организовать чтение и публикацию потоковых данных с граничных устройств в облаке в новых сценариях с применением систем IoT.
• Повышение безопасности Google Cloud. Поддержка управляемых заказчиками ключей шифрования (CMEK) обеспечивает пользователям Pentaho дополнительную защиту за счет контроля собственных ключей шифрования при доступе к сервисам данных Google Cloud Storage и Google BigQuery.
• Реализация шагов Python. Пользователи Pentaho 8.2 могут работать с моделями машинного и глубокого обучения, созданными на языке Python, и выполнять вызовы API популярных библиотек, таких как Scikit-learn и TensorFlow.
• Поддержка OpenJDK. Заказчики Pentaho могут перейти с пакета разработки OpenJDK, который теперь предоставляется на коммерческой основе, на бесплатную и открытую версию OpenJDK.
«Поддержка современных проектов по аналитике предусматривает создание гибких конвейеров данных, которые способны быстро интегрировать как структурированные, так и неструктурированные данные из множества источников, делая их доступными для нескольких типов использования, – считает Мэтт Аслетт (Matt Aslett), вице-президент по исследованиям направления данных, ИИ и аналитики группы 451 Research. – Благодаря Pentaho 8.2, Hitachi Vantara помогает заказчикам более полно задействовать аналитическую обработку данных, особенно в отраслях, где приходится иметь дело с большим количеством неструктурированных данных».