Узнайте, как подключить службы Power BI и Azure Data Services для обмена данными и получения новых знаний, из нового руководства. Бизнес-аналитики, использующие потоки данных Power BI, теперь могут обмениваться данными с инженерами по обработке данных и специалистами по обработке данных, которые могут использовать возможности служб обработки данных Azure, включая Azure Databricks, Azure Machine Learning, Azure SQL Data Warehouse и Azure Data Factory для расширенной аналитики и искусственного интеллекта.
Благодаря недавно анонсированному предварительному просмотру потоков данных Power BI, Power BI включила функцию самостоятельной подготовки данных для бизнес-аналитиков. Потоки данных Power BI могут получать данные из большого массива источников данных транзакций и наблюдений, а также очищать, преобразовывать, обогащать, схематизировать и сохранять результат. Потоки данных можно повторно использовать и обновлять автоматически и последовательно для создания мощных конвейеров подготовки данных. Power BI теперь предоставляет доступную поддержку для хранения потоков данных в Azure Data Lake Storage (ADLS) Gen2, включая как данные, так и определение потока данных. Благодаря хранению потоков данных в Azure Data Lake Storage Gen2 бизнес-аналитики, использующие Power BI, теперь могут сотрудничать с инженерами по обработке данных и специалистами по анализу данных, использующими службы Azure Data Services.
Хранилища данных препятствуют совместному использованию данных
Способность организаций извлекать аналитические данные из бизнес-данных обеспечивает ключевое конкурентное преимущество, однако попытка сделать это сегодня может занять много времени и дорого. Чтобы извлекать информацию и создавать ценность из данных, приложение должно иметь возможность доступа к данным и понимать их структуру и значение. Данные часто хранятся в изолированных хранилищах, которые зависят от приложения или платформы, что создает серьезную проблему интеграции данных и подготовки данных.&
Согласованные форматы данных и метаданных обеспечивают совместную работу
Применяя согласованный способ хранения и описания данных на основе общей модели данных (CDM), Power BI, службы обработки данных Azure и другие приложения могут более эффективно обмениваться данными и взаимодействовать с ними. Потоки данных Power BI хранятся в ADLS Gen2 в виде папок CDM. Папка CDM содержит файл метаданных, который описывает объекты в папке с их атрибутами и типами данных, а также перечисляет файлы данных для каждого объекта. CDM также определяет набор стандартных бизнес-объектов, которые определяют дополнительную расширенную семантику. Сопоставление данных в папке CDM со стандартными объектами CDM дополнительно облегчает взаимодействие и обмен данными. Корпорация Майкрософт совместно с SAP и Adobe сформировала инициативу по открытым данным, направленную на поощрение определения и внедрения стандартных объектов в различных областях, чтобы упростить приложениям и инструментам обмен данными через корпоративное хранилище данных.&
Благодаря принятию этих соглашений о хранении данных данные, поступающие в Power BI, с его и без того мощными и простыми в использовании функциями подготовки данных, теперь могут быть дополнительно обогащены и использованы в Azure. Аналогично, данные в Azure можно экспортировать в папки CDM и совместно использовать с Power BI.&
Службы данных Azure предоставляют расширенную аналитику совместно используемых данных
Службы данных Azure предоставляют расширенную аналитику, которая позволяет максимизировать ценность для бизнеса данных, хранящихся в папках CDM в озере данных. Инженеры по обработке данных и специалисты по анализу данных могут использовать Azure Databricks и Azure Data Factory dataflows для очистки и изменения формы данных, обеспечивая их точность и полноту. Данные из разных источников и в разных форматах можно нормализовать, переформатировать и объединить, чтобы оптимизировать данные для аналитической обработки. Специалисты по обработке данных могут использовать машинное обучение Azure для определения и обучения моделей машинного обучения на основе данных, позволяя делать прогнозы и рекомендации, которые могут быть включены в информационные панели и отчеты BI и использоваться в производственных приложениях. Инженеры по обработке данных могут использовать Azure Data Factory для объединения данных из папок CDM с данными со всего предприятия, чтобы создать исторически точное представление данных в масштабе предприятия в Azure SQL Data Warehouse. В любой момент данные, обработанные любой службой данных Azure, могут быть записаны обратно в новые папки CDM, чтобы сделать аналитические данные, созданные в Azure, доступными для Power BI и других приложений или инструментов с поддержкой CDM.
В новом руководстве рассматривается обмен данными между Power BI и Azure
Теперь доступно руководство, которое поможет вам понять, как обмениваться данными между Power BI и Azure с помощью папок CDM может разрушить разрозненные данные и открыть новые возможности для анализа. В руководстве с примерами кода показано, как интегрировать данные из Power BI в современный сценарий хранилища данных в Azure. Учебное пособие позволяет вам изучить потоки, выделенные зеленым цветом на диаграмме выше.& &
В учебном пособии потоки данных Power BI используются для получения ключевых аналитических данных из операционной базы данных Wide World Importers и сохранения извлеченных данных с помощью его схема находится в папке CDM в ADLS Gen2. Затем вы подключаетесь к папке CDM и обрабатываете данные с помощью Azure Databricks, форматируете и подготавливаете их к последующим шагам, а затем записываете обратно в lake в новой папке CDM. Эта подготовленная папка CDM используется Azure Machine Learning для обучения и публикации модели ML, доступ к которой можно получить из Power BI или других приложений для составления прогнозов в режиме реального времени. Подготовленные данные также загружаются в промежуточные таблицы в хранилище данных SQL Azure, где они преобразуются в размерную модель.&
Фабрика данных Azure используется для организовывать поток данных между службами, а также управлять обработкой во время выполнения и контролировать ее. Ознакомившись с руководством, вы “из первых рук увидите, как метаданные, хранящиеся в папке CDM, облегчают понимание данных каждой службой и обмен ими.& & &
Пример кода ускоряет интеграцию ваших данных проекты
Руководство включает в себя пример кода и инструкции для всего сценария. Примеры включают повторно используемые библиотеки и код на C#, Python и Scala, а также повторно используемые шаблоны конвейера Azure Data Factory, которые вы можете использовать для интеграции папок CDM в свои собственные проекты служб данных Azure.&
Краткое описание
Потоки данных Power BI, общая модель данных и службы обработки данных Azure можно использовать совместно, чтобы вскрыть хранилища данных в вашей организации и дать возможность бизнес-аналитикам, инженерам по обработке данных и специалистам по обработке данных обмениваться данными для обеспечения расширенной аналитики и откройте для себя новые идеи, которые дадут вам конкурентное преимущество.&
Следующие шаги
Загрузите руководство сегодня и узнайте, как вы можете обмениваться данными между Power BI и Azure Data Услуги.
Чтобы узнать больше о потоках данных Power BI, CDM и службах данных Azure, перейдите по ссылкам ниже:
- Потоки данных Power BI
- Общая модель данных
- Папки CDM
- Фабрика данных Azure
- Базы данных Azure
- Хранилище данных SQL Azure
- Машинное обучение Azure
- Хранилище Azure Data Lake поколения 2
beinginthecloud.com – URL-адрес сайта-источника