Azure Data Share で、大きなデータも安全に共有する
2019-07-12
azblob://2022/11/11/eyecatch/2019-07-12-azure-data-share-000.jpg

Azure Data Share がパブリックプレビューで公開されました。何ができるのかを動かしてみました。

Azure Data Share とは

Azure上に保存してあるデータを他のサブスクリプションやユーザに共有するためのサービス
共有できるデータは、Blob Storage、Data Lake Storage Gen1、Data Lake Storage Gen2 の中にあるデータ
データファクトリーを簡単に設定できるようにしましたという感じです。

確認したこと

  • どこのリージョンで使えるのか、いくらかかるのか
  • どういうイメージで利用されるのか
  • 同期されたデータはどのように共有されるのか

ステータス、利用できるリージョン

・ステータス
  パブリックプレビュー

・利用できるリージョン
  East US 2
  Southeast Asia
  West Europe
  ※ちなみにこのリージョンは、DataShareのアカウント(きっと裏で同期するアプリが動いている)をどこに作るかで、同期対象のデータはどこにあっても大丈夫だと思います。ちなみに確認は、東日本のリージョンで行いました。

・料金
  不明 
  情報が載ってないので、同期されるデータの保存料金とスナップショットとして転送されるデータ料金くらいなのだろうか

利用イメージ と 共有するときの設定方法

手順はこちらを参考にしてください。
送信側
https://docs.microsoft.com/en-us/azure/data-share/share-your-data
受信側
https://docs.microsoft.com/en-us/azure/data-share/subscribe-to-data-share

同期されたデータはどのように共有されるのか

  • 受信側でデータの共有先となるストレージを作成し、共有されるデータを自分のストレージのコンテナやフォルダに紐づける
  • スケジュールもしくは手動で、スナップショットの作成の実行をする(送信者はスケジュールを決める、受信者は今すぐ同期を行える)
  • あくまでスナップショットなので、データにはタイムラグが発生する
  • 後からも共有したいデータは追加できる。ただし、追加した単位で送信先に紐づけが必要になる
  • 同期されたタイミングなどはログがでる

まとめ

  • 設定は簡単
  • 何かをパブリックに設定するなどのセキュリティに絡む設定はないので安心感はある
  • データ分析のデータ同期などで利用する想定で作られているのだろうか
  • 送信側、受信側で設定は必要なので、ある程度大きいファイルを定期的にやり取りする必要があるときに必要になるのかと