こんにちは四日市事業所の河口です。先週の藤井さんの「医療機関向け 『Microsoft Azure』対応セキュリティリファレンス 」の紹介 #Azureリレー に引き続き、毎週水曜日にAzure関連の記事を挙げるAzure リレー第9回を担当します。
今回は新しいAzure Machine LearningとAzure DevOpsを使って自動的にAutoMLで作成したモデルをAzure Container Instancesにデプロイしていきます。
準備
学習のデータセットは以下のものを使用しました。
http://archive.ics.uci.edu/ml/datasets/Iris
ダウンロードしたファイルの拡張子をcsvにしておき、先頭に以下のパラメータ名を追加します。
sepal_length | sepal_width | petal_length | petal_width | class |
Azure DevOpsと連携するのでgithubか何かのリポジトリに以下のコードを上げておきます。
ServicePrincipalAuthenticationに入力するデータは後程説明します。
name: project_environment
dependencies:
# The python interpreter version.
# Currently Azure ML only supports 3.5.2 and later.
- python=3.6.2
- psutil=5.3
- pip:
- azureml-sdk[notebooks]
- pandas==0.23.4
- joblib
- azureml-defaults
- azureml.automl.runtime
---
containerResourceRequirements:
cpu: 1
memoryInGB: 2
computeType: ACI
location: japaneast
entryScript: score.py
runtime: python
condaFile: condaEnv.yml
schemaFile:
sourceDirectory:
enableGpu: False
baseImage:
baseImageRegistry:
from azureml.train.automl import AutoMLConfig
from azureml.core import Workspace, Dataset
from azureml.core.experiment import Experiment
from azureml.core.model import Model
from azureml.core.authentication import ServicePrincipalAuthentication
auth = ServicePrincipalAuthentication(
tenant_id="<tenant id>",
service_principal_id="<application id>",
service_principal_password="<application password>")
subscription_id = '<subscription id>'
resource_group = '<resource group name>'
workspace_name = '<workspace name>'
ws = Workspace(subscription_id, resource_group, workspace_name, auth=auth)
train_data = Dataset.get_by_name(ws, name='<dataset name>')
label = "class"
automl_classifier = AutoMLConfig(
task='classification',
primary_metric='AUC_weighted',
experiment_timeout_minutes=30,
blacklist_models='XGBoostClassifier',
training_data=train_data,
label_column_name=label,
n_cross_validations=2)
experiment_name = '<experience name>'
experiment = Experiment(ws, experiment_name)
run = experiment.submit(automl_classifier, show_output=True)
description = '<description>'
model = run.register_model(description=description,
model_name='<model name>')
import pickle
import json
import pandas as pd
import joblib
from azureml.core.model import Model
from azureml.core import Workspace, Dataset
from azureml.core.authentication import ServicePrincipalAuthentication
def init():
global model
global ws
try:
auth = ServicePrincipalAuthentication(
tenant_id="<tenant id>",
service_principal_id="<application id>",
service_principal_password="<application password>")
subscription_id = '<subscription id>'
resource_group = '<resource group name>'
workspace_name = '<workspace name>'
ws = Workspace(subscription_id, resource_group,
workspace_name, auth=auth)
model_path = Model.get_model_path(
'<model name>', _workspace=ws)
model = joblib.load(model_path)
except Exception as e:
print(e)
def run(raw_data):
try:
data = json.loads(raw_data)["data"]
data = pd.DataFrame(data)
data.columns = ['sepal_length', 'sepal_width',
'petal_length', 'petal_width']
result = model.predict(data)
return json.dumps({"result": result.tolist()})
except Exception as e:
result = str(e)
return json.dumps({"error": result})
if __name__ == "__main__":
init()
test_data = '{"data":[[0,0,0,0]]}'
prediction = run(test_data)
print("Test result: ", prediction)
構築
1. Azure MLのワークスペース作成
data:image/s3,"s3://crabby-images/f5a6e/f5a6e26650e0e70e032e5aafc9b3cc87642518c0" alt=""
2. 各項目を入力
data:image/s3,"s3://crabby-images/07158/0715861054f7544fdee28917ff636cb50513c6c5" alt=""
3. 新しい Azure Machine Learning Studioを起動
data:image/s3,"s3://crabby-images/b8352/b83526c2314eec7db7a3c64957e7f27c8f0b9a94" alt=""
4. データセット作成のローカルファイルからを選択
data:image/s3,"s3://crabby-images/96acf/96acf94a45da2bb4eaa96cd22aac156aadf8df6b" alt=""
5. データセット名を入力し次へ
data:image/s3,"s3://crabby-images/a24ab/a24ab8e18b6d0cbc68d4a02d1e684e3ee3d8f23c" alt=""
6. データストアを選択した後、参照からデータセットのファイル(Iris.csv)をアップロードし次へ
data:image/s3,"s3://crabby-images/8e6ad/8e6ad01da7446db1fc95e6fcb420746f1ddba8d7" alt=""
7. 列見出しを最初のファイルのヘッダーを使用するを選択し次へ
data:image/s3,"s3://crabby-images/56bbe/56bbed1f973902c14ca58ee285ccbb72afc8f616" alt=""
8. 入力する列や種類を決定し次へ
data:image/s3,"s3://crabby-images/41fd9/41fd97191d2d0280578fb4b202380cbc9a8cf05e" alt=""
9. 問題がなければ作成を選択
data:image/s3,"s3://crabby-images/1876c/1876c531c6d0368ff6a35f9d9444e94d2d28e4b5" alt=""
10. 以下のリンクからAzure DevOpsにMachine Learningのツールをインストール
data:image/s3,"s3://crabby-images/a039a/a039a205995470492e49a4cb0065c9a7c05c1b85" alt=""
11. DevOpsのプロジェクトを選択しインストール
data:image/s3,"s3://crabby-images/9680d/9680dd5152c51187809fd3dfdfaac88ca50f46f0" alt=""
12. インストールが完了したらDevOpsの画面に遷移する
data:image/s3,"s3://crabby-images/49336/493361a497f6c32cb09bdb0c2e1300caa3784df3" alt=""
13. Project Settings -> Service connections -> New service connectionを選択
data:image/s3,"s3://crabby-images/33dc6/33dc636e0bf7d995a97c49f67e9650928c7a4477" alt=""
14. Azure Resource Manager -> Service principal -> Machine Learning Workspaceを選択し、各項目を入力しSave
data:image/s3,"s3://crabby-images/01c1d/01c1d17f7653000dd615219e43b389ac8f1d425c" alt=""
15. Azure ポータルのActive Directoryの画面を開きアプリの登録から先ほど作成したサービスコネクションを選択する
data:image/s3,"s3://crabby-images/478ea/478ea8e83e5f4a4d6e9987e04cb053286ba17045" alt=""
16. ここで表示されるアプリケーション ID、テナントIDをメモしておく
data:image/s3,"s3://crabby-images/bf09e/bf09ed167aa69954022c9628332d9ca060e924b2" alt=""
17. 証明書シークレットから新しいクライアントシークレットを追加する
data:image/s3,"s3://crabby-images/add0b/add0bb44ec776473cd367992cb29ea527a7df28e" alt=""
18. 表示される値がパスワードになるので、先ほどメモしたアプリケーションID、テナントIDと合わせて冒頭の準備で示したServicePrincipalAuthenticationに入力する
data:image/s3,"s3://crabby-images/754d9/754d901a8071719cab01e60bfaafb6b4227d1658" alt=""
19. 再びDevOpsの画面に移りビルドパイプラインを作成する。初めにUse Python versionに3.6と入力し追加する
data:image/s3,"s3://crabby-images/ef2cb/ef2cb3027f0fb50ffaa461210d478f87238039fd" alt=""
20. BashのTypeをFile Path、Script Pathをinstall_requirements.shとし追加する
data:image/s3,"s3://crabby-images/bdbb0/bdbb0eabc68f74c2f0722b3303f259b387c3701f" alt=""
21. Azure CLIを選択し、サブスクリプションの選択、Script TypeをShell、Script LocationをInline script、Inline Scriptをpython trainAndCreateModelにし追加する
data:image/s3,"s3://crabby-images/ebb78/ebb784eaea9d2172551246a160a2fcf619b301e9" alt=""
22. Copy filesを選択し、SourceFolderに$(Build.SourcesDirectory)、TargetFolderに$(Build.ArtifactStagingDirectory)を入力し追加
data:image/s3,"s3://crabby-images/01ff9/01ff96da111db3d105e7c6f7e6dcd4e31b783317" alt=""
23. Publish build artifactsのPath to publishに$(Build.ArtifactStagingDirectory)を入力し追加
data:image/s3,"s3://crabby-images/88b5c/88b5c9bbf5009f814b18621e7d922a2d364526f2" alt=""
24. 最終的にazure-pipelines.ymlが以下のようになっていれば良い
# Python package
# Create and test a Python package on multiple Python versions.
# Add steps that analyze code, save the dist with the build record, publish to a PyPI-compatible index, and more:
# https://docs.microsoft.com/azure/devops/pipelines/languages/python
trigger:
- master
resources:
- repo: self
steps:
- task: UsePythonVersion@0
inputs:
versionSpec: '3.6'
addToPath: true
architecture: 'x64'
- task: Bash@3
inputs:
filePath: 'install_requirements.sh'
- task: AzureCLI@2
inputs:
azureSubscription: 'azureMLConnection2'
scriptType: 'bash'
scriptLocation: 'inlineScript'
inlineScript: 'python trainAndCreateModel.py'
- task: CopyFiles@2
inputs:
SourceFolder: '$(Build.SourcesDirectory)'
Contents: '**'
TargetFolder: '$(Build.ArtifactStagingDirectory)'
- task: PublishBuildArtifacts@1
inputs:
PathtoPublish: '$(Build.ArtifactStagingDirectory)'
ArtifactName: 'drop'
publishLocation: 'Container'
25. ビルドパイプラインをトリガーすることでモデルの再トレーニングが行われ、モデルが登録される。正常に終了すればAzure ML Studioの方にモデルが登録されている
data:image/s3,"s3://crabby-images/15b4e/15b4ee22a833c1e7bae65bdf121faa472851e42b" alt=""
26. リリースパイプラインを作成する。テンプレートはEmpty jobを選択する
data:image/s3,"s3://crabby-images/9df72/9df724555b82c6bd9b0450a5088fb0127b3203c2" alt=""
27. ArtifactsのAddからビルドパイプラインのソースを選択して追加
data:image/s3,"s3://crabby-images/70ea9/70ea9f4971982e35d58bfe56e7bffb655ea6fd26" alt=""
28. ArtifactsのAddからAzureML Model Artifactも追加する
data:image/s3,"s3://crabby-images/c64ab/c64ab2a2529dbf865d7d341cc1ba2fe7c2893d5c" alt=""
29. Artifactsのビルドパイプラインのソースのトリガーを有効化する
data:image/s3,"s3://crabby-images/4b276/4b276290feaf258bbfeba784bdf5b0a5144c91c7" alt=""
30. Stagesのjobを設定する。AzureML Model Deployを選択し追加
data:image/s3,"s3://crabby-images/b4043/b4043e3904d75c8cba4cfab2d4d2dc1eafec0ee4" alt=""
31. 各項目を入力
- Azure ML Workspace : サービスコネクションを選択
- Inference config Path : inferenceConfig.ymlを選択
- Model Deployment Target : Azure Containre Instanceを選択
- Deployment Name : ACIの名前を入力
- Deployment configuration file : deploymentConfig.ymlを選択
- Overwrite existing deployment : 同名のACIを上書きするためにチェックマークを付ける
data:image/s3,"s3://crabby-images/5418a/5418a242b1f7cd6d41f017e31fba983b4bcf836d" alt=""
32. リリースパイプラインを走らせ正常に終了すればAzureML StudioのエンドポイントにACIが追加されている
data:image/s3,"s3://crabby-images/b524a/b524ac224e36d71cd9fd5646aed003afd764feda" alt=""
33. 詳細にエンドポイントがあるためメモをする
data:image/s3,"s3://crabby-images/1fdc0/1fdc0d9fddeac40fe0912b4f2deec2cfe3f4171b" alt=""
34. 正常に動作するかテストする。Postman等でメモをしたエンドポイントに対してPostすることで結果が返ってくれば成功
data:image/s3,"s3://crabby-images/fde02/fde02ae68542fef6e8a5d7cb3631b3b3de638f54" alt=""
以上でAzureMLのAutoMLでMLOpsの構築が完了しました。ここまで読んでくれた方ありがとうございます!