Amazon Mechanical Turkで画像収集タスクを出してみよう
2019-08-14
azblob://2022/11/11/eyecatch/2019-08-14-image-collection-task-with-amazon-mechanical-turk-000-e1565745779955.jpg

はじめに

Amazonのクラウドソーシング、Amazon Mechanical Turk(MTurk)で機械学習用の以下のような画像収集タスクを出してみました。

特徴としては以下です。

  • Amazon S3に収集した画像を保存
  • 「ファイル選択」から画像を複数枚選択可能
  • 画像をアップロード中にアップロード済みの枚数を表示
  • ファイルが10個未満の場合、エラー文を出力
  • .jpgファイルが10個未満の場合、エラー文を出力
  • アップロードできないファイルがあった場合にエラー文を出力

Amazon CognitoとAmazon S3のセットアップ

このページを参考にセットアップしてください。
権限さえあれば10分くらいでできるはずです。
手順通りだったため、省略します。

Mturkのプロジェクトの作成

このページを参考にMturkのプロジェクトを作成していきます。
Design Layoutの部分で、以下のコードを利用します(チェックボックスは記述しないとエラーがでることがあります)。

See the Pen MTurk sample by Sato Sato (@sssssf) on CodePen.

https://static.codepen.io/assets/embed/ei.js

Preview and Finishで実際に動作させることができます(一番上のエラーは無視でOK)。

スクロールして、「ファイルを選択」を押すと、以下のように選択ウィンドウがでてきます。

.jpgファイルを10個選択して、「Upload file」をクリックすると、以下のように表示されます。

また、Amazon S3を確認すると、選択した画像が保存されていることが分かります(プレビュー画面での実行のため、本来IDなどが入る場所がundefinedになっています)。

選択したファイルが10個未満のときは以下のように表示され、アップロードは行われません。

.jpgファイル以外のものが混じっていると以下のように表示され、アップロードされません。

一通り確認が終わったら、Publish Batchをして、タスクをTurkerに出します。

おわりに

Amazon Mechanical Turk(MTurk)で機械学習用の以下のような画像収集タスクを出してみました。
便利なクラウドソーシングを用いて、効率的にデータ収集をこれからもしたいですね。