AI/Machine Learning

Amazon Mechanical Turkで画像収集タスクを出してみよう

Amazon Mechanical Turkで画像収集タスクを出してみよう 2019-08-14Leave a comment

はじめに

Amazonのクラウドソーシング、Amazon Mechanical Turk(MTurk)で機械学習用の以下のような画像収集タスクを出してみました。

特徴としては以下です。

  • Amazon S3に収集した画像を保存
  • 「ファイル選択」から画像を複数枚選択可能
  • 画像をアップロード中にアップロード済みの枚数を表示
  • ファイルが10個未満の場合、エラー文を出力
  • .jpgファイルが10個未満の場合、エラー文を出力
  • アップロードできないファイルがあった場合にエラー文を出力

Amazon CognitoとAmazon S3のセットアップ

このページを参考にセットアップしてください。
権限さえあれば10分くらいでできるはずです。
手順通りだったため、省略します。

Mturkのプロジェクトの作成

このページを参考にMturkのプロジェクトを作成していきます。
Design Layoutの部分で、以下のコードを利用します(チェックボックスは記述しないとエラーがでることがあります)。

See the Pen MTurk sample by Sato Sato (@sssssf) on CodePen.

https://static.codepen.io/assets/embed/ei.js

Preview and Finishで実際に動作させることができます(一番上のエラーは無視でOK)。

スクロールして、「ファイルを選択」を押すと、以下のように選択ウィンドウがでてきます。

.jpgファイルを10個選択して、「Upload file」をクリックすると、以下のように表示されます。

また、Amazon S3を確認すると、選択した画像が保存されていることが分かります(プレビュー画面での実行のため、本来IDなどが入る場所がundefinedになっています)。

選択したファイルが10個未満のときは以下のように表示され、アップロードは行われません。

.jpgファイル以外のものが混じっていると以下のように表示され、アップロードされません。

一通り確認が終わったら、Publish Batchをして、タスクをTurkerに出します。

おわりに

Amazon Mechanical Turk(MTurk)で機械学習用の以下のような画像収集タスクを出してみました。
便利なクラウドソーシングを用いて、効率的にデータ収集をこれからもしたいですね。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

%d人のブロガーが「いいね」をつけました。