はじめに
Amazonのクラウドソーシング、Amazon Mechanical Turk(MTurk)で機械学習用の以下のような画像収集タスクを出してみました。
特徴としては以下です。
- Amazon S3に収集した画像を保存
- 「ファイル選択」から画像を複数枚選択可能
- 画像をアップロード中にアップロード済みの枚数を表示
- ファイルが10個未満の場合、エラー文を出力
- .jpgファイルが10個未満の場合、エラー文を出力
- アップロードできないファイルがあった場合にエラー文を出力
Amazon CognitoとAmazon S3のセットアップ
このページを参考にセットアップしてください。
権限さえあれば10分くらいでできるはずです。
手順通りだったため、省略します。
Mturkのプロジェクトの作成
このページを参考にMturkのプロジェクトを作成していきます。
Design Layoutの部分で、以下のコードを利用します(チェックボックスは記述しないとエラーがでることがあります)。
See the Pen MTurk sample by Sato Sato (@sssssf) on CodePen.
https://static.codepen.io/assets/embed/ei.jsPreview and Finishで実際に動作させることができます(一番上のエラーは無視でOK)。
スクロールして、「ファイルを選択」を押すと、以下のように選択ウィンドウがでてきます。
.jpgファイルを10個選択して、「Upload file」をクリックすると、以下のように表示されます。
また、Amazon S3を確認すると、選択した画像が保存されていることが分かります(プレビュー画面での実行のため、本来IDなどが入る場所がundefinedになっています)。
選択したファイルが10個未満のときは以下のように表示され、アップロードは行われません。
.jpgファイル以外のものが混じっていると以下のように表示され、アップロードされません。
一通り確認が終わったら、Publish Batchをして、タスクをTurkerに出します。
おわりに
Amazon Mechanical Turk(MTurk)で機械学習用の以下のような画像収集タスクを出してみました。
便利なクラウドソーシングを用いて、効率的にデータ収集をこれからもしたいですね。