みかんとAIのお話【自己紹介】
2025-04-17
azblob://2025/04/16/eyecatch/2025-04-16-orange-ai-fruit-grader-000_0.png

はじめに

はじめまして、2025年新卒社員の荻田 翔騎(おぎた しょうき)です。

今回は初めてのTech Blog執筆ということで自己紹介も兼ねて学生時代の卒業研究を紹介したいと思います。
「どういうことをやってたか」を知って欲しいと思ったので、研究の概要がメインです。

みかん × AIの研究してました

私が所属していた研究室は学内でAI関連の研究で有名でして、私も例にもれず「AIプレ選果機を用いた病害虫診断システムの開発」というタイトルでAIを使った社会実装系の研究をしていました。

研究背景をがっつり

研究背景はざっくり書いて本題の技術系の話を多くしたかったんですけど、書いてみたら一番伝えたかったのは背景だったので予告通り「がっつり」です。

この記事を読んでくれている方に農業を営んでいる方はほぼいないと思うので、農業の用語や現状の説明をしたいと思います。私自身も専門外ではあるので、あくまで私が研究で関わった農家さんから教えていただいた話です。

選果って何?

まず、みかんに限らず果物には等級というものがあります。果物の品質のことです。
この等級はみかんの場合、果実の糖酸度と外観によって決まります。この等級を決定する作業を一般的に選果作業と呼び、たぶんほとんどの産地で選果機という機械によって自動化されています。
これ、農家さんにとって収入に直結するすごく重要な作業なんです。が、「なぜそれが収入に関わるの?」などのお話は私の研究と直接関係ないので、今回は割愛します。

今回は「果実の外観が悪いと農家さんの収入が下がる」ということを覚えてもらえればいいです。

ここで、研究タイトルをもう一回見てほしいんですけど、「AIプレ選果機を用いた病害虫診断システムの開発」です。
『プレ』選果機なんですよね。選果って、プレ選果と本選果の2段階があるんですよ。先ほど話した農家さんの収入に関わるのは本選果の話です。
プレ選果は家庭選果とも呼ばれて、各家庭で収穫したみかんの中で、明らかに見た目の悪いみかんをよけておく作業です。
売り物にならないような外観の悪いみかんを本選果に通すと、収入が下がっちゃうんで大事な作業とのことです。

ちなみに、この作業結構大変らしいです。収穫の後にやるわけなんですけど、8時頃から収穫作業を初めて、夕方に終わって、そこから手作業で大体2時間くらいかかるとのことで、全部終わって解放されるのは22時頃と聞きました。
 この生活が最低でもだいたい1ヶ月続きます。

私の地元では実験的にプレ選果作業にも専用の選果機を導入し、2時間の作業時間を約30分に短縮しました。
本選果機より少ないロットで動かすため小型かつ糖酸度測定機能のない専用のものを使用しています。機能制限版とはいえ1台1200万円と非常に高価なため(本選果機はちょっとした工場くらいの大きさがあって、価格は諸々込みで約2億円だそうです。)、効果は大きいですが、全国的にはまだ普及していません。
詳しくは後述しますが、私の研究の第二の狙いはこれに付加価値を付けることで、普及を促すというものです。

外観阻害要因と診断システム

もう一つ、私の研究につなげるために重要な事実がありまして、先ほどお話しした通り、選果機なる機械が存在するのですが、この機械、みかんの等級を判定してくれるんですが、その理由を説明してくれないんです。糖酸度はともかく外観についてはなぜ悪かったか分からないんですよね。

補足ですが、外観が悪いというのは表面に何らかの傷があるという認識でいいです。その原因のことを私の研究では外観阻害要因と呼んでました。外観阻害要因は「害虫」「病気」「日焼け」「果実が何かに擦れた」に大別されます。この中では擦れて傷になることが多いらしいんですが(主に風による揺れが原因なので風ズレと呼ばれてます)、病気や害虫被害の場合、正確な診断は農家さんでも難しいらしいです。

そこで私の研究の出番です。
先述したプレ選果機に機能を追加して、選果作業のついでにAIを使って外観阻害要因の自動診断をしちゃおうってことです。 

何を作ったの?

やっと本題です。システム全体を解説すると短めの論文が出来上がってしまうので、メインの「果実外観阻害要因診断AI」を開発した話に入ります。

届かない教師データ

研究に使用した教師データについて、思い出と一緒に語らせてもらいますね。

私がこの研究にアサインされたのは、高専本科5年生の5月でした。
外部と連携している研究だったこともあり、私がやるべきことはその段階でほとんど固まっていました。

一番重要なAI部分を主に任されたとあって、気合を入れて臨んだのですが、当たり前の話ですが病気のみかんの画像はみかんを収穫しないと集まらないんですよね。
さらに言えば、教師データにするためにはクラス分けをする必要がありますが、先述した通り、高度な専門知識を必要とするため、私のもとに届く前にクラス分けをしておいてもらう必要があります。

そんなこんなで、私のもとに最初の教師データが届いたのは12月に入ってからでした。もちろん、待っている間も遊んでいたわけではないですが、1ヶ月半でAIを作って、卒業論文を書かなければいけないということで、当時はずっと愚痴を言いながら作業をしていた思い出があります。

最終的に使用した教師データについてざっくり説明します。
専攻科でも同じ研究を続けたので、5年生の12月に送っていただいたデータより増えています。

論文の文言をそのまま引用すると「選果機内で撮影されたウンシュウミカン果実の可視光画像8280枚を使用した。クラスは無傷を含む10クラスを用意した。」です。
もう少し噛み砕いて説明します。
研究に使用した選果機には可視光カメラが5個内蔵されていて、これで撮影した画像を元に外観の良し悪しを判断しています。この画像を学習にも流用しました。
クラスの内訳は病害3種、害虫被害4種、日焼け、風ズレ、無傷の計10種類です。

Google Cloudヤバい

AIの学習にはGoogle Cloud(旧称GCP)のVertexAIを使いました。
VertexAIはGoogle Cloud内のAI関連のサービスをひとまとめにしたものです。多分かつてはAutoMLとか呼ばれてたやつだと思います。様々な種類のAIの学習から推論まで行ってくれます(今回は使わなったですが、ラベル付けをしてくれるサービスもあったと思います)。

今回の研究の中核部分はほぼこのVertexAIがやってくれました。
タイトルにもある通り、GCヤバいです。この表現がふさわしいか分からなくて少しひやひやしているんですが、破壊力がすごかったんです、期待とお財布への。

用意した教師データをアップロードして、あとは画面に従ってマウスをポチポチしてれば勝手に学習が始まります
私の場合は大体6時間くらいで学習が終わりました

GCは学習後に作成したモデルの評価も行ってくれます。評価指標は平均適合率です。
私はこの時に初めて「平均適合率」という評価指標を見たんですが、調べたらmAPのことらしいです。こっちはかなり有名ですね。
あんまり日本語訳されてるところを見たことなかったんですが、見たことありますか?機械翻訳の関係ですかね。
mAPは知ってる方が多そうなので解説は割愛します。

私のモデルはこのmAPが0.911でした。目標は0.8だったので非常に良い結果でした。
簡単に操作できるのに、期待を大幅に上回る結果を出してくれた、破壊力抜群ですね。

「専門知識はないけどAI作ってみたい」といった方にぜひおススメしたいんですが、注意点が一つ。
たぶん、クラウドコンピューティング系のサービスは大体そうだと思いますが、ちょっと学生や新社会人からするとお財布への破壊力もとんでもないです

私の場合、6時間の学習で4万円ちょっとかかりました。
また、VertexAIの使い方をググると結構たくさん記事が見つかりますが多くの記事に「学習が終了したら自動でデプロイ」といった内容のチェックボックスのチェックを外すように書かれていました。現在は改善されているかもしれませんが、少なくとも当時はデフォルトの設定で学習するとそのままモデルがデプロイされて、翌月10万円の請求がきたそうです。
私も先に調べてなければ、研究室もしくは教授のお財布を破壊していた可能性があります。

みなさんも個人的に試すときはお財布を破壊されないようにご注意ください。

一応ですが、サポートに電話して事情を説明すれば救済措置があります。本当に使っていないことを確認できたからだと思いますが、先程例に挙げた記事の執筆者は割引として無料にしてもらえたそうです。

あともう一点、気になる点はGCで作成したモデルの学習過程は基本的にブラックボックスである点です。
細かなパラメータ設定が必要ないのは魅力ですが、それは同時にそういった情報が見れないということを意味します。
ちょっと選果機に通じる部分がありますけど、「いいモデルができたけど、なぜ良かったか確かな理由は分からない。」ということになるんです。逆もそうです。思うような結果が出なくても、どこを改善すればいいか分からない可能性があります。

個人で趣味で使う分にはいいかもしれませんが企業で使おうと思うと、これは気になる方が出てくるんじゃないかなと思います。

まとめ

今回は私の自己紹介も兼ねて卒業研究の話をさせていただきました。

みかんの話なんてほとんどの方が知らないだろうなと思い、そっちをメインに書かせてもらいましたが、面白かったですか?

AIやGoogle Cloudの話が聞きたかった方には少し申し訳ないです。
私もVertexAIしか触ってないので、実はあんまり分からなんですよね...

お金に余裕がある方、ぜひGoogle Cloud触ってみてください、結構分かりやすいです。

azblob://2025/04/10/eyecatch/2025-04-10-stock-prediction-using-lstm-intro-000.jpg
2025/04/11
Others