画像認識でサバを見分ける?深層学習に取り組んだ新卒自己紹介
2026-04-30
azblob://2026/04/22/eyecatch/2026-04-23-self-introduction-and-image-recognition-000.jpg

はじめまして。大田 脩平(おおた しゅうへい)です。 

本記事では、2026年新卒で入社した筆者の自己紹介をお届けします。

趣味や特技といった人となりの紹介から、高専時代に取り組んだ魚の画像分類AIの研究内容まで、幅広くまとめています。AIや画像認識に興味のある方はもちろん、新しいメンバーのことを知りたい方にも楽しんでいただける内容となっています。

自己紹介

出身

母校である佐世保高専には7年間(本科5年+専攻科2年)お世話になりました。

近くに佐世保バーガーが美味しいお店があるのでお立ち寄りの際は是非。

専門分野

所属していた学科は、本科:電子制御工学科 → 専攻科:複合工学専攻・情報工学系です。専門科目では、電気系、制御系、情報系といった幅広い分野を学びました。ちなみに、2025年度から電子制御工学科は無くなり、情報系に特化した学科(情報知能工学科)に生まれ変わっています。

趣味

趣味はカラオケです。以前アルバイトをしていたこともあり、一人でも友人とも頻繁に行っていました。

最近はオンラインRPGにもハマっています。

特技

特技というほどでもないですが、動画編集にどハマりしていた時期があり、中学時代にはYouTubeやニコニコ動画に制作した動画をアップロードしたことがあります。高専時代には授業での成果物として、学校紹介動画を作ったりしました。落ち着いたら、また時間を作って触ってみたいです。

推し技術

本科5年~専攻科2年では、主に画像認識技術について研究してきました。ここでは、研究でも用いた深層学習と画像認識についてご紹介します。

深層学習とは

大量のデータから特徴を自動で学習する方法です。

「深層」とは、学習に用いるニューラルネットワークの層が深い(多い)ことを指します。層を重ねることで、単純な特徴から複雑な特徴まで、段階的に学習できるようになります。

身近な例としては、スマートフォンの顔認証や音声アシスタント、翻訳アプリなどがあります。

画像認識では、CNN(畳み込みニューラルネットワーク)が用いられています。代表的なモデルとしてはVGG、ResNetなどがあります。

CNNとは

CNNを簡単に説明すると、以下のような流れになっています。

  1. 畳み込み層が「線・角・模様」などの小さな特徴を見つける
  2. 層が深くなると、それらを組み合わせて「目・車輪・顔」など複雑な特徴を学ぶ
  3. 最終層で「猫」「車」のように分類する

従来の画像認識では、人が特徴を設計する必要がありました。深層学習では、特徴抽出から分類までをモデル自身が学習する点が強みです。このとき学習するのは、各層(フィルタなど)の重みです。学習時には、正解との差を示す損失を徐々に小さくしていくことで、精度が高いモデルを構築していきます。

研究内容

深層学習の画像認識モデルを用いて、ベルトコンベアで流れてくる類似魚(マサバとゴマサバ)を分類するプログラムを作成しました。現状、人の手によって1匹ずつ選別しているところを、AIを用いた上で機械的に仕分けることによって、魚市場での人手不足の解消や作業員の負担軽減を目指しています。

自身の研究では、上記のCNNに加え、以下のモデルも併用しました。

  • YOLO:物体検出モデル。高速かつ高精度で、画像内にどこに・何が・どれくらいの信頼度で写っているかを判断。魚体位置の特定・魚種分類に使用。
  • ViT(Vision Transformer):ChatGPTなど、自然言語処理の分野で高い性能を示したTransformerを画像認識に応用したモデル。畳み込みを用いない。Attention機構によって特徴間の関係を学習できる。

苦労した点

研究を進めるにあたっては、画像データのアノテーション、出力結果の評価に苦労しました。題材が類似魚であったのもあり、特徴に差異がほとんどない画像の分類は非常に難しいと感じました。

おわりに

今回は、簡単な自己紹介と推し技術の紹介でした。

現在研修中ですが、学生時代に比べて仕事のスピード感は圧倒的に速いと感じています。日々進化するAI技術にも追いつきつつ、生成AIに振り回されないように、これからも勉強を頑張っていきたいです。

どうぞよろしくお願いいたします。