皆さんこんにちは、2024年度新入社員の須山大輝です。今回は私が学生時代に行っていたDXに適した生成AIの開発についてご紹介しようと思います。
自己紹介
初めに私についてお話します。
出身は長野県の松本市で高校まで過ごしていました。
大学から石川県にある金沢工業大学を卒業してFIXERに入社しました。
続いて、私が学生時代に行ってきた「特定のタスクに特化した生成AIの開発」ついてご紹介します!
特定のタスクに特化した生成AIの開発をしようと思った理由
学生時代にChatGPTの普及とともに、生成AIが注目されるようになり、様々な場面で利用するようになりました。
たくさん利用していく中で、情報取集能力の凄さや非常に流暢なコミュニケーションができることに驚くとともに、利便性が高く素晴らしいものだと思いました!
しかしその一方では、全く持って根拠のない情報を回答することが多く、信憑性がないと感じることが多く、質問に対する矛盾した回答をChatGPTに質問攻めをしていました。
少しでも嘘を付かないように回答を制御する方法は何かあるか考えたところ、全ての情報ではなく、限られた情報すなわち、特定のタスクに特化することで正しい情報を回答することができるのではないかと思い立ち、共同研究先の企業の方と話し合い、生成AIをスマートファクトリー(特定のタスク)に適応する可能性を探求する一環としてシステムを開発してみようという流れになりました!
大学での研究内容
ここからは私のやってきた研究内容についてご紹介します。
私が行ってきた研究は、工場のマニュアルをデジタルデータに置き換えて、対話形式で問い合わせを行うシステムの開発を行いました。
生成AIをスマートファクトリーに適応する上で生じる課題は、生成AI側の「学習データに含まれない情報を出力できない」「嘘の情報を出力する可能性がある」の2つに加え、企業で利用する上での「外部に情報を漏らすことができない」というものがありました。
生成AIの解決方法として、RAG(Retrieval-Augmented Generation)技術の採用をすることで、「外部の知識ベースを参照する」ことを可能にし、外部情報が正確であれば信憑性の高い情報を回答することを可能にし、企業の解決方法として、「言語モデル・RAGシステムを全てローカル環境で構築する」ことで情報漏洩のリスクをなくしました。
評価結果は、
・生成AIの強みである流暢性は満足のいくレベルで維持されていること
・正確性及び十分性は、改善の余地があること
・文字データが外部情報にある場合は正しい回答を得ることができたこと
・画像内のテキストや位置情報が重要な役割を果たす表などでは適切に情報を抽出できないこと
以上のことが分かりました。まとめ
今回は私がやってきた研究内容についてご紹介させていただきました。
生成AIの分野は開発速度が非常に早く、すぐにより精度が高いモデルや利便性の高いシステムが開発されていきます。
流れについていくことは難しいかもしれませんが、その分追っていくと新しいことだらけで楽しいでのぜひ興味があれば調べてみてください!