GPT-10が登場するとPrompt Engineerはどうなるか?
2024-12-23
azblob://2024/12/19/eyecatch/2024-12-23-gpt-10-prompt-engineer-future-000.png

FIXERで、プロンプトエンジニア第一号として入社した高桑です。
Prompt Engineerは世界的にも新しい職種なので、
どんなミッションを持ち、具体的にどんな業務を遂行するチームなのかが不透明になりやすいです。
そこで、今回はこのページにて明文化しました。

実は1年前にも同じテーマの記事を書いたのですが、それが↓こちらです。
https://tech-blog.cloud-config.jp/2023-10-19-first-person-hired-as-prompt-engineer

この時から1年経過し、色んな変化を観察してきた上で、
1年越しのアップデートをかけた内容を本日ご紹介いたします。

value

まずはプロンプトエンジニアの職種として発揮するべき価値です。
【】の中は、高桑個人の見解で業務の難易度を記しています。

Solution社内外を対象に、生成AIの導入をソリューションとして提供します。監修ユースケース選定の筋がよいか監修する
設計ソリューションとして提供するプロンプトの要件定義
開発ソリューションとして提供するプロンプトの開発
Productプロダクトの設計と開発のうち、生成品質に影響を持つ領域を担います。設計生成フロー全体またはその要件
RAGのフロー全体またはその要件
開発プロダクト環境内でデフォルトで提供されるbot
プロダクトの各生成フローのバックエンドに仕込むシステムプロンプト
ResearchSolutionとProductでの各場面で、要件やLLM×プロンプトの微調整を、仮説をベースに行いますが、その仮説検証の根拠となる知識を土台として蓄積します。LLMユースケースごとのLLM選定の標準化
プロンプトプロンプトの評価を標準化
目的ごとの最適なプロンプトの標準化
新プロンプトを論文から調査し、応用方法を標準化
ユースケースユースケースごとの検証知見を標準化
倫理や業界規制のルールを標準化

スキルセット

  1. プロンプト開発
    1. ユースケースごとに最適なLLMを選定できる
    2. どの言語でプロンプトを書くか判断できる
    3. LLMごとのバイアスを検出できる
    4. LLMごとのバイアスを最小化できる
    5. ハルシネーションに対する仮説を立てられる
    6. ハルシネーションに対する仮説を検証し、プロンプトの微調整を自らの意思で完了できる
    7. ドメイン知識を入れ込んだプロンプトの設計できる
    8. 微調整に伴うLLMパラメータの設定できる
    9. 倫理観点での出力コントロールできる
  2. 品質担保
    1. 生成品質を担保するためのテストケースを設計できる
  3. システム設計
    1. UXを設計できる
    2. RAGのアーキテクチャの要件を設計できる
  4. ユースケースの監修
    1. 生成AIで効率化 or 付加価値を出せるのかを判断できる
    2. 生成AI導入におけるinputとoutputの要件を設計できる
  5. プロンプトの標準化
    1. 標準プロンプトの要件を定義できる
    2. 標準プロンプトの変数を切り分けて、プロンプトを標準化できる
  6. 技術的な専門知識
    1. モデルの内部構造、transformerの原理、注意メカニズムの詳細を深く理解することです。この知識があると、AIの挙動をより精密に制御し、特定のタスクに対する最高のパフォーマンスを引き出すプロンプト設計が可能です。

世界のPrompt Engineerはどんな業務をしているのか?

FIXERのPrompt Engineerと結果的には概ね同じ内容でした。
一方で、FIXERでは取り入れていない内容を下記に整理します。
※調査対象の企業
Anthropic(Prompt Engineer, Research Engineer), NICE, Accrete, Coralogix, Trend Micro, Vertiv, Proto
FIXERの中途採用の求人票

思想

  1. 評価しているLLMプロジェクトとは「複雑で巧妙なプロンプト構造やLLMの挙動の体系的評価を示すもの」である
  2. プロフェッショナルなプロンプトとは、堅牢で十分テストされていることであり、プロンプトはソリューションである(a robust, well-tested prompting solution)
  3. 品質は下記の観点で保証するべきである
    1. 異なる文脈やデータセットでも頑丈で信頼性があり、汎用的であること
    2. バイアス、不正確さ、意図しない結果を検出し、解消できていること
    3. 倫理指針に従い、有害な出力を回避できていること

スキルセット

求めるスキルセットはTechnical SkillとSoft Skillに分かれる

  1. Technical Skill
    1. Python
    2. NLP技術、言語モデル、プロンプトエンジニアリングの概念に関する深い理解
    3. 機械学習モデルの評価、ファインチューニング、デプロイに関する知識。
    4. Knowledge of language structure and construct
    5. Knowledge of type systems
    6. Knowledge of parse trees and ASTs
    7. Knowledge in Semantics
    8. Enhance our natural language transation to Dataprime language using collected data
    9. 言語モデルに関連する分野(言語学、哲学など)での学士号以上を保有していること
      ・言語モデル、トークン化、アテンション、デコーディングなどの自然言語処理および生成に関する原則と概念に関する豊富な知識
  2. Soft Skill
    1. 高度な分析力と問題解決能力。
    2. 複雑な概念を非技術系の関係者に説明できる優れた文章力と口頭コミュニケーション能力。
    3. 言語や言語学への強い興味と創造性。

業務

  1. 新たなAIツールの評価をする
  2. AI/NLP/プロンプトエンジニアリング技術に関する最新情報を常に把握する
  3. A/Bテスト、ユーザーからのFB、データドリブンで生成精度を向上する
  4. パフォーマンス指標やベストプラクティスをドキュメント化する
  5. プロンプトのテストを効率化するツールの開発貢献

GPT-10が登場するとPrompt Engineerはどうなるか?

世間の見解

未来の高度に進化したLLM(例えばGPT-10)では、専門知識や工夫を必要としない一般的なプロンプトでも、素晴らしい回答が得られるため、プロンプトエンジニアの役割は不要になる。

高桑による総評

便利なツールに対して、受動的に口を開けて待つのではなく、AIを主体的に応用して攻めるのであれば、AIがどこまで便利になっても「設計」、「エラーハンドリング」、「ディレクション」は常に必要になると思います。
こういったマネジメントの手法の1つとして、現段階では「プロンプトが有効的である」という段階に過ぎないです。
つまり、「プロンプトエンジニア」という呼称に縛られることなく、世界中の情報を対象に「最先端の技術」や「LLMを利用したサービス」の動向などを学び続ける姿勢が肝心になるかなと思います。

ChetGPT(o1-preview)による総評

LLMがどれほど高度に進化しても、プロンプトエンジニアリングの重要性は増す一方であり、専門性やカスタマイズ、倫理的配慮などの観点から、プロンプトエンジニアは引き続き必要不可欠である。

具体的な話として、GPT-10が登場する頃の時代に、よりニーズが高まっていくであろうスキルセットを以下に記します。

  1. ドメイン知識を融合したPrompt Engineering
    1. 高度なLLMの限界
      1. GPT-4からGPT-10へ進化するように、学習すればするほど正規分布のようにより、一般的な回答を生成しやすくなるだろう、という仮説がある。
        特に、医療、法律、金融などの高度で専門的な分野においては、標準的なプロンプトでは対応しきれない細かなニュアンスや要件が存在すると思われ、より適切なコンテキスト設定や精密な指示が必要と考えられる。
    2. Prompt Engineerの役割
      1. 特定の業界に特化した具体的な業務への生成AIを応用する場合は、GPT-4よりもプロンプトエンジニアリングによるパフォーマンス向上のポテンシャル幅が拡大するため。
  2. 思考工程が重要な生成結果を評価するためのPromptの評価
    1. 高度なLLMの限界
      1. 訓練データやアルゴリズムのバイアスから完全に自由ではなく、出力に偏りや誤解が含まれる可能性は残る仮説がある。
        プロンプトエンジニアは、これらのバイアスを最小化し、論理的にも倫理的に適切な出力を得るためにプロンプトを調整する役割を持ちます。
    2. Prompt Engineerの役割
      1. 工程が重要な、バイアスや生成結果の確率的な揺れを最小限にしたいユースケースでは、分析、意思決定、評価、企画、アイデアだしなどでは、工程に大きな影響を持つプロンプトの監修が必要になるため。
        AIの出力をそのまま受け入れるのではなく、その結果がどのような入力や条件に基づいて得られたのかを理解し、説明できる必要があるため、結果として、AIの出力を正しく評価・解釈するためには、入力(プロンプト)の設計と管理がますます重要になる。
        一方で、結果のみが重要で、事実確認系ができるようなユースケースでは、ドメイン知識を持つ有識者による評価で可能である。
  3. 価値創造のプロンプトエンジニアリングは、LLMが進化するほどニーズインパクトが高くなる
    1. 高度なLLMの限界
      1. ビジネスの価値創造に繋がる「発展的な問い」をAIに投げかけられる人材が、独自性のあるプロンプトを設計する必要がある。むしろ、LLMは高度になるほど多様性と創造性が強化され、人間を凌駕する可能性がある。それを倫理などを守りながら活用する人材(プロンプトエンジニア)が必要。
    2. Prompt Engineerの役割
      1. GPT-10が登場した時代では、効率化により獲得した時間で「何をするべきか?」が見えていない領域に対して、価値創造をするべく生成AIと対話するようになるため。未知の可能性や新しいインサイトを引き出すプロンプト作成は、プロンプトエンジニアの高度な工夫が重要です。
  4. 複雑なシステムの統合とカスタマイズのサポート
    1. 高度なLLMの限界
      1. 進化したLLMが組織のシステムと統合される際、特定のワークフローに沿った応答や、カスタマイズされたアウトプットを実現するプロンプトの設計が必要です。
    2. Prompt Engineerの役割
      1. プロンプトエンジニアがこのような環境に合わせた最適化を提供することで、LLMのビジネス利用が円滑に進みます。
  5. 倫理的・法的コンプライアンス・社会的配慮の管理
    1. 高度なLLMの限界
      1. 倫理的な判断や社会的な文脈を完全に理解することは難しいと思われる。
    2. Prompt Engineerの役割
      1. バイアスの排除や倫理的なガイドラインの遵守できるような、プロンプトを設計する。