Googleからのニュースター!?Geminiがプレビューされたので使ってみた
2023-12-20
azblob://2023/12/18/eyecatch/2023-12-20-newly-provided-google-ai-000.jpg

今回は、Googleから12月7日に発表され、14日にプレビューが開始された「Gemini Pro」を触ってみたので紹介していきます。

Geminiってなに?

Googleによって提供されているAIモデルで、「Ultra」、「Pro」、「Nano」の3つのサイズの提供が予定されており、Gemini UltraはGPT-4を超える能力を持つと発表されています。

12月現在、Gemini Proがプレビューとして2024年初頭の一般公開まで無料で使えるようです。また、Gemini Proはテキストで応答を行う「Gemini Pro」と写真を入力できる「Gemini Pro Vision」が提供されています。

Geminiを使ってみる

Google AI Studioへのアクセスする

※Geminiを手軽に利用する場合、Google AI Studioへログインする必要があります。会社などのアカウントでは利用できない場合がありますので自前のGoogleのアカウントを用意しておきましょう。

  1. https://ai.google.devにアクセス
  2. Get API key in Google AI Studioのボタンをクリック
  3. ログイン時の情報などを登録し、Google AI Studioにアクセス

Google AI StudioからGemini Proを使う

他サービスと同様にプロンプトを入力してRunボタンを押すことでAIとやり取りを行うことができます。

Geminiに計算問題を解かせてみました。いくつかの問題を解かせてみましたが、計算能力はかなり高そうです。

Gemini Pro Visionのモデルを使ってみる

Google AI Studio画面右にある Run settingsのModelからGemini Pro Visionを選択することで画像を入力できるようになります。

入出力の例、画像はいらすとや様からお借りしました。

正しく画像を分析しています。

Gemini vs ChatGPT

GoogleによりますとGemini ProはOpenAIのChatGPTで使われているGPT-3.5モデル、GPT-4モデルの間に位置するくらいの性能があるそうです。これが本当なのか、実際に使ってみてざっくり調べてみたいと思います。

参考:https://deepmind.google/technologies/gemini

GeminiとGPTに質問してみた

それぞれにいくつかの質問をして、回答を比較してみます。

GPTのシステムメッセージは空の状態で、質問は毎回新規チャットを作成して行いました。

質問と結果

  1. 自己紹介をしてください。
    • GPT-3.5

      こんにちは!私はオープンAIのGPT-3です。私は最新の自然言語処理技術を利用して、様々な質問や文脈に対して自動的に回答を生成することができます。私は大量のデータや情報を学習し、それを基にして質問に対する適切な回答を提供します。私の目標は、人々がより効率的に情報を得ることができるようにサポートすることです。どんな質問でもお気軽にどうぞ!
    • GPT-4

      私の名前はOpenAIです。人工知能として開発されたチャットボットで、あらゆる種類の質問に答えることができます。私の目的は、情報を提供し、問題を解決し、あなたが必要とする支援を提供することです。私は24時間365日利用可能で、あなたの質問や要求に対応します。
    • Gemini Pro

      私は、自然言語処理の分野で様々なタスクをこなすことのできる AI アシスタントです。私は、大規模なテキスト データで訓練されており、文章の生成、文章の要約、質問への回答、機械翻訳など、さまざまなタスクをこなすことができます。
      
      私は、人間と自然な会話を交わすこともできます。私は、相手の文脈を理解し、それに応じて適切な応答を生成することができます。また、私は、ユーモアを理解しており、時には冗談を言ったり、皮肉を言ったりすることもできます。
      
      私は、常に学習と成長を続けています。私は、新しいデータで訓練されることで、自分の能力を向上させていきます。また、私は、人間と対話することで、人間の言語をより深く理解していきます。
      
      私は、人間を助け、より良い生活を送る手助けをするためにここにいます。私は、あなたのパーソナルアシスタント、あなたの秘書、あなたの友人として、あなたの人生をより豊かにするために働きます。
      
      私は、あなたと知り合い、あなたの人生に貢献できることを楽しみにしています。 
  2. 次の文章を翻訳してください。また、この文章の作品を教えてください。

    文章:A long long time ago there lived an old man and an old woman. OneDay the old man went to the mountains to cut grass; and the old woman went to the river to wash clothes.(桃太郎の冒頭部分)

    • GPT-3.5

      昔々、老夫婦が住んでいました。ある日、老人は山に草を刈りに行き、老女は川に洗濯に行きました。
      この文章は、日本の民話「かさじぞう」に基づいています。
      
      
    • GPT-4

      「昔々、おじいさんとおばあさんが住んでいました。ある日、おじいさんは草を刈りに山へ行き、おばあさんは洗濯をするために川へ行きました。」この文章は日本の伝統的な民話「桃太郎」からの一部です。
    • Gemini Pro

      むかしむかし、おじいさんと、おばあさんが住んでいました。ある日、おじいさんは草刈りに山へ行き、おばあさんは洗濯に川へ行きました。
      
      作品名:かぐや姫の物語 
  3. 次の文章をポジティブな文章かネガティブな文章か判定してください。文章1:今日は私の誕生日です。文章2:事故にあいました。文章3:明日はきっと晴れるでしょう。
    • GPT-3.5

      文章1:ポジティブな文章
      文章2:ネガティブな文章
      文章3:ポジティブな文章
    • GPT-4

      文章1:ポジティブな文章です。
      文章2:ネガティブな文章です。
      文章3:ポジティブな文章です。
    • Gemini Pro

      1. 文章1:ポジティブ
      2. 文章2:ネガティブ
      3. 文章3:ポジティブ 
  4. ダジャレを5つ言ってください。
    • GPT-3.5

      ダイエット中の魚は、ぜんぶ"さかな"せん!
      赤ちゃんが泣いている理由は、"訳"がわからないから!
      ドライブが好きな犬は、"ワン"ダフルな存在!
      サボテンが暗いのは、"光合成"していないから!
      カエルが好きな音楽は、"リブ"サウンドだ!
    • GPT-4

      ピーマンが好きなら、ピースを守ろう。
      運転が好きな人は、運命を運ぶ。
      猫が好きなら、結果にこだわる。
      お茶が好きなら、お達者になろう。
      ハンバーガーが好きなら、ハンパない勢いで行こう。
    • Gemini Pro

      1. 携帯電話が急に消えてしまったので、ショップに行きました。店員さんに「これ直りますか?」と聞いたら、「番号を間違えると圏外になっちゃいますからね。」と返答されました。
      2. 「長い間使ってきたトースターが壊れちゃったな〜」と嘆く私に、友人から「そんなこと言わずにToast(トースト)して!」と言われ、笑ってしまいました。
      3. 「なぜタヌキは本を読まないのか知っているか?」と友人に聞かれたので、「教科書の狸(たぬき)は本を読んでいるよ」と答えました。
      4. 「日本語の『暑い』って英語ではどう表現するか知っている?」と友人に聞かれたので、「It's hot(イッツホット)」と答えました。
      5. 「レンガを積んだ壁が崩れてしまった」と友人に言ったら、「そうか、ガンバの mura(壁)が砕けたか」と返されました。 
  5. 東京都心部に住むことによって得られるメリットを具体例と共に3つ挙げなさい。
    • GPT-3.5

      交通の利便性: 東京都心部に住むことで、電車やバスなどの公共交通機関が充実しているため、移動が便利です。例えば、東京駅や新宿駅などの主要な駅に近く、他の地域へのアクセスが容易です。
      
      商業施設やエンターテイメントの充実: 東京都心部には、ショッピングモール、百貨店、レストラン、劇場、ライブハウスなど、多様な商業施設やエンターテイメント施設が集まっています。例えば、渋谷や銀座などのエリアでは、最新のトレンドや流行を追いかけることができます。
      
      文化やイベントの多様性: 東京都心部には、美術館、博物館、公園、祭りなど、様々な文化施設やイベントがあります。例えば、上野公園には多くの美術館や動物園があり、さまざまな趣味や興味に合わせて楽しむことができます。また、東京都心部ではさまざまな祭りやイベントが開催され、伝統的な文化や最新のトレンドを体験することができます。
    • GPT-4

      アクセスの良さ:東京都心部に住む最大のメリットは、その交通アクセスの良さです。新宿や渋谷、東京などの大きな都市部に住むことで、地方都市では考えられないほどの多種多様な交通手段を利用することができます。例えば、新幹線や飛行機、フェリーなどの長距離移動手段はもちろんのこと、日常の移動にも電車やバス、タクシーなどを選択できます。さらに、各地域への直通便が多数運行されているため、交通の便利さは生活の質を大きく向上させます。
      
      文化・エンターテイメントの豊富さ:東京都心部には多くの映画館、劇場、美術館、博物館などが集まっており、自分の興味に合わせて様々な文化体験ができます。例えば、丸の内にある東京国際フォーラムでは様々なコンサートや演劇が行われ、六本木にある森美術館では国内外の現代美術を鑑賞することができます。また、新宿の映画館では最新の映画を観ることができ、さらには映画祭など特別なイベントも開催されています。
      
      職業の選択肢の広さ:東京都心部には数多くの企業がオフィスを構えており、就職や転職の選択肢が広がります。また、大手企業だけでなく、スタートアップ企業やNPOなど、様々な規模の組織が存在しているため、自分の興味や能力に合わせて働く場所を選ぶことが可能です。例えば、テクノロジー関連の企業が集まる渋谷や、広告業界が多い表参道など、エリアによって特色のある職業を選ぶことも可能です。
      
    • Gemini Pro

      1. **利便性の高さ**
         * 交通機関が充実しており、どこにでもアクセスしやすい
         * 買い物や飲食店、娯楽施設などが充実しており、必要なものがすべて揃う
         * 病院や学校、公共施設などが充実しており、生活に困らない
      
      
      2. **文化的な豊かさ**
         * 美術館や博物館、劇場などの文化施設が充実しており、芸術や文化に触れる機会が多い
         * イベントやフェスティバルが頻繁に開催されており、街が活気にあふれている
         * 歴史的な建造物や史跡が多く、日本の文化や歴史を学ぶことができる
      
      
      3. **国際色豊かな街並み**
         * 外国人が多く住んでおり、国際色豊かな街並みになっている
         * 外国語の看板やショップが多く、海外旅行気分が味わえる
         * 外国料理店やバーが多く、世界各国のグルメを堪能できる
  6. 報告書のテンプレートを作成してください。
    • GPT-3.5

      【報告書テンプレート】
      件名:
      作成日:
      報告日:
      報告者名:
      
      1.はじめに
      ・報告の目的と背景を明記する。
      ・報告の範囲や対象について説明する。
      
      2.調査・分析結果
      ・調査や分析の手法や過程を説明する。
      ・調査結果や分析結果を詳細に報告する。
      ・グラフや図表を使用して結果を視覚化する。
      
      3.課題・問題点の特定
      ・調査・分析結果に基づいて、課題や問題点を特定する。
      ・特定した課題や問題点を具体的に説明する。
      
      4.解決策の提案
      ・特定した課題や問題点に対して、解決策を提案する。
      ・提案した解決策の根拠や効果を説明する。
      ・解決策の実施に必要な手順や予算、リソースなどを明示する。
      
      5.実施計画
      ・提案した解決策を実施するための計画を立てる。
      ・実施計画の詳細やスケジュールを示す。
      ・実施計画に関わる関係者や役割分担を明確化する。
      
      6.結論
      ・報告のまとめと結論を述べる。
      ・解決策の有効性や実施計画の妥当性を再確認する。
      
      7.参考文献・資料
      ・使用した文献や資料のリストを記載する。
      
      以上が、報告書のテンプレートです。具体的な内容に応じて適宜修正や追加を行ってください。
    • GPT-4

      [会社名]
      [部署名]
      
      報告書
      
      報告者: [報告者の名前]
      
      報告日: [報告日]
      
      件名: [件名]
      	1.目的:
      	  ここに報告の目的を記載してください。
      	2.背景:
      	  ここに報告の背景になる情報を記載してください。
      	3.調査・分析結果:
      	  ここに調柔や分析の結果を詳細に記載してください。具体的なデータや図表を用いると良いでしょう。
      	4.考察:
      	  ここに調査・分析結果から導き出された考察や意見を記載してください。
      	5.結論:
      	  ここに報告の結論を記載してください。具体的な行動提案や改善提案があれば、それも記載します。
      	6.今後の推進計画(必要な場合):
      	  ここに具体的な次のステップや行動計画を記載してください。
      	7.その他(必要な場合):
      	  ここにその他重要な情報や注意点を記載してください。
      
      添付資料: [報告に関連する資料がある場合は、その詳細を記載する]
      
      以上
      
      [報告者の署名]
      
    • Gemini Pro

      ## 報告書テンプレート
      
      ### 1. タイトル
      
      ### 2. 要約
      
      ### 3. 目次
      
      ### 4. 序論
      
      * 本報告書の目的と範囲
      * 本報告書の作成方法
      * 本報告書の構成
      
      ### 5. 本論
      
      * 本報告書で扱われているトピックの包括的な概要
      * 各トピックに関する詳細な情報
      * トピックをサポートする証拠
      
      ### 6. 結論
      
      * 本報告書の主要な調査結果の要約
      * 本報告書の調査結果の重要性
      * 本報告書の調査結果の今後の影響
      
      ### 7. 付録
      
      * 調査方法の詳細
      * データの収集方法
      * データ分析方法
      * アンケートやインタビューの転写 

最後に

この他にもいくつか質問をしてみた感じ、GPT-3.5≦Gemini Pro<GPT-4くらいの印象で、個人的にはGemini Proのカタログスペックは体感的にあまりずれはないように感じました。

やはり、GPT-4と比べれば性能的に見劣りはしますが、話している内容の精度を比較的問わないキャラクターとしてのチャットボットの運用や、ネガポジ判定などの簡単なタスクを行わせる場合であれば、十分実用的だと思います。

また、Geminiの料金はトークン数ではなく、入力文字数で価格が決定されていくため日本語をしゃべらせたい場合のコスパは高そうです。

今後発表されるであろうGemini Ultraにも期待が高まりますね。

Gemini Proの無料期間終了後の値段設定
azblob://2024/04/12/eyecatch/2024-04-12-gemini-1.5-000.jpg
2024/04/11
AI/Machine Learning