GoogleGeminiをTVCMでよく見るようになりました。Googleの生成AI「Gemini」は能力が格段に上がり実用レベルに。
ChatGPTと良く似たAIですが、不得意なタスクが多いのも現状。そこで、CMの再現ができるかを検証します。
Google Geminiの特徴(2024/08/05時点)
- 日本語対応
- 画像認識、生成あり(マルモーダル)
- Googleが持っているデータに対して最強
Google Geminiとは
Googleが開発した生成AIであり、マルチモーダル対応。無料で使うことができ、アプリもあるためPC・スマホに両方に対応。※マルチモーダルとは文字・画像・音声に対応と思って良いです。
GooglePlayからダウンロードすれば、すぐ使い始められます。(Googleアカウントと紐づいているため)
Google GeminiのCMを再現します
再現する内容は以下
- 「パッシャーン」を描いて
- 思い出が生まれすぎる旅行プラン
- この絵に素敵なお話をつけて
順番にやってみます。
「パッシャーンを描いて」を再現
Google GeminiのCMにある「パッシャーンを描いて」を再現しました。
画像生成は他のAIと遜色ありません。ですが、2024/8現在では、CM通りに命令しても画像生成ができなかったりします。
>> 参考 : Google Geminiか英語プロンプトでも画像生成できない!対処法とコツを解説!
「思い出が生まれすぎる旅行プラン」を再現
上記スクショのように再現できました。沖縄以外にも北海道と小笠原諸島も提案してくれています。
>> 参考 : Google Geminiの旅行プランが本当に使えるのか検証してみた
「この絵に素敵なお話をつけて」を再現
このシーンをGeminiに読み込ませて「この絵に素敵なお話をつけて」と入力。
↓
このように物語が生成されました。マルチモーダルなので画像を認識して文字を生成できています。
>> 参考 : Google Geminiのストーリー生成、実用レベルを確かめてみる
GoogleGeminiに「できる事」「できない事」
GoogleGeminiが得意とするのは「Googleが持っている情報の提供」
逆にChatGPTのような執筆など作成系のタスクができません。
GoogleGeminiができる事
YouTubeの表示と要約が強いです。GoogleGeminiができる事の中で、最も役立つのがこの使い方ではないでしょうか。
例えば「澤村きらりがYouTubeで歌っている歌詞を教えてください」と入力すると、公式動画と関連の歌詞サイトをセットで表示します。
このようにGoogleが持っている情報は一気に表示できます。
YouTubeの要約
また、「以下の動画の内容を要約してください」と入力すると、動画の概要が表示されます。
この使い方をすると、動画を見なくても大まかな内容が把握できます。ただし全容までは分からない書き方になっており著作権にも対応済なのが分かります。
GoogleGeminiができない事
「執筆」ができません。
先ほどの「お話をつけて」程度であれば生成できますが、論文や作文のような『自分で書いたような』文章の生成ができない仕様になっています。
執筆してくださいとプロンプトを入力しても、構成案を出すだけで「執筆」自体は生成されません。
「OK Google」ってどうなった?
「OK Google」で起動していたアプリは「Googleアシスタント」です。現在ではGoogleGeminiが起動するように設定できます。
Googleアシスタントはまだ存在しており、Androidでは「Googleアシスタント」と「Google Gemini」どちらをデジタルアシスタントとして使うかを選べます。
実用的なのは当然Geminiですが、アシスタントの方が優れている機能があったりします。
それは「歌うこと」と「人間ぽい喋り方」
あまり使う機会は無いかもしれませんが、育児では活躍してくれるので個人的には好み。
【birdだった時の過去記事】この先は読み物です
Geminiの前身であるbirdについての過去記事です。ChatGPTが話題だった頃あまり目立たなかったGoogleの生成AIについて書かれています。CHAT-GPTと大文字表記だった頃の話です。ご参考にどうぞ。
(ここから過去記事)
GoogleBardが日本語に対応しました。wait listに登録し、10分後には使えるようになります。
必要なものはGoogleアカウント。
Google Birdとは
Googleが開発している大規模言語AIで、イメージ的にはCHAT-GPTと似たチャットツールです。
Bardの読み方は「バード」ですが、鳥ではなく吟遊詩人と言う意味でつづりが違います。
※鳥=bird 吟遊詩人=bard
始め方
Bardでググるか、こちらにアクセスします。
Join waitlistをタップすれば申し込みできます。
Googleアカウントで登録するとgmailで利用開始の連絡が届きます。
申し込み後は、この画面になります。
メールからアクセス
10分後くらいには登録したアドレスにこのメールが届きます。「Take it for a spin」をタップ。
Bardの画面に
「Take it for a spin」をタップするとBardの画面にジャンプします。
Bardは実験であるという注意書きが表示されます。「Go it」をタップすれば利用開始です。
使い方
基本的な使い方はCHATGPTやBingと同じ感覚です。
最下部のチャット入力欄に質問などを入力します。
日本語に対応
現在では日本語に対応したためCHATGPTと同じように使えます。
※Google Bardは以前は英語のみの対応でした。
View other drafts
新機能としてView other draftsがあります。
質問に対する回答を3パターンから選ぶ事ができます。
回答3パターンを一度に作成しますが、生成は10秒程度とスピーディ。
Bingも3パターンでの回答ができるので将来的に似た使い方ができるかもしれません。
回答3パターンの特徴(印象)
- 一般論
- 専門的
- 実用的
View other draftsの回答例
draft 1(一般論)
一般的な内容ですが、「作り方を知りたい」という検索意図には添いません。
一般論としてどのように扱われるかが知りたい場合には使えるかもしれませんが、使い所は限られます。
draft 2(専門的)
「作り方を知りたい」という検索意図に合いました。
しかし専門的な内容であり、一般的なカレーではありません。
フェヌグリークシードって何だろう?と思います。
カレーやシチューではよく使われるローレルも『月桂樹の葉』と表記する不親切さを感じます。
draft 3(実用的)
検索意図に合い、かつ実用的な内容が記載されています。
調べ物をする際には、この回答を1に持ってきてほしいところ。
Googleサービスとの連携
回答最下部にアップロードボタン( 『↑』マーク )がついています。
ボタンタップで回答内容を、GoogleドキュメントやGmailにコピペできます。
ググってボタン(消えました)
日本語対応したBardは『ググってボタン』が無くなりました。
ただし、今後復活するかもしれないので項目を残しておきます。
定番の使い方ができるか確認
深津式は対応できるか
GPT-3感がありますが、一応できるっぽいです。
深津式汎用プロンプトとはテキストAIに役割を与えて、文章を限定的に出力させる方法です。文章の精度が上がります。
分割タスクに対応できるか
分割タスクに対応できます。
「調べる」「列挙する」「まとめる」が一度に行えました。
しかし出力精度が低めのため、細かなファクトチェックが必要です。
内容は概ね合っていますが、細かな任期にズレがあります。
任期最短の総理も森氏ではありません。(※最短は東久邇宮稔彦氏の54日間)
まとめ 使った感想
Google Bardは精度が発展途上であり、実用はまだ厳しい印象を受けました。
しかしGoogleドキュメントなどと連携できるため、精度が上がればmicrosoft365の代わりになる可能性も感じます。
現段階(2023/04/19)では調査はBing、テキスト生成はGPT4かCHAT-GPTが優勢な印象です。
。
コメント