microsoftのBingがマルチモーダルに対応し、画像の解析ができるようになりました。
マルチモーダルとは画像や音声などの複数タスクを同時進行するAI技術です。
BingにはGPT4が搭載されており、本家ChatGPT Plus(有料版)にも同じく画像解析機能が付いています。
またBingは画像生成にも対応しており、使用するのはDALL・E。
Bingはスマホアプリもあるため誰でも手軽にマルチモーダルを使えます。ブラウザ版・スマホアプリ版どちらも無料で使えます。
Bingには回数制限があります。解除方法を知らないと少しもったいないかもしれません。
※ChatGPT、DALL・EはどちらもOpenAIのプログラムであり、Microsoftと提携しているためこのようなサービスが可能。
マルチモーダルとは
画像や音声など複数のタスクを同時処理できるAI技術のことです。
実用例としては画像をアップロードし、その画像を元にして別な画像を生成するなど。
Bingは画像解析、画像生成、音声入力が可能です。音声入力した時のみ音声出力もできます。
Bingの画像解析はGoogleレンズと似た機能で、画像が何であるかを答えてくれます。
Bingの画像解析とは?
Bingの画像解析とは、Bingにアップロードした画像をGPT4で解析して答える機能です。(同機能と似たものではGoogleレンズなど)
例えば、缶コーヒーの画像をアップロードすると、Bingは「ジョージア エメラルドマウンテンブレンド」と答えます。
さらに、缶コーヒーのブランドや種類、原産国などの詳細情報も提供します。
これは、Bingが画像の特徴やパターンを認識し、データベースと照合することで可能になっています。Bingの画像解析は、単に画像を識別するだけではありません。
画像に関連する他の情報も提供します。例えば、缶コーヒーの画像に関連するニュース記事やレビューなども表示されます。
これらの情報は、BingがWeb上のさまざまなソースから収集し、分析し、整理したものです。
Bingの画像解析は、画像に対する知識や興味を深めることができる便利な機能です。また、画像に関連する他のコンテンツや商品にアクセスすることもできます。
Bingの画像解析はBingスマホアプリ、またはbing.com/analyzeから利用できます。
Bing画像解析の使い方
Bingアプリを立ち上げると入力ボックスが表示されます。
ボックス右端にカメラマークがありますのでタップ(PCのブラウザ版はクリック)
そのまま画像を撮影できますが、カメラマークをタップした後に左下のファイルマークをタップするとあなたが持っている画像ファイルをアップロードできます。
Bingからのアクセスを『許可』すると使えますよ。
Bingの画像生成とは?
Bingの画像生成は『Bing image creator』が正しい名前です。
他の画像生成AIと同じくテキストプロンプト(呪文)に基づいて新しい画像を生成する事ができます。
例えば、「缶コーヒー」というテキストプロンプトを入力すると、Bingは缶コーヒーの画像を生成します。
しかし、それだけではありません。Bingはテキストプロンプトにアレンジを加えて、オリジナルな画像を生成することもできます。
例えば、「緑色の缶コーヒー」というテキストプロンプトを入力すると、Bingは緑色の缶コーヒーの画像を生成します。
さらに、「緑色の缶コーヒーに花柄が描かれている」というテキストプロンプトを入力すると、Bingは花柄が描かれた緑色の缶コーヒーの画像を生成します。
Bingの画像生成は、テキストプロンプトに忠実に画像を生成するだけではありません。
Bingはテキストプロンプトに創造性や芸術性を加えて、驚きの画像を生成することもできます。
例えば、「メタリックな緑色の缶コーヒーが青空を飛んでいるデジタルアート」というテキストプロンプトを入力すると、Bingはデジタルアート風の空飛んでいる缶コーヒーの画像を生成します。
Bingの画像生成は、自分のアイデアやイメージを画像に変換することができる楽しい機能です。また、画像生成の過程や結果を共有することもできます。
Bingの画像生成は、Bingスマホアプリまたはbing.com/create から利用できます。
Bingアプリ内のimage creatorの場所は少し見つけにくいのでこちらを参考にしてください。
Bingの画像解析と画像生成のAI機能を試してみよう
Bingは、画像解析と画像生成のAI機能を追加したことで、ユーザーに新しい体験と価値を提供しています。
Bingは、OpenAIのDALL・Eと連携して、高度な技術と創造性を発揮しています。Bingの画像解析と画像生成は、それぞれ別々にも楽しめますが、組み合わせて使うことでさらに面白くなります。
画像解析と画像生成を組み合わせる
Bingにアップロードした缶コーヒーの画像を解析させ、解析した画像を元にプロンプト(呪文)を追加する事ができます。
身近な人形やオブジェなどの画像にアレンジを加えた画像を生成させることができます。
例えば、さきほど解析したジョージアの画像を元に、プロンプトを追加して再生成します。今回はファンタジックな背景を入れます。
このようにして、Bingはあなたの好奇心や想像力を刺激してくれます。
Bingの画像解析と画像生成のAI機能は、まだ開発途中のものですが、今後もさらに進化していくことでしょう。
Bingの画像生成はDALL-Eですが、プロンプトの勉強にはStable diffusionの教材が情報量も多いため向いています。
画像解析に使うファイル形式は?
Bing画像解析では、JPEG、PNGなどの一般的なファイル形式をアップロードできます。
画像生成では、テキストプロンプトからPNG形式で画像を生成できます。
ただし、画像のサイズや品質には制限がありますので、ご注意ください。
まとめ
Bing画像解析ができること
- 画像の分析
- 画像の取り込み
- 画像を元にAIで画像生成
Bingによる画像解析と、取り込んだ画像を元に再生成する方法について解説しました。
BingはMicrosoftアカウントがあれば誰でも完全無料で使えるので、ぜひ使ってみてください。
スマホ用Bingアプリも同様に完全無料で使えます。
コメント