電通がアートディレクターの発想プロセスを学習した AI ART DIRECTOR の開発に Adobe Firefly カスタムモデルを活用 | アドビ

電通がアートディレクターの発想プロセスを学習した AI ART DIRECTOR の開発に Adobe Firefly カスタムモデルを活用

株式会社電通は Adobe Firefly カスタムモデルを活用し、同社のアートディレクターの発想プロセスを学習した画像生成 AI システム「AI ART DIRECTOR」を開発しました。AI ART DIRECTOR は一般的な生成 AI と異なり、簡易なプロンプトでも、プロのアートディレクターが関与したかのような品質の画像を生成できます。また Adobe Firefly は商用利用を前提とした設計となっており安全に活用できます。そのため、業務の最終アウトプットにつながりやすいアイデアを手早く得られる、クライアントとのコミュニケーションが円滑になるなど、品質とスピードの両立が評価されて、クリエイティブ部門を中心にマーケティング部門や営業部門にも利用者が広がりました。国内電通グループ全体では、週平均で約 6,000 枚の画像が AI ART DIRECTOR を使って生成されています。

「プロユースに耐えるラフ案を一瞬で生成できるため、アートディレクターは従来 3 日かかっていた作業が 1 日で完了したり、ノンクリエイターはアートディレクターに依頼してから 1 週間待っていたものが翌日になったりとワークフローが効率化され、より質の高いクリエイティブワークのために時間を使えます。また、雰囲気を確認する程度の簡易な用途であれば、アートディレクターに依頼せずともすぐに手元でいくつかの方向性を生み出せますから、テキストではかなわないコミュニケーションをとる機会が増えて、差し戻しの減少や受注率の向上にも寄与します」と AI ART DIRECTOR の開発に携わった株式会社電通 新納 大輔氏はそのメリットを説明しました。

株式会社電通 新納 大輔氏

アートディレクターのセンスを学習できる Firefly カスタムモデル

広告用の画像は、見た人に一瞬で伝わるものでなければなりません。それを実現するために最適な視覚的表現を常に考えているアートディレクターのセンスをモデル化して学習できるのが Firefly カスタムモデルの強みです。たとえば「このエコボトルは環境に優しく何度でも使える」というプロンプトを入力した場合、通常の画像生成 AI の出力(下図左)と比べると AI ART DIRECTOR の生成画像(下図右)はボトルの中に生態系が生まれるというコンセプトが付与され、背景には主役であるボトルを引き立てる微細なトーンが使われています。

通常の画像生成 AI(左)と AI ART DIRECTOR(右)の生成画像 提供:株式会社電通

「Firefly カスタムモデルを使うと、テキストで入力した表現が、構図・色彩構成・抽象化などによりビジュアル言語として成立した画像が出てきます。新たなインテリジェンスとも言える、これまで解析やモデル化が難しかったセンスを企業のソリューションとして一般化できる能力が Firefly カスタムモデルには備わっているということです」と新納氏は語りました。

次の生成例は「とても怖そうな犬」というプロンプトで生成された画像の比較です。通常の画像生成 AI はやはり画像全体に怖さを描いていますが(下図左)、AI ART DIRECTOR は一瞬で目を捉える部分にフォーカスして怖い犬を印象付けるように表現を生成しています(下図右)。

通常の画像生成 AI(左)と AI ART DIRECTOR(右)の生成画像 提供:株式会社電通

生成 AI をファインチューニングして使う意味

「一般性と専門性があるとして、通常の生成 AI が学習しているのは一般性です。生成 AI をそのまま使用するのではなく、自社の専門性にあわせたチューニングをすれば、より業務に役立つ生成 AI を手にできる可能性があります」と新納氏は指摘しました。

実際に同社が行ったコピーライティングに生成 AI を活用する実験では、コピーライターが単独で作成したコピーよりも ChatGPT を活用して制作したコピーの評価が低下する傾向が見られました。一方、電通のコピーライティングを学ばせてチューニングした ChatGPT を活用して制作したコピーは、コピーライター単独で作成したコピーよりも評価が高くなりました。

「画像生成でも、アートディレクターのセンスを学ばせてファインチューニングをしたいと考えたときに、従来とは違う手法が必要になりました。アートディレクターのセンスは画像だから表現できる暗黙知であり、テキストだけでは共有できないものだからです。そこに登場したのが Firefly カスタムモデルでした。言語化できない画像のセンスを理解して学習し、それがモデルに反映されるということで早速テストしました」と新納氏は話しました。

テストの結果、画像の最適化を確認できたことから、以前より研究していたアートディレクターの発想プロセスでプロンプトを拡張する技術と組み合わせて開発されたのが AI ART DIRECTOR です。AI ART DIRECTOR は、まずプロンプトから 4 つの拡張テキストを生成します。そして、テキストごとに画像を 4 枚生成します。生成 AI は生成するほど良い結果の出る確率が高まるため、一度に 16 枚を生成する仕様になっています。

AI ART DIRECTOR の出力例。シンプルなプロンプトから 4 つの方向性それぞれ 4 枚の画像が生成される 提供:株式会社電通

Firefly カスタムモデルのトレーニング手順

Firefly カスタムモデルのトレーニング手法はシンプルです。任意の枚数の画像を用意して読み込ませると、それぞれの画像のキャプションが編集可能なテキストとして自動生成されます。必要に応じてキャプションを加筆修正し、「トレーニング」をすることで追加学習したカスタムモデルを利用できます。

Firefly カスタムモデルに画像をアップロードするとキャプションが自動生成される(注:アドビが作成したサンプル画像です)

新納氏はこの操作フローを高く評価しています。「まず、画像を説明するキャプションが自動生成されるため作業量が削減されます。そして、アートディレクターが注目すべきポイントを追記できるため思考やセンスを反映できます。初めてトライするとき、自動生成されたキャプションだけでもそれなりの最適化ができますし、使いこなせるようになると画像やキャプションを調整してさらに良い最適化ができます。非常に使いやすい形で提供されています」

同社は Firefly カスタムモデルの検証を 3 週間程行って「広告として注目されるべき点」を学習させられることを確認し、次いで Adobe Firefly API を使ったシステムとの接続試験を 3 週間行い、着手から約 2 ヶ月でサービスを公開できました。

学習データを選別する際の考慮点

Firefly カスタムモデルの学習用素材を選別する際に新納氏が配慮した点の一つは、電通しか権利を持っていない画像に絞ることです。「社内報、広告賞の告知ポスターなどを社内のアーカイブから適切な作品を選別しました。Firefly が著作権に配慮して学習されているのに、追加学習に著作権侵害のリスクがある素材を使うと、安全な利用ができなくなってしまいます」

もう一つのポイントは、アートディレクターの評価が高い画像だけを選んだことです。「アートディレクターがコンテキストを理解できないものを学習セットに入れると、本当に意味の分からないものしかできない生成 AI になってしまいます。そこで、アートディレクターが解釈できるもの、それもテキストで説明できるものではなく、センスで理解できるものを選びました。選別には審美眼が必要であり、このプロセスにもアートディレクターは欠かせない存在でした」と新納氏は述べました。

発想やコミュニケーションの土台として

一般的な画像を学習している Adobe Firefly に、変数として専門性を柔軟に加えられるのが Firefly カスタムモデルの魅力です。電通は優れた社内の作品とアートディレクターのセンスを投入することで、質の高い国内向け広告のラフ案を出力できるカスタムモデルを短期間で開発し、最終的に AI ART DIRECTOR として国内電通グループに提供を開始しました。

新納氏は AI ART DIRECTOR によって、一定の品質が保証されるようになることと、その安心感による高品質化がなされることを期待していると話しました。「アートディレクターはグラフィックで確認していくので、画像の方向性が一杯あって、その方向性の中にもグラフィック表現の仕方が様々出ていれば、アイデアの土台としてさらに良いものを目指しやすいと思います。マーケティングや企画部門でも、言葉では表せないセンスをかなりのレベルで出してくれるので、言葉だけでは難しいコミュニケーションを可能にするものとして使ってもらえれば理想的です」

アドビがお客様のビジネスにどのように役立つのかをご案内します。

導入のご相談