ニュース

Kakaobrain、超巨大AI画像生成モデル「Karlo 2.0」公開

アイキャッチ
目次

Kakaobrain、超巨大AI画像生成モデル「Karlo 2.0」公開

Kakaobrain(カカオブレイン)が、画像を3秒で描く超巨大AI画像生成モデル「Karlo(カーロ) 2.0」を公開した。

Kakaobrainが新たに発表した「Karlo 2.0」は、約3億枚規模のテキスト・画像データセットを学習した超巨大AIアーティストだ。「Karlo 2.0」は、グローバルTop Tierレベルの言語理解力を基に、完成度の高い絵を生成できる性能を備えている。例えば、「青く明るい瞳をした猫 (A cat has light blue eyes)」のような複雑なプロンプト(コマンド)を入力しても、それを明確に理解し、描画することができる。

「Karlo 2.0」の解像度は、最大2048×2048までサポートする。生成する画像の解像度が高いほど、様々な画像サイズでの作業が可能になり、ユーザーは表現したいイメージをより深く、繊細に描くことができるようになった。

それだけでなく、画像上の空間、立体感、動物の毛のようなテクスチャを細かく表現する精密さなどが強化され、実写に近い高品質の画像生成が可能だ。「モダンアーティスト」などを含む各種画風の実装能力も優れており、画像生成速度も従来のモデルKarlo 1.4に比べて短縮され、3秒でユーザーが望む画像を作り出すことができる。

またKakaobrainは、韓国AIエコシステム発展のため、Karlo 2.0 Open API(アプリケーション・プログラム・インターフェース)をKakao Developers(カカオデベロッパーズ)に公開した。従来Karlo 1.4モデルで提供していたOpen APIを、Karlo 2.0モデルにアップグレードしたものだ。Karlo 2.0は、従来のKarlo 1.4に比べ、様々なサイズや比率の画像生成が可能で、高いプロンプト理解度に加え、否定命令(Negative Prompt)機能により、画像生成時に除外すべき表現やキーワードを事前に制御する。

Kakaobrainは、Karlo 2.0 Open APIを発表し、最大500枚まで可能だった無料作成画像数を、月最大60万枚まで大幅に拡大した。

Kakaobrainのキム・イルドゥ代表は「人体の比率や構図、空間と立体感を表現する透視図など、様々な画像データの学習と技術の高度化過程を経て、Karlo 2.0を発表することになった」とし、「多くのデータとユーザーのフィードバックを学習させ、実写レベルの画像を生成すると同時に、より多様なユーザーのニーズに反映できる画像生成モデルに発展させていく」と述べた。

原文:https://platum.kr/archives/210268



/media/Platum
記事を書いた人
Platum

Platum is a media service that specializes in startups, and its motto is "Startup's story platform".