ニュース

AI「自分だけの曲」5分以内に完成…NAVERが先駆けて見つける[Geeks]

アイキャッチ
目次

AI「自分だけの曲」5分以内に完成…NAVERが先駆けて見つける[Geeks]

 人間の感性は人工知能(AI)にとって最も難しい挑戦領域です。代表的な分野が美術・文学、そして音楽です。曲からにじみ出る深い叙情や活気、切なさをAIは果たしてどれほど理解し表現できるのでしょうか。AI作曲スタートアップPOZAlabs(ポザラボ)のホ・ウォンギル代表(29)がその可能性についての質問に答えます。

記事の冒頭でAIが作曲した曲も聞くことができます。韓経Geeksが「心地の良い穏やかな音楽」をお願いすると、POZAlabsのAIは5分でジャズ調のピアノ曲を流してくれました。鑑賞してみましょう。

MZ(ミレニアル+Z)世代の音楽分野スタートアップの代表なので、おそらくかなり「外向的な人」だろうという偏見があった。予想と違って、シャイな印象で控えめな口調の「外柔内剛型」の起業家と先月、ソウル江南(カンナム)のあるオフィスで会った。AI作曲スタートアップPOZAlabsのホ・ウォンギル代表(写真)がその主人公だ。

彼は席に座るやいなや、POZAlabsのプログラムを活用して5分以内に長さ約2分の曲を作り出した。 (下にリンクされている曲。) 『#安らぐ #心地良い #落ち着いた #カフェ #ピアノ』といったタグのジャズバラードだという。機械的でも不自然でもない、違和感のない曲だった。

POZAlabsが自社のAI作曲プログラムで作った長さ2分の穏やかなジャズ音楽。この音楽はPOZAlabsの音楽購読プラットフォーム「viodio」にアップロードされる予定だ。


「創作者たちの音源使用の負担軽減」

2018年1月に生まれたPOZAlabsは、編曲、ミキシング、マスタリング、サウンドレンダリングなどの作曲過程を自動化し、約50万個のデータを学習させることによってクオリティを高めたAI作曲スタートアップだ。ホ代表は「人が一つの曲を作るのに2~3日かかるとしたら、AIは5分で作れる」とし、「作曲した多量の音楽データを学習したAIが作った音楽は、既存のAI音楽の中でクオリティ面からみて圧倒的」と自信を表した。

 

こうした技術力をもとに、NAVERをはじめ、Bon Angels Partnars(ボンエンジェルス・パートナーズ)、KB Investment(KBインベストメント)などから数十億ウォン(数億円)規模の投資を受けている。最近、サービスの発売とともに新たな投資の調達を進めている。


POZAlabsはAI音楽サブスクリプションプラットフォーム「viodio」を今月の31日に発売する予定だ。写真はサンプルとして作られたviodioサイトの画面。POZAlabs提供

先月31日には、AIが作曲した音楽を提供するプラットフォームサービス「viodio」を正式発売した。個人クリエイターのためのサブスクリプションサービスでAIが作曲した15種類のジャンル、18種類の雰囲気の音楽5000曲以上を月1万2,900ウォン(約1,300円)で利用できる。

YouTube、ライブコマース、TikTokなど個人の映像クリエイターが急増し、BGM(背景音楽)市場も共に大きくなっている。映像ごとに複数のBGMが必要だが、YouTubeで無料提供する音楽は約3,000曲。クオリティも、種類も限定的になってしまう。

直接、音楽を制作依頼して添付すると、著作権料も馬鹿にならない。個人クリエイターには時間的・経済的に相当な負担だ。需要・供給はあるが収支が合わない状況。POZAlabsはこのようなニッチ市場を狙って初の公式サービスを発売したと説明した。

 

「個人の音楽時代」を開く

「一般の人々は音楽をよく知らなくても、大半は好きな音楽があるでしょう。私たちはデータを通して音楽を作るので、その音楽データをもとに似たような曲を新たに作り出すことができます 」



POZAlabsは、利用者が好きな音楽を入力すれば似たような別の音楽を作り出す技術を開発した。 年内にはviodioにこの機能を追加する予定だ。 /写真=ゲッティイメージバンク

 


クリエイターのためのBGM市場だけでは限界点が目に見えていた。すでにグローバル市場にはJukeDeck(ジュークデッキ)、AIVA(エイヴァ)、Amper Music(アンパーミュージック)など、いくつかのAI作曲企業がある。

他社に比べて音楽のクオリティが高いというだけでは、持続可能性を主張するには不十分だった。オンラインには無料の音楽を提供するサイトだけでも十数カ所を超える。だからといって、まれに生まれる大作やヒット曲を待ちながら事業を維持するわけにはいかない。技術の難易度や要する労力に比べて、収益性には疑問が残る市場だった。

この中で、POZAlabsはAI音楽から一歩踏み出し、「個人化された音楽」に焦点を合わせた。利用者自身が好きな音楽を入力すれば、待ちうた、メタバースなどで活用可能な自分だけの音楽を作れる技術を開発したもの。特定の音楽を入れれば似たような別の音楽を作る機能を、viodioに年内追加する予定だという。

この機能は映像制作市場にも活用できるとホ代表は説明する。彼は「著作権の問題で同じドラマでも、地上波、OTT、YouTubeなどプラットフォームごとに使われる音楽が違うので多くの費用がかかっている」とし「同じ曲ではなくても似たような雰囲気でなければならないため、このような分野に(POZAlabsの技術が)活用されるだろう」と話した。

イメージに合わせて音楽が自動的に生成される技術も開発中だ。このため、延世大コンピュータ科学科のキム・ソンジュ教授を技術顧問として最近迎え入れた。キム教授はコンピュータビジョン分野の専門家としてAIを活用した映像処理分野を研究している。


難関1 忍耐力…「楽しさと確信で持ちこたえる」

AIに作曲を学習させること自体が大きな課題だった。作曲家たちは直接作曲をして音楽データを制作し、開発者たちはMIDIファイルをAIが理解できるデータに加工処理する作業をした。作曲家と開発者の合作であるわけだ。

「音楽らしい」結果に組み換えるためには、多様な音楽を分析しそれに伴う規則も学習しなければならなかった。ディープラーニングの自然言語処理(NLP)技術が適用された。AIはこれを通じて、それぞれの音符と楽譜の規則を一種の言語に解釈する。例えば、C Major(ハ長調)の音階は「ドレミファソラシド」という風に、和声学の規則、調性の体系など多様な音楽の法則とデータを学習することになる。




POZAlabsのAI作曲技術は作曲家と開発者の合作だ。作曲家は音楽データを規定して学習データを作成し、開発者はこれをAIが理解できるように加工処理する。 /写真=ゲッティイメージバンク



意外に「労働集約的」な作業だった。音楽のジャンルも多様で、それぞれに該当するデータを規定し、それを作り入力しなければならなかったからだ。例えば、ヒップホップにはジャズ、Lo-Fi(ローファイ)、オルタナティブなどいくつかのサブジャンルがある。これをよく区別してあげないと、AIは学習過程で混乱に陥る。それぞれの細かいジャンルについても、十分な分析を通じて音楽データを収集し学習させなければならない。

このような技術的な難しさのため、POZAlabsは設立後約5年でようやく初めて公式サービスを発売することになった。2017年初投資を受けて以来、ずっと苦難の連続だった。すでに同様のAI作曲・作詞を行っていた他のスタートアップは「ピボット」(事業アイテム転換)を行い、創業メンバーは会社を去った。

「労働集約的な作業が数年間続いて大変でした。いわゆる『デスバレー』という期間に大変な過程を多く経験し、今の状態に至ります。まずは(事業として)成り立てばとても面白そうだと思いましたし、ビジネスチャンスに対する自信がありました」


難関2 開発者と作曲家のコミュニケーション

ホ代表は音楽の言語、コンピュータの言語をすべて理解する「ハイブリッド型」の人間だ。5歳から15歳までの10年間ピアノを習い、高校時代には「AlphaGoブーム」が巻き起こり、AIに対して関心を持つようになった。これによりコンピュータ科学を専攻したが、バンドサークルでキーボードを担当するなどして演奏を続けた。AIサークルで公募展への出品を準備し、AIを好きな音楽とつなぐことができる点を発見した。

音楽とAIを同時に愛してきただけに、作曲家と開発者の両側のコミュニケーションにも堪能だ。POZAlabsの全25人の社員のうち7人が作曲家であり、残りはほとんど開発者だという。作曲家と開発社に絶えず結果に対するフィードバックをやりとりしなければならないため、彼らのコミュニケーションは必須だ。

当然のことながら、最初からうまくいったわけではなかった。どちらも専門性が強い分野であるため、表現方法、主に使う用語、考え方などが異なり、コミュニケーションに苦労した。

「作曲家がリバーブやEQを追加したり、特定の楽器構成を変える作業が必要な時、なぜ必要なのかについて開発者に説明しなければならないでしょう。『何が違うのか?』 という質問に『雄大さと立体感を与えるためには、このような機能が必要だ』というように論理的に説明しなければなりません 」

POZAlabsはコミュニケーションの必要性を強調するだけでなく、社員を対象にAIセミナーを定期的に行っている。開発者には作曲の講義を行い、お互いの役割に対する理解を深めているという。


「みんなが音楽に携わることが目標」

韓国内外の様々なビッグテック企業もAI音楽に関心を持っている。AI音楽がプラットフォームで活用される余地が大きいという観測だ。

今年2月、AppleがAIで作曲するイギリスのスタートアップ「AIミュージック」を買収したことが目立った事例だ。このスタートアップでは、AIが状況・年齢・用途に応じて適切な音楽を創作する。Amazon Webサービス(AWS)は、作曲するAI技術「ディープコンポーザー」を2020年に発売した。1小節の旋律を入力してジャンルを決めれば、AIが数秒で希望の音楽を完成させる。TikTokが買収した「Jukedeck(ジュークデック)」もコカコーラやGoogleなど大企業との作業を続けている。

AI音楽への期待が高まっている中、POZAlabsの最終目標は誰でも音楽を作り活用することだ。カメラが多くの人をクリエイターの世界に導いたように、専門領域だった音楽も技術の力を借りれば誰でも作曲ができるようになるという趣旨だ。

ホ代表は「自分が望む雰囲気の音楽を作って待ちうたとして使用したり、自分のメタバースにBGMとして使用するなど、多様に活用できるよう技術をさらに高度化する計画」と話した。

 

AIが作ったPOZAlabsの音楽、盗作問題はないのか?

 

POZAlabsは既存の音楽データで学習させない。独自で作曲した音楽を学習させるので、著作権の問題においては自由だ。

しかし、一日にアップロードされる音楽だけでも数万曲を超える最近では、盗作ではない音楽を作り出すこと自体が難しい状況だ。BGM用の音楽の特性上、同じような雰囲気のものが多い。

だから、いくら独自のデータを活用しても偶然の一致でAIが既存の音楽と同じものを作る可能性がある。確率的に低いが0%とはいえない。

「まったく可能性がないわけではないが、AI学習データの中に既存のデータはなく、それなりに創作の過程があるので大きな問題はないと思う」というのがPOZAlabsの説明だ。


 

 キャプチャー写真:POZAlabsのホ・ウォンギル代表が先月21日、ソウル江南区の事務所でインタビューを受けている。イム・デチョル記者

チェ・ダウン記者: max@hankyung.com 

原文:AI가 나만의 곡을 5분만에 뚝딱…네이버가 먼저 알아봤다 긱스 | 한경닷컴 (hankyung.com)

/media/韓国経済新聞
記事を書いた人
韓国経済新聞

KEDGlobalは、読者たちが関心を持ちながらも接近できなかった韓国企業、資本市場、マクロ経済に関するニュースと高度な情報を海外読者の目線に合わせて伝えるプレミアムな多言語経済メディアです。 韓国のビジネスコミュニティと世界をつなぐグローバルメディアプラットフォームを目指します。

  • ホーム
  • ニュース
  • AI「自分だけの曲」5分以内に完成…NAVERが先駆けて見つける[Geeks]