NAVERウェブトゥーン、視覚障害者も鑑賞可能な「バリアフリーウェブトゥーン」最初の一歩を踏み出す
NAVERウェブトゥーン、視覚障害者も鑑賞可能な「バリアフリーウェブトゥーン」最初の一歩を踏み出す
NAVERウェブトゥーンが視覚障害者のウェブトゥーン鑑賞を助けるAI技術を公開した。これまでウェブトゥーンは視覚障害者が利用しにくいコンテンツに属していたが、NAVERウェブトゥーンの意味ある挑戦によって、今後はイメージ型コンテンツ全般の鑑賞に対する敷居が低くなることが期待される。
NAVERウェブトゥーンは5日に開かれた情報アクセシビリティ技術とノウハウ共有イベント「第10回 2022 広くセミナー:現在を超えて、新しい世界へのアクセス(Beyond Now, Access to the new world)ウェビナーでAI技術を活用したウェブトゥーン代替テキスト提供技術を初めて公開した。
NAVERウェブトゥーンが業界初で「バリアフリー(Barrier Free、高齢者や障害者も住みやすい社会を作るために物理的・制度的障壁を崩そうとする運動)ウェブトゥーン」サービスを開始すれば、バリアフリーコンテンツの拡散にも大きく貢献するものと見られる。NAVERウェブトゥーンは完結および連載中、1話に約18万個のウェブトゥーン代替テキストを適用し、来年1月にはバリアフリーウェブトゥーンベータサービスを開始し、ユーザーの意見を反映してサービスを補完していく予定だ。 バリアフリーウェブトゥーンベータサービスは、まず韓国語にのみ適用され、今後サービス言語を徐々に拡大する計画だ。
最近、ウェブトゥーンの中のシーンやセリフは「ミーム(meme、インターネット流行コンテンツ)」になるほど生活に深く関わっているだけでなく、ウェブトゥーンを原作とする動画コンテンツが増えるにつれて、原作ウェブトゥーンの鑑賞に対する需要も高まった。NAVERウェブトゥーンはウェブトゥーンが大衆文化の一つのジャンルとして位置づけられ、疎外されるユーザーがいないようにすべてのユーザーがウェブトゥーンを楽しんで鑑賞できるよう環境構築するため、昨年下半期から本格的に代替テキスト自動提供機能の開発に着手し始めた。
この日「視覚障害者のウェブトゥーン鑑賞のための小さいが大きな進展」を主題に発表を進行したNAVERウェブトゥーンのユン·スンソプ企画者は「障害者と非障害者ユーザーを分けずにすべてのユーザーという観点で考え続けた結果、難しいが試みてみようという決定を下すことができた」とサービス企画意図を明らかにした。
視覚障害者にウェブトゥーン情報を伝達するためには、ウェブトゥーンのイメージ情報をテキスト情報に変換させ、これを再び聴覚情報に変換させる過程が必要だ。 NAVERウェブトゥーンは数千個に達する完結した作品と毎週新しく追加される数百回目のイメージ情報を早くテキスト情報に変換させる方法を探すことに集中し、1年あまりの研究の末に「AIを活用したウェブトゥーン代替テキスト自動提供」技術を開発した。 テキスト情報を聴覚情報に変換させる過程はスマートフォン運営体制(OS)で基本的に提供する「VoiceOver(ボイスオーバー)」や「TalkBack(トークバック)」機能で実現可能だ。
ウェブトゥーン代替テキストの自動提供は大きくカット分け、台詞領域推論、台詞抽出、台詞順序決定の4つの段階を経て完成される。 NAVERウェブトゥーンが活用した技術は「OCR(Optical Character Reader、光学文字認識)」と「Webtoon Object Detection(ウェブトゥーン・オブジェクト・ディテクション)」技術だ。
ウェブトゥーンは多くの場合、縦に長いスクロール方式で提供されるため、一回の画像サイズがとても大きい。したがって、台詞領域を推論してテキストを抽出する過程に先立ち、カット分け作業が必ず先行されなければならない。 特に、この過程で台詞、吹き出し、カットラインが崩れないようにカットをよく分けないと、以後の台詞を順に並べることができない。 NAVERウェブトゥーンはこれを解決するためにカット、吹き出し、台詞領域などを推論するウェブトゥーン特化オブジェクト探知技術「ウェブトゥーン・オブジェクト・ディテクション」を開発した。
カット分割後にはウェブトゥーン・オブジェクト・ディテクションを用いて台詞領域を推論する。ウェブトゥーンはストーリーが伝達されなければならないという特性のため、吹き出しの順序を明確に認識しなければならず、吹き出しと吹き出しの外の台詞も区別できなければならない。また、建物の看板のように背景に挿入されたテキストが代替テキストに含まれれば、ストーリーの伝達を妨害することもありうる。 汎用的なOCRだけでは異なる吹き出しとカットの単語を一つの文章として認識する場合が発生し、台詞の順序が混ざる結果が発生する。 NAVERウェブトゥーンはウェブトゥーン・オブジェクト・ディテクションで台詞領域を先に推論する作業を進め、このようなエラーを減らした。
ウェブトゥーン・オブジェクト・ディテクションを通じて推論した台詞領域のOCR結果でテキストを抽出し、推論した吹き出しとカットの位置情報を活用して台詞の順序を決定する過程を経てウェブトゥーン代替テキストが完成する。
NAVERウェブトゥーンは、セリフを誰が言ったのかが分かる話者推論機能とセリフのないカットにも代替テキストを提供する機能を開発することを長期目標としている。
「AIで作るウェブトゥーン代替テキスト」発表を進行したNAVERウェブトゥーンAI研究員は「現在のバージョンの代替テキスト自動生成技術はまだ初期段階であり、ストーリーの伝達を完璧にできる代替テキストを作るために継続的に挑戦し研究を進める」と述べた。 続いて「AIからサービスまで」を主題に発表したNAVERウェブトゥーンAIエンジニアのイ·ジフン氏は「AI技術を通じて持続可能な方式で多様な情報のアクセシビリティを支援できると期待する」として「アクセシビリティに対する社会的要求増加は究極的に私たち皆のための方向性」として発表を終えた。
NAVERウェブトゥーンのAIリードであるキム·デシク氏は「代替テキスト提供はNAVERウェブトゥーンが重要だと考える『多様性』という価値を守るための技術的努力の一環」とし、「NAVERウェブトゥーンは障害や言語などの障壁なしに誰もがウェブトゥーンを創作し鑑賞できる環境構築のためにグローバル1位ストーリーテックプラットフォームとしての責任と努力を尽くす」と述べた。
原文:네이버웹툰, 시각장애인도 감상 가능한 ‘배리어프리 웹툰’ 첫 발 뗐다 – 스타트업 스토리 플랫폼 '플래텀(Platum)'
Platum is a media service that specializes in startups, and its motto is "Startup's story platform".
関連記事
-
FAST VIEW、日本現地法人を設立…グローバル市場攻略を本格化
#Platum #AI #グローバル進出 -
webaresoft、API管理ソリューションで資金調達
#Platum #クラウド #グローバル進出 #AI -
ABLYのamood、「ワンストップ」サービスの日本進出1年で取引額3倍増加
#電子新聞 #韓国 #ファッションテック #グローバル進出 #SaaS -
yanolja、みずほ銀行とレジャー金融サービスのグローバルシナジーを模索
#電子新聞 #フィンテック -
韓国・江原道、日米韓三角バイオベルト推進...米国・ボストン、日本・神戸との協議本格化
#電子新聞 #AI #バイオ #グローバル進出 #医療 -
Google playが選定した2024年の「今年のアプリ・ゲーム」受賞作
#Platum #アプリ #ゲーム #エンターテインメント #AI