IPA


開発成果一覧へ





2004年度第1回未踏ソフトウェア創造事業  採択案件評価書


 



1.担当PM


 伊知地 宏 (ラムダ数学教育研究所 代表)



2.採択者氏名


 代表者

吉川 美奈子(有限会社ポジティブエッジ 代表取締役)

共同開発者

原 陽一(株式会社サーバードメイン)



3.プロジェクト管理組織


 株式会社サーバードメイン



4.委託金支払額


 8,000,000円



5.テーマ名


 自動作詞システムの開発



6.関連Webサイト


 http://posedge.co.jp/



7.テーマ概要


 本プロジェクトは,与えられたメロディデータにあわせて自動的に日本語の歌詞を生成するシステムである“リリカ(LYRICA)”の開発を行うものである.
 歌詞の生成には隠れマルコフモデルを利用する.多量の歌詞データを形態素解析したものを元に,一定の関連を持った語彙をあつめた語彙テーブルを構築し,歌詞に現れる日本語の特徴をとらえた形態素間の遷移テンプレートを抽出して歌詞を生成するものである.




8.採択理由


 広い意味の歌謡曲の曲調にあわせて自動的に作詞を行おうという非常に意欲的な試みである.隠れマルコフモデルによる学習と歌詞生成のためのデータベースを組み合わせて歌詞を生成するというもので,技術的な裏付けもかなり高いものを感じさせる.また開発代表者は工学者であると同時にシンガー・ソング・ライターでもあり,プロの音楽家としての経験もソフトウェアの開発に十分に活かされるものと思う.自動作詞は非常に難しい問題であるが,開発されるソフトウェアがこの難問の壁を打ち破る可能性が十分にあると感じる.未踏性,実現性も高く,ある程度のレベルのソフトウェアが出来ると娯楽 (ゲーム) として,完成度が上がるとある程度のプロ作詞家の代替も可能となる可能性もあり,社会への影響力も大きそうである.以上の理由より採択とする.是非とも,開発者の作詞レベルを超えるような自動作詞システムを開発してもらいたいものである.



9.開発目標


 多少の手直しをするだけで作品として納品できるレベルの「日本語の歌謡曲」の歌詞を,作詞を支援するというレベルではなく,自動的に生成するレベルのシステムを開発することが目標である.ここでは,ポップス、フォーク、ロック、などの「ボーカルを主体とする5分程度の長さの楽曲」を総称して「歌謡曲」と呼ぶことにする.




10.進捗概要


 11月末の中間報告会の時点では,歌詞の収集やその形態素解析などは行われていたものの,歌詞生成に関しては全く目処が立っておらず,非常に危険な状態であった.12月からはミーティングを開いてPMが全面的に関与し,いくつかのアイデアを提供したところ,やっと開発が順調に進展し,なんとか開発期間中に割りとまともな半自動作詞システムを開発できた.




11.成果


 以下のサブシステムの開発が行われた.

 (1) データ取得サブシステム
  ・収集曲数:約2万曲
  ・語彙サンプル数:約500 万件
  ・語彙数:約5 万語
 の収集データをRDBMS に格納し、IPA 品詞辞書に準拠して
  ・品詞:約90 種類に細分化
  ・活用型:約70 種
  ・活用形:約30 種(品詞+活用型に従属)≒ 総形態素数:約500
 に分類した.

 (2) 学習サブシステム
 歌詞の独特の表現方法に適合するように形態素間の遷移 (HMM 連結) テンプレートを作成した.また,歌手をジャンル,キャラクタなどの別に分類し,歌詞もテーマ・ストーリー別に分類して,「歌詞生成データベース」を構築した.

 (3) 歌詞生成サブシステム
 「歌詞生成」を、「フレーズ生成の繰り返し」とみなし,入力メロディ処理で得られた「フレーズの長さ (音数)」に対する語彙の割り当てを,指定された拘束条件のもとで行い,候補を表示するようにした.その際,単純に1つの形態素に1つの語彙を選んでゆくだけでは連接として不適切な場合が発生するため,連接実績のある語彙から選択するようにしている.全ての組み合わせの連接確率を持つのは現実的でなく,連接の最小単位である2gram (bi-gram) でも十分実用的な効果が確認でき,結果として,HMM (n-gram) の構成要素である形態素の並びに対し,語彙2-Gram 表からの選択に改良して語彙検索を行うことで,スムーズな日本語の歌詞の生成を可能にした。
 楽譜に歌詞を割り当てるユーザインタフェースは以下のようになっている.




12.プロジェクト評価


 自動作詞という未知の分野に対して,ある程度の (半) 自動歌詞生成システムを開発できたことの評価は高い.ただし,これは作成されたソフトウェアのアルゴリズムやプログラムの質が極めて良いということではなく,歌手,曲を手作業で分類したことによる効果が大きいと見ている.シンガー・ソング・ライターが自分の欲するものを開発した効果 (ユーザと開発者が同一である効果) がここに現れていると言える.

 ・未踏性: A
  おそらく初めて開発されたまともな自動作詞システムであると思う.
 ・先進性: A-
  歌手や歌詞の分類をちゃんとしたところに技術面での新しさがある.
 ・実用性: A-
  かなり広い範囲の歌謡曲に対して作詞が半自動で行え,トライ・アンド・エラーも容易であるので実用性は高い.
 ・社会への影響: A-
  この手のものはゲームとしても楽しめるもので,社会へのインパクトもある.
 (A: 高い,B: 並,C: 低い)



13.今後の課題


 まずいろいろな人に使ってもらい,実用上の問題点を明らかにすることが大事である.また,ユーザインタフェースが貧弱なのでもう少し改善することが望まれる.さらに,商品化を目指す場合には,手作業でやっている歌手,歌詞の分類を体系的に行う方法か,あるいは優れたユーザインタフェースを開発して分類作業を楽にすることが必要であろう.
 まだまだ課題は多いが,非常に期待されるソフトウェアであるので,さらに開発を続けて商品にまで仕上げてもらいたいものである.


  ページトップへ   






  Copyright(c) Information-technology Promotion Agency, Japan. All rights reserved 2004