STRAIGHT と v.morish の記事が IT PLUS の記事 "1年後にはオリコン入り!? 「初音ミク」超えた音声合成技術" に出てきています。感動を伝えているのはいいがこの記事中身がさっぱり見えないので少々説明を含めて考えたいと思います。
まず、初音ミクというか Vocaloid からです。Vocaloid のキモは周波数ドメインアーティキュレーション接続法というヤマハがノウハウを持っている技術です。単純に言うと 50 音のペアをあらかじめ録音しておいてなめらかに聞こえるように補完するという形です。これは、先日、札幌であったイベントの席上でのクリプトンフューチャーメディアの社長の発言から読み取りました。
で、v.morish というかその中核である STRAIGHT なんですが、STRAIGHT は乱暴に言うと音声信号を入力して、そこからフォルマントのような成分やスペクトル包絡、非周期的な成分に分解することができる技術です。私が触ったことのあるバージョンだと基本周波数F0はスカラー量で得られたかと思います。そして、逆方向の変換も相当に高品質にできます。
こういった個々の成分上で、処理を行うことで加工が行える事実が v.morish のキモだろうと思います。こういった方向性のソフトだと、Roland の V-Vocal だとか、ソフトだと Melodyne だとかが知られています。単純に基本周波数 F0 をいじるだけでも結構面白いことができます。そして、成分に分解することで時間軸上の情報をいじったりしてリズムにかかわる範囲、たとえばアマチュアの声を入力してプロっぽくしたりするわけです。
まあ、言うまでもないんですがこの辺の技術は高音質な分析と再構成にあるので、各種の成分が主観的にどう影響しているのかという研究は必要です。この辺がまあ、感性工学と呼ばれる分野のひとつの柱ともいえるのかな。
![]() | 感じる・楽しむ・創りだす 感性情報学 原島 博 工作舎 2004-05-17 売り上げランキング : 248251 Amazonで詳しく見る by G-Tools |






