« 稚拙な空幕長の自称・ロンブン | メイン | Windows Live »

v.morish and straight

STRAIGHT と v.morish の記事が IT PLUS の記事 "1年後にはオリコン入り!? 「初音ミク」超えた音声合成技術" に出てきています。感動を伝えているのはいいがこの記事中身がさっぱり見えないので少々説明を含めて考えたいと思います。

まず、初音ミクというか Vocaloid からです。Vocaloid のキモは周波数ドメインアーティキュレーション接続法というヤマハがノウハウを持っている技術です。単純に言うと 50 音のペアをあらかじめ録音しておいてなめらかに聞こえるように補完するという形です。これは、先日、札幌であったイベントの席上でのクリプトンフューチャーメディアの社長の発言から読み取りました。

で、v.morish というかその中核である STRAIGHT なんですが、STRAIGHT は乱暴に言うと音声信号を入力して、そこからフォルマントのような成分やスペクトル包絡、非周期的な成分に分解することができる技術です。私が触ったことのあるバージョンだと基本周波数F0はスカラー量で得られたかと思います。そして、逆方向の変換も相当に高品質にできます。

こういった個々の成分上で、処理を行うことで加工が行える事実が v.morish のキモだろうと思います。こういった方向性のソフトだと、Roland の V-Vocal だとか、ソフトだと Melodyne だとかが知られています。単純に基本周波数 F0 をいじるだけでも結構面白いことができます。そして、成分に分解することで時間軸上の情報をいじったりしてリズムにかかわる範囲、たとえばアマチュアの声を入力してプロっぽくしたりするわけです。

まあ、言うまでもないんですがこの辺の技術は高音質な分析と再構成にあるので、各種の成分が主観的にどう影響しているのかという研究は必要です。この辺がまあ、感性工学と呼ばれる分野のひとつの柱ともいえるのかな。

感じる・楽しむ・創りだす 感性情報学感じる・楽しむ・創りだす 感性情報学
原島 博

工作舎 2004-05-17
売り上げランキング : 248251

Amazonで詳しく見る
by G-Tools
このエントリーをはてなブックマークに追加 Save This Page to del.icio.us このエントリーをlivedoorクリップに追加 このエントリーをニフティクリップに追加 このエントリーをBuzzurlに追加このエントリーをBuzzurlに追加 このエントリーをFC2ブックマークへ追加 このエントリーをnewsingへ追加 このエントリーをYahoo!ブックマークに追加

トラックバック

このエントリーのトラックバックURL:
http://www.cworld2000.com/cgi-bin/mt/mt-tb.cgi/456

コメントを投稿

(いままで、ここでコメントしたことがないときは、コメントを表示する前にこのブログのオーナーの承認が必要になることがあります。承認されるまではコメントは表示されません。そのときはしばらく待ってください。)

About

2008年11月05日 20:53に投稿されたエントリーのページです。

ひとつ前の投稿は「稚拙な空幕長の自称・ロンブン」です。

次の投稿は「Windows Live」です。

他にも多くのエントリーがあります。メインページアーカイブページも見てください。

検索

この Weblog について

Creative Commons License
このブログは、次のライセンスで保護されています。 クリエイティブ・コモンズ・ライセンス.
Powered by
Movable Type 3.35