検索フォーム


ニコ動投稿動画


プロフィール

deja音色

Author:deja音色
なんでdeja音色かというと、Rioさんていう人と弾き語りデュオをやろうという話になってじゃあわたしデジャネイロにするーっリオ・デジャネイロだねあははといったきりまだデュオが実現してないからdeja音色が一人歩きしてる状態っ

UTAUSNS ID=111
ボカロにゃっぽん ID=8939


最新コメント


カテゴリ


月別アーカイブ


最新トラックバック


最新記事


スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

UTAU音源のリビルド-雪歌ユフ音源【後編】

お待たせしました、後編です。
前編では最低限のハイブリッド化を行ないました。
次は原音WAVファイルに手を加えます。
以降「原音WAVファイルに手を加える」ことを「原音処理」と称します。

※「なぜこういう処理をこういう手順で行ったのか」については、最後にまとめて提示します。
※「考え方」は雪歌ユフ音源だけでなく、あらゆる音源に通じると思います(特に複数の別特性の音源をリリースされている音源)。
※以下の手順は、ある程度UTAU音源の構造を理解してる方を前提としています。ですがそれほど難しいものでもありませんので、やってみるのが早いかもしれません。

◆データ比較


最初にfresamp11からの出力がどう変化するのかを聴いてもらった方がよいでしょうか。
以下は、同じustファイルで、原音処理無しのユフ音源から出力したものと、原音処理済みのユフ音源から出力したものです。

 ・原音処理無しのユフ音源
  http://db7.voiceblog.jp/data/dejaneiro/1278457976.mp3


 ・原音処理済みのユフ音源
  http://db7.voiceblog.jp/data/dejaneiro/1278458032.mp3


 ・使用ust pass=yufu
  http://loda.jp/dejaneiro/?mode=pass&idd=2


それほど注意深く聴かなくても、随分違って聴こえるかと。
エフェクト処理無しでも、歌に「所謂、パンチが出てる」印象です。
また、違う音源の同時利用の違和感も大幅に緩和されてると思います。

※ほんとは後者が主目的だったのですが、思わぬ副産物として前者を得ました。


以下、具体的な手順を説明します。ファイルのバックアップはお忘れなく。

◆原音処理-「wavTar」による原音ファイルの一本化


「wavTar」は、耳ロボP氏が開発・配布しているソフトウェアです。
下記のページからDLしてください。使い方も詳しく書かれています。

 http://freett.com/nwp8861/soft/wavTar/index.html

前編のハイブリッド化で、フォルダ構成は下記の通りになってる筈です。

 「雪歌ユフ(2.61版)+ささやき+裏声」フォルダ
  ├「雪歌ユフ(ささやき)」フォルダ
  ├「雪歌ユフ(裏声)」フォルダ
  └「雪歌ユフ連続音(ふんわり)」フォルダ

各フォルダ内に、それぞれの原音ファイルが格納されています。
wavTarの「wavファイル群を1つのwavファイルに結合」をクリックして、それぞれの原音を結合してください。

さて、ここで「ワナ」です。
単独音トップフォルダ内にあるオマケ音源ファイル「ずっと冬だったらいいのに.wav」は、この作業をする間はフォルダ外に出しておいてください。
あなたがどんなに雪歌ユフが好きで、このセリフに愛着があったとしても(わたしはそれほどでもありませんw)、作業の障害になるだけですので、お忘れなく。

結合ファイル名は仮に、

 単独音ノーマル.wav
 単独音ささやき.wav
 単独音裏声.wav
 連続音ふんわり.wav

とします。


◆原音処理-各結合ファイルの処理


各結合ファイルに、以下の処理を施します。

 ・正規化(=ノーマライズ)
 ・DCオフセット除去
 ・EQ処理(ノイズ処理を含む)

正規化については詳しく説明はしませんが、「音量の標準化」といった表現の方が適切だとは思います。
また「DCオフセット除去」についても省きます。
詳しく知りたい方は、適当にぐぐってくださいね。
また、ソフトによって微妙に表現が違う可能性があります。

ここではフリーで入手できる「Audacity」を例に、具体的な処理を述べます。
やることは単純です。

 ・結合ファイルを開く
 ・Ctrl+Aで波形をすべて選択
 ・効果メニュー → 正規化... を実行
 ・下記の設定でOKボタンを押す
  正規化

 ・Ctrl+Aで波形をすべて選択
 ・効果メニュー → イコライゼーション... を実行
 ・下記の設定でOKボタンを押す
  EQ.png

  言葉で表現すると、
   ・150Hz以下の低域をばっさりカット
   ・12kHz以上の高域をばっさりカット
   ・9kHz付近のノイズ溜りを気持ちカット
  になります。

 ・ファイルメニュー → 別名で書き出し
    例)単独音ノーマル_原音処理済.wav など

以上を4つの結合ファイル分繰り返してください。

上記の方法および設定は、あくまで参考例です。
特にEQで「どこをどれだけ削るのか」の最適値を求めるには、さらに突っ込んだ検証が必要かと(とはいえ、一般にはまず気づかれない程度の差ではないかと思いますが)。

また、使用するツールは、機能が備わってる限りにおいて、なんでも構いません。
特にEQ処理はスペアナを併用しつつ、もっと具体的に追い込めると思います。
精度の高いノイズリダクション・ソフトをお持ちの方は、利用してみてもいいと思います(中途半端なものは使わない方がいいと思います)。


◆原音処理-「wavTar」による結合ファイルの分割


wavTarを起動し、「結合wavファイルをwavファイル群に分解」をクリックして原音処理済みファイルを元通り分割します。
念のため、分割ファイル格納用フォルダを各音源毎に作って分割実行。
分割完了後、実際の音源フォルダに放り込んで上書きする、という手順が、各プロセスが明確になって安心できます。


ハイブリッド化の具体的な処理手順は以上です。
wavTarの使い方さえ把握できれば、難しいことではないと思います。
wavTarは単純な機能を提供するソフトですが、Oremo(とsetParam)と同じくUTAU音源ライブラリの開発/整備には無くてはならないツールです。
最後になりましたが、開発・公開していただいてる耳ロボPに感謝♪


◆補足情報


「ただのレラさん」の原音設定をして頂いた巽さんから補足情報が寄せられました。

 ・エイリアスはsetParam(2.0-b091205~)で一括変更
  可能です。
 ・フォルダの構成は一階層まで
  http://utau2008.blog47.fc2.com/blog-entry-128.html

とのことです。
ありがとうございました。


◆ハイブリッド化のまとめ


改めてハイブリッド化の目的と、メリット&デメリットを整理します。

【目的】
 ・収録時期による精度や声質にばらつきの
  ある複数の音源を同時利用できるようにする。
    → フォルダ構成変更とエイリアス変更
 ・異なる音源同時利用時の違和感を最小限に抑える。
    → 正規化とEQ処理
 ・違和感は細かい調声で解消できると想像するが
  余程の調声巧者でない限り現実的ではない。
  原音そのものをチューニングする方向が妥当と
  判断。

【考え方】
 ・UTAUエンジンを通すと、自動的にコンプレッサーが
  効き、音量の均質化を行っているが、最初から原音
  レベルである程度統一されてるに越したことは無い
  のではないか?
 ・であるのならば、原音の結合は行わずに全ファイルを
  独立して正規化した方がよいのではないか?
 ・「中の人の声のばらつきを残す≒原音の一定の尊重」と
  いう観点から音源毎に結合してから処理した方が、
  UTAUから出力した時に「味」が残りそう?
 ・削れば削るほど、音同士は馴染む。どこまで削ろう?
 ・上記の様なことをうだうだと考えました
  終わってからぷらすさんと雑談した時に後付で考えた
  こともありますw

【メリット】
 ・特定の周波数帯をカットしたことで、ある種類のノイズ
  が削減された。
 ・上記に連動してfresamp向けの原音となった。
 ・出力される音が均質化されることで、ミックス時の
  エフェクタの効きに好影響が現れた印象。
 ・音源毎の差異が「歌唱」的な効果を与えるようになった。
  例)語尾は「ささやき」で抜く 等
 ・とにかく立ったり座ったり、マイクに近づいたり
  遠ざかったりが気にならないレベルになった。
  好意的な見方をすると、UTAUシンガーが「マイク
  コントロール」をしているかのような錯覚にw

【デメリット】
 ・特定の周波数帯をカットしたことで、別の種類のノイズ
  が僅かに目立つようになった。
 ・各音源の個性が多少減じた。

こんなところでしょうか。


◆ちょっと別のまとめ その1


「ただのレラさん」のフォルダ構成は、当初から下記の様になっています。

 ルートフォルダ character.txtなど音源情報のみ
  ├ B2 音域B2で録音した単独音 Suffix「↓」
  ├ D4 音域D4で録音した単独音 Suffix「↑」
  ├ hG3 音域G3で録音した「張った」単独音
  │   (腹式呼吸強) Suffix「+」
  ├ nG3 音域G3で録音した「温い」単独音
  │   (腹式呼吸弱) Suffixなし
  ├ ext 「息」や「子音」 周波数表は一律C4合わせ
  └ renG3 音域G3で録音した連続音
      (7モーラ巽版がベース)

音色の、「標準」を決められらない以上、当然の論理的帰結です。
システム的にも、メンテナンス性と拡張性の双方にメリットがあります。

逆にルートフォルダに原音を格納することには、特別なアドバンテージは無いと判断しています。
エイリアスを設定する必要が無い(しなくても「あ.wav」は「あ」として利用できる)というのは、ちょっとした楽ができるだけではないかなと。
エクセルやキーマクロ付きテキストエディターを利用すれば簡単に付加できるので、「基本的にエイリアスは付ける」というコンセンサスがあった方が、混乱がかえって少なくなるのではないでしょうか。

単独音1種類だけを公開する場合でも、

 ルートフォルダ charactor.txtなど音源情報のみ
  └ C4 音域C4で録音した単独音

などとした方が、気が変わって新音源を追加するときも面倒がありません。
今後は当初からこの形態での音源リリースが増えていく流れかもしれませんね(個人的には、この形式が標準になっていって欲しいです。なんとなく。スッキリしてるからw)。

ただし、どんどん拡張していくと、Suffixばかり増えていきますので、そこが面倒は面倒。
音源切り替え用(しかも高機能)プラグイン的なものが欲しくなりますね。


◆ちょっと別のまとめ その2


「原音設定」に関してはn.h.pを初め、様々な研究が行われているUTAU界隈です。
がしかし、原音の質、ライブラリの構築手法の分野では、表立っての動きは見当たりません(ミクAppendの影響か、テトチームが音源の拡張性を意識し始めたのが記憶に新しいですね)。

原音の質においては、コンデンサマイク+マイクプリアンプによるスタジオ録音の桃音モモが頭一つ以上抜けています。
羨ましいので、レラさんのVer2は宅録コンデンサマイク+マイクプリアンプにしたいな、などと考えています。
どちらも持っていませんがw

ライブラリ構築には、「録音音節リストおよびエイリアスリストに推奨されるリファレンスが無い」という大きな問題もあります。
極端な喩えをしてみると「音源毎にドレミファソラシドの表記が違う」のと大差無いんじゃないでしょうか、この現状。
ベタのUSTでも音源を変えると、そのままでは一部歌えない場合があるんですよね。
本格的かつ利便性重視の音節&エイリアス一覧を作ろうという動きは出てこないものでしょうか。

さて、UTAU音源。
これまでは「たった一人の中の人」、しかも音楽機材や録音に関する知識とスキルも拙い方が、単独でライブラリを構築してきた流れだったかと思います。
ですが徐々に一定のスキルを持った人とのコラボ音源、チーム制音源が増えて来ている気配も。
deja音色は、DTMツールとしてのUTAU音源ライブラリの品質向上を望む一人ですので、こういった動きに期待しています。

そういうこともあって、今回の作業と記事を思いついたわけですが、困ったことがひとつ。
再配布できないんですよね。

仮に、複数の音屋が集まって特定のUTAU音源をみっちり整備したとしても、中の人とチームが組めていない限り配布は困難という現状です。
もったいないなあと思います。

何かうまい枠組み、仕組みが出てこないものでしょうか。
自分でそういった動きをしようと思ったこともありますが、それしてると曲や動画を作る時間が無くなります。


余談も含めて非常に長くなりました。
しかも最後は愚痴だし(汗
以上で〆たいと思います。
お付き合いいただき感謝です。

また関連したネタを思いついたら書いてみようと思いますっ
でじゃっ♪

スポンサーサイト

UTAU音源のリビルド-雪歌ユフ音源【前編】

◆UTAU音源ライブラリの現状
UTAUはソフトウェアとして、未だ開発途上にあります。
当然、音源ライブラリも常に発展途上。

最近では、当然のように同じ中の人の音源でも、複数の収録時期による精度や声質にばらつきのある音源が多数リリースされています。
調声巧者、ミックス巧者でない限り、それら複数の音源を同時に利用することは困難な状況です。

困難な理由として、

 ◆単発でリリースされる音源は、単独で利用することを
  前提にしたフォルダ構成およびエイリアスになっている
  ため、それをひとつのフォルダにまとめる作業から始め
  る必要がある。

  ※この処置を仮に「ハイブリッド化」と呼ぶことにします。

  ※この時点でUTAU初心者には、大きな障壁となり個別に
   使わざるを得ない可能性が高い。
  ※システム側(UTAU本体)は、既にハイブリッドでの利用
   になんの問題もない。
  ※手前味噌で恐縮ですが、「ただのレラさん」は最初から
   ハイブリッド前提のライブラリ構築をしています。

 ◆フォルダ構成を工夫し、エイリアスをなんとか設定したと
  しても、同じ歌の中で利用すると、音源毎に大きな違和感
  が発生する。

 ◆違和感とは、
   ・シンガーが立ったり座ったりしてるかのような上下移動
   ・シンガーがマイクに近づいたり遠ざかったりするかのよ
    うな前後移動
  のことです。
  これでは聴いてる方も、非常に落ち着かない。

 ◆上記とは別に「ノイズ」の問題がある。
  収録環境が不定のため、ノイズの程度にも差が出て
  しまう。
  このノイズがUTAUエンジンからの出力に、音源毎の
  差異を生じさせる。

 ◆「ノイズ」は(deja音色の大好きな)新エンジン「fresamp」
  ではこれまでのresampler以上に、品質劣化を引き起こす
  場合がある。
  ※ノイズの特性により、一概には言えません。
  ※双方のエンジンの特性から「fresamp向きの原音」、
   「resampler向きの原音」という分類ができるかと。

この日記は上記の内容について、原音そのものをいじることで、ある程度でも解消することを目的としています。
ある程度でも解消されると、調声時およびミックス時の手間が、大いに削減され、最終的な音品質向上が見込まれます。


◆UTAU音源ライブラリ 雪歌ユフ


今回は、↓の動画で使用させていただいた(いつも利用させてもらってますががが)、雪歌ユフのUTAU音源ライブラリを取り上げます。
※ハイブリッド化を施した音源ライブラリは再配布禁止という理由から、当然配布できません。




雪歌ユフには、

 ◆単独音 ノーマル v2.61
 ◆単独音 ささやき 初版 ※v2.61フルセットに含まれる
 ◆単独音 裏声 初版 ※v2.61フルセットに含まれる
 ◆連続音 ふんわり 初版

という収録時期の異なる、4種類の音源が存在します。


単独音と連続音は別フォルダでの利用を前提としているため、まずそこを解消する必要があります。

この作業、それほど面倒ではありません。

◆音源の最低限のハイブリッド化


※処理の前に、バックアップはお忘れなく。

まず、下記の処理を「雪歌ユフ連続音(ふんわり)」フォルダ内のoto,ini(原音設定ファイル)、施します。

 ◆単独音とダブっている「あ」などを別の名前(エイリアス)
  にする。

  例)
   オリジナル → _ああいあう.wav=あ,483,231,3191,21,0
   別の名前 → _ああいあう.wav=あ+,483,231,3191,21,0

  「=あ,」を「=あ+,」にするだけです。
  「+」にした理由は、「他のエイリアスで利用されていない」
  だけで、特に意味はありません。
  自分の好みの「半角記号」で良いと思います。

上記の処理を「あ」から「ん」まで施し保存(「が」とか「ふぁ」とか「う2」なども忘れず)。
そのあと「雪歌ユフ連続音(ふんわり)」フォルダを「雪歌ユフ(2.61版)+ささやき+裏声」フォルダに放りこむことで、最低限のハイブリッド化は完了します。

◆原音の処理


次は原音に一定の処理を施します。
これは上記ほど簡単ではないため、後編に回させてください。
処理する項目だけ列挙すると、

 ◆wavTar(耳ロボP謹製)でフォルダ毎に原音を一本化する。
 ◆適当なDAWソフトまたは音声処理ソフトを利用して、ノー
  マライズ処理およびEQ処理(ノイズリダクション処理含む)
  を施し、改めてモノラル出力する。
 ◆再びwavTarで、一本化された原音を元通り分割する。
 ◆元の各フォルダの原音に上書きする。

といった感じです。
以上の説明で理解できてしまう方もいると思います。
ちょっとした罠がありますが。

後編は、1~2日後に再び投稿したいと思います。
しばしお待ちくださいませ。


 | ホーム | 


上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。