検索フォーム


ニコ動投稿動画


プロフィール

deja音色

Author:deja音色
なんでdeja音色かというと、Rioさんていう人と弾き語りデュオをやろうという話になってじゃあわたしデジャネイロにするーっリオ・デジャネイロだねあははといったきりまだデュオが実現してないからdeja音色が一人歩きしてる状態っ

UTAUSNS ID=111
ボカロにゃっぽん ID=8939


最新コメント


カテゴリ


月別アーカイブ


最新トラックバック


最新記事


スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

「ただのレラさん」サンプル音域についてのメモ

UTAU音源「ただのレラさん」のサンプル音域についての考え方を、とある経緯でMac音家SNS内DTMコミュでまとめてみたので、Blog向けに改訂して掲載します。

◆「ただのレラさん」現行スペック
下記URLに、主にUTAUでの利用を想定したスペックを掲載しています。

 http://dejaneiroo.net/rera/spec.html

ごく簡単なスペックシートですが、これだけでもあると助かる、というご意見を数名の方からいただいています。
また、PDFなどのマニュアルとしてDLアーカイブに含まれるのではなくて、「Web上でダイレクトに参照できる」ことが、実はキモのつもりです。

以下、UTAU向けの内容を除いた収録情報です。

 ・フォルダ名とその内容
 B2 音域B2で録音した単独音
 D4 音域D4で録音した単独音
 hG3 音域G3で録音した「張った」単独音(腹式呼吸強)
 nG3 音域G3で録音した「温い」単独音(腹式呼吸弱)
 renG3 音域G3で録音した連続音


◆UTAU界隈における音源ライブラリ原音の現状
本題に入る前に、UTAU界隈における音源ライブラリ原音の現状を簡単にまとめます。

UTAUでの歌声合成は、少なくとも現状では「なかば強引に移調」させて歌わせている、といって構わないと思います。
これは、

 ・DTM界隈よりも同人界隈がまず最初に飛びついた。
 ・サンプラーソフトウェア的な考え方が比較的重要視されて
  いない。

という2点が影響し合っているのだと類推します。
そのため全般的に、

 ・原音品質は録音品質および加工品質共に良いとは
  いえない。
 ・ライブラリの収録音域を無視した強引な歌唱が珍
  しくない。
 ・上記2点が大きな原因となって、所謂「UTAUノイズ」
  や「UTAU耳(広義でUTAUノイズが気にならない耳)」
  という用語も一般的である。

というのが現状だと思われます。
この辺りを含めて、時に「劣化ボカロ」と表現される所以と思われますが、それはまた別のお話。

UTAU界隈から入ったものとして、卑下することも悲しいと思うこともなく、事実は事実として受け止めています。
桃音モモという音源を代表格として、(僭越ながら)自音源も含めて一部の音源は、上記の音源品質の課題を重視した指向で開発されています。

Mac音家音源をUTAU用音源としてみた場合、録音品質は確実に最上級ですので、一部の非マカーDTMerの期待は一定以上にあるのではと思われます。


◆収録音域選定についての考え方
さて、本題です。

deja音色はDTMerとしては後進かつ、サンプラー的な思考については慣れていません。
ですがバンドマンとして、かつ、ソフトウェア開発者としての経験は共に人並み以上にありますので、そこをベースに下記の様に思案し収録音域を決定しました。

 ・単独音、連続音の両方でマルチサンプリングするのは
  困難かもしれないので、1音域サンプリングを前提に考
  える。
 ・自分の歌える音域範囲を確認。その結果
   下:A2~上A4
  がなんとかカバーできる限界と判断。無理なく歌えるのは、
   下:B2~上F#4
  程度ということも確認。
 ・中の人が歌える音域範囲を音源の音域範囲として考えて
  みる。
 ・そうすると、F3~B3辺りがアベレージになりそうである。
 ・F3~B3の範囲内で、最も旨みのある(としか言いようが
  ない、歌いやすい and 響きの深い and 複数の発声を出し
  易いなど)G3をまず収録しようと考える。
 ・融通の効くG3では、腹式呼吸の程度と喉の絞りを変えた、
  「温いレラさん」と「張ったレラさん」の2種類を収録。
  また時間と労力から1種類に限定せざるを得なかった
  連続音もG3の1サンプルとして収録。
 ・移調に比較的弱い低音側は無理なく発声できる
  下限のB2。
  低音よりは移調がしやすい高音側は、喉の絞りが
  ハイトーン向けに切り替わるD4。
  をそれぞれ選択し、単独音の↑↓として収録。

考え方のコンセプトは、

 ・クラリネットという特定の音程で音質が切り替わる楽器を
  意識(吹けないのでよくは知りませんがw)。
 ・「(いろんな意味で)良く歌える」音程はどこかが重要なの
  では。
 ・質が切り替わる音程はどこかが重要なのでは。
 ・等間隔のマルチサンプリングはコスト的に望めない
  ので、上記の推論を重視。

です。
また収録して気づいたのは、

 ・音節種類によって最上の音程は変わる。
   ※例えば「ア段はA3がベストだがイ段はBb3かな?」、
    「ナ行は結構高音強いな」など。
 ・同じく音節種類によって、下限と上限も変わる。

です。
このことから、完璧なマルチサンプリング音源を作成するとすれば、音節をも意識した音域設定が必要なんだろうなあ、と漠然とながら認識しています。

こんなところです。
スポンサーサイト

 | ホーム | 


上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。