presampの仕様まとめ


チラシの裏(UTAU調声メモ)は、この「presamp仕様まとめ」ページ以外を移転しました。 

移転先:チラシの裏 ~UTAU調声メモ~

調声に関する知識やUTAUの仕様などをまとめています。ustなど配布も。

 

移転に伴いサイトの構造がちょっとややこしくなっています。

右のもくじ一覧は全くあてになりません。 当サイトの表ページは自HPです。

 

このページを他サイト(Twitter等)で紹介する場合は直リンクでお願いします!


presamp初心者の方向けのトラブルシューティングと

ある程度UTAUに慣れている人向けのpresamp動作まとめ(文字だらけ)です。

presamp簡単講座も作ったのでどうぞ(図解多め)

質問、訂正や追記して欲しいことなどありましたらぜひぜひ教えてください!

 

このページでフォローしているpresampのバージョン:0.871

このページの最終更新:2016/2/16

 

免責事項:

この記事は私が勝手に書いたもので、作者のデルタさんとは(一切とは言わないけどあまり)関係ありません。

きちんと検証した項目とそうでない項目があります。

今後のpresampバージョンアップによって仕様が変わる可能性があります。

 

※以下、先行発声=pre、オーバーラップ=ove

 

もくじ

presampとはなんぞや? 概要、配布ページ紹介etc

トラブルシューティング 困ったときは?インストール方法も少し。

基本動作 

└音素の自動変換について

子音長、クロスフェードについて

分割機能について

音源ごとの変換例

ピッチの維持について

例外 presampの仕様を逸脱した歌わせ方

その他 開発中バージョンについてetc


presampとはなんぞや?

「単独音?連続音?CVVC?なにそれおいしいの?」という人や、

「CVVCの画面見づらっ!ノート分割多っ!死ぬ!」という人、はたまた

「自動調整におまかせして手抜きでクオリティの高い調声を」というおサボりさんのためのツールです。

 

単独音のustを再生すると、presampが勝手に連続音やCVVCに変換し、

ついでになめらかに歌うように自動処理してくれます。

見えないところで変換してくれるので画面はスッキリ、

でもどの音(連続音、CVVCなど)が鳴っているのかわからなくなる欠点も。

その点はこのページで解説していきます。

 

基本的に連続音の子は連続音に、CVVCの子はCVVCに変換され、単独音の子はそのまま。

連続音とCVVC両搭載の子は、両方を良い感じに切り替えてくれます。

連続音と単独音とCVVCの子にデュエットさせる場合もustを使い回し可能!

 

また、作者さんがautoCVVCの開発を一旦ストップしpresampのほうに専念しているそうなので

今のところCVVCを一番綺麗に歌わせることができるツールです。

実際にどの音素が鳴るのか目で見て歌わせたい!という人は、諦めてautoCVVC2.0が出るまで待ちましょう。

(現行版autoCVVCは不具合が多い他、なめらか化処理が微妙だそう。上級者向け)

→追記:autoCVVC2.0系β版が出ました。性能はpresampとほぼ同じですが開発版です。

 

関連サイト(公式ブロマガ)

presamp配布所

presamp.iniの仕様 ←presamp非対応の音源をpresampで動かしたり、分割・語尾などの動作をカスタマイズしたいときなどに書くプリセットの詳細。沼向きの資料

multi-prefix.map概要 ←presampの機能のひとつであるmulti-prefixについて解説。3音階弱音源と4音階強音源を混ぜて使いたいんじゃー!などという猛者にうってつけのぜひともUTAU本体に実装して欲しい機能。

 

 

具体的にどれぐらい画面スッキリかというと、これぐらい↓


トラブルシューティング

導入編

・UTAU本体は最新版ですか?

・presamp本体は安定版の最新ですか?(開発版は特殊な動きをする場合あり)

 

インストーラーがうまく動かない人は:手動でインストールできます。以下やりかた

・インストーラー版じゃないほうのpresampをダウンロードします。

・「presamp.exe」「wavtoolex.exe」をUTAU本体がある場所にコピーします。

 (ついでにreadme類も同じ場所に入れておくのが無難)

 UTAU本体がある場所って何?という話はpresampの話題からそれるので各自ググって

 ※要はpresampとwavtoolexがわかりやすい場所にあればいい。あとで場所を指定することになります

  その際に、他のエンジンやデフォルトwavtoolと同じ場所にあるとわかりやすいな、ってだけ。

・「setup.pdf」「tutorial.ust」は導入の説明図とサンプルustです。必要なら控えておいてください。

・「predit」はプラグインです。普通に他のプラグインと同様にインストールしてください。

・「hook4~」は、中のreadmeにインストール方法が書いてあるのでそれに従ってください。

・これでフォルダの中身は全部なはずです。あとは↓の設定編を確認してね!

 

設定編

・プロジェクトの設定→ツール1・ツール2は"両方"presampになっていますか?

・UTAUのツール→オプション→レンダリング・キャッシュのチェックは?(詳細は配布所へ)

・同梱プラグイン「predit」のツール1は必ず「wavtoolex.exe」。

 UTAU標準装備のwavtoolは使わないでください。

 

再生編

・1回めは再生できたのに2回め再生するとおかしい

 →1回め再生時の残骸(キャッシュ)が悪さしてるので、一旦preditを起動するとキャッシュがリセットされて直る

  (preditが消してくれるキャッシュは選択範囲内のみ)

  ※メロディの途中を選択するとこうなりやすい。先頭から次の休符まで込みで選択し再生されたし

 バグではなく仕様です。

・「前の音符or休符が短すぎて、次の音符の先行発声のほうが長くなっちゃったとき」に音がおかしくなる

 →修正待ちの不具合。直すのが大変な部分なので後回しだそうです

・メイン音源は鳴るけど表情音源が鳴らない

 →presamp.iniの設定ミス、もしくはprefix.mapの設定ミス。

  presamp.ini の仕様を参照の上[APPEND]欄を編集。

  また、prefix.mapってなあに?(マルチもあるよ)にmulti-prefixのやり方が書いてある。

・よくわからないけどなんかおかしい、音がズレる

 →音符のプロパティの先行発声とオーバーラップとSTPは空欄ですか?

  ※STP:スタートポイント。エンベロープの形・位置を維持したまま音をms単位で左にずらすやつ

  presampでは分割や変換がかかる都合上、pre,ove,STPは使えません

 

その他

・音源フォルダ(Readmeが入っている場所)にoto.iniはありますか?

 (音源が子フォルダに分けて入っている場合でもこの階層にoto.iniが必要。中身は空でいい)

・音源フォルダ名に&を入れるとエラーを吐くらしい

 

↑を全部確認してもおかしい or ソフトのバグっぽいのを発見した場合は、Twitterで「presamp」というワードを含めて呟くとたいてい作者さんに捕捉してもらえる

 なお、presampは開発中のツールなので作者さんが把握しつつまだ直っていないバグもあります。


基本動作

☆音素の自動変換について☆

・前が休符の場合、「- ○」(先頭音)が使われる

 (フレーズ途中を選択した場合、再生選択範囲の先頭も先頭音扱いになる。なので休符~休符を選択して再生してね)

 - ○がない場合は単独音(無印のCV)が使われる。

 録音されていない歌詞を指定したノート(音抜け、ダミーノートなど)の次の音は無印優先。

 

・連続音なければCVVCなければ単独音 の順で変換される

 ただし音階や表情が切り替わるところは、CVVCがあればCVVC化する

 (違う種類の音源同士で母音クロスフェードしないように。たとえば囁きと叫びの音源を母音でクロスフェードすると違和感が出るので、CVVC接続にして子音でクロスさせる) 

 なお、ustに打ち込んである連続音エイリアス(「a あ」のa、「* あ」の*など)は無視されるので注意。

 (アップデートで変わった?反映されるようになったかも)

 VCがない場合や母音は、音源切り替え箇所も連続音>単独音になる。

 

・叫、囁などの表情音や複数音階の音源について、ustで表情(または音階)が指示されている場合、

 無印連続音より表情音CVVC、表情単独音を優先させる

 ※指定された表情の音源がない場合は無印と同じ扱いにする

 

・CVVC音源の場合、ノートが短すぎるときはCVVC化せずに単独音で出力する(そのほうが綺麗だから)

 具体的には、「CVVC化した時にCVの母音部分の長さが20msを下回るとVCを生成しません」らしい。

 外国語音源では必ずVCを挟まなければならない形式の音源があるので、presamp.iniで選べる仕様。

 

・母音は基本的に連続音化するが、ない場合のみ自動で母音結合される。

 母音結合の際は「* ○」があればそれを使う。

 

・例えば「か」「か2」が収録されている音源で「か2」と打ち込むと「か2」が優先されるが、

 「あ」「a さ」「a s」「さ2」を収録してある(「さ」がない)音源では

 「あ」「さ」と打ち込もうが「あ」「さ2」と打ち込もうが連続音化される。

 CVVC化したいときは手打ちで「あ」「a s」「さ2」にする必要がある。

 

・presamp.iniのreplace機能は完全一致で動作する。

 「S=sh」だけ登録しておいて「a S」と打っても「a sh」にはならないので注意

 

 

☆子音長、クロスフェードについて☆

・CVVC化するときのVCのノートの長さ(=子音長)は次のCVの先行発声による。

 presamp.iniをいじればVCの長さから取得する設定にできる 。

 

・母音-母音、子音-子音間のクロスフェードはオーバーラップがイイ感じに増えて繋ぎが滑らかになる

 ※単独音接続(母音-子音の繋ぎ)や破裂音(presamp.iniで破裂音と指定した音)はならない。 

 C-C間はCVの原音設定や音符プロパティのove長が無視され、preの80%まで増やされる。

 V-V間は、前のノートが短いせいでクロスフェードが減った場合に、減る量を(UTAU標準の減り方に比べて)ちょっとマシにする。

 

以下、

1.普通のCVVC(オーバーラップが増えて自動クロスフェード) 例:さ

2.無声破裂音(a kのノート始まり=母音の終わり=オーバーラップの位置。クロスフェードしない) 例:か

3.有声破裂音(VC長=先行発声。クロスフェードしないところだけが1と違う) 例:が

・子音速度を変えることでVC長を操作できる

 (100より大きい場合はVC長は減り、CVの子音長も子音速度に合わせて短くされる。

 

  100より小さい場合はVC長だけが増え、CVの子音の長さは引き伸ばされない byゆ鳥さん

 

・破裂音のCVのoveがマイナスの数だった場合、手打ちCVVCではUTAUの調整機能がはたらいて

 (前のノートが短い場合、子音を減らす処理がかかるので)

 

 子音が短くなることがあるが、presampではそうならないよう配慮されているらしい。

ちなみに、手打ちではVC長をove~pre間の長さにし、CVのpre分は休符をはさみ、CVのoveを0にすることでこれを再現できる。

(赤がpre+oveの長さ、緑がpreの長さ)

 

 

☆読み込み上限突破機能☆

UTAU本体の仕様では孫フォルダ内の音源は読み込めない。

voice>音源ちゃん>C4の中の音源は歌うけど

voice>音源ちゃん>強>C4の中の音源は歌ってくれない。

presampを使うと、孫フォルダ内の音源も使えるようになる(特別な設定は必要なし)

 

読み込める量の音源を子フォルダに、残りを孫フォルダに入れることでUTAUを騙しつつ大量の音源を扱うことができる。

音源を大量に録り過ぎて読み込めないぜ!という一部のハンパねえ人用の機能。

 

 

☆multi-prefixについて☆

4音階通常音源と、5音階強音源と、3音階弱音源を混ぜて使うんじゃー!

→それぞれの収録音階が違うからprefix.mapが使えない!!

これを解決する機能。

 

使い方はこちら(マグ・メルへ行く舟

例として表情音源が孫フォルダ内に入ってますが、表情音の保存場所はどこでもいいです。

 

 

☆分割機能について☆

CVVC化とは別に、ノートを分割する機能がある。

presamp.iniでオンオフ切り替え可能。デフォルトではオンになっている。

 

[あい]→[あ][い]みたいなノートの分割&歌詞の分割をやってくれるのだが、この機能の真価は英語などの海外音源で発揮されるので、普通に日本語音源を使いたいときはオフにしてOK。

(オフのほうがUTAU本来の動作に近いので、presampに慣れてない人はオフ推奨)

逆に外国語音源を使いたいときには必須の機能なので、音源配布時にpresamp.iniを同梱するときは

[SPLIT]

1

と入れておけば、普段分割オフで使っている人もその音源だけ分割オンで使うことができる。

 

分割の仕方については、まず子音の長さが原音設定をもとに決まって、残りを母音の数で均等に分ける。

例えば「word」なら発音記号はw3dなので、一つのノートに[w3d]と入れると、分割で[- w3][3 d-]になる。

分割時には、まず後半を原音設定の長さを参考に[3 d-]にして、残りの前半部分が[- w3]になる。

母音が2つある単語なら、母音の長さは2等分される。

二重母音(oUなど)は1つの母音として扱われる。

 

以前は[sh]が[s]と[h]に分割されたり、表情音のマークが発音と勘違いされて分割されたりしていたが、現在はpresamp.iniの進化によってだいぶ誤作動が減ったようなので気にしないで大丈夫。

誤分割される場合は[SPLIT]をオフにするか、[VOWEL][CONSONANT][NUM][APPEND][PITCH]あたりを見直すといいかもしれない?

 

 

英語音源の使い方(ベタ打ちustの作り方から分割の仕組み、調声のコツまで)を動画にしたので

 

詳しいことはこちらをどうぞ。


音源ごとの変換例

単独音のみの音源に、ustが

 単独音→単独音で再生

 連続音→単独音で再生

 CVVC→VCは無音でそれ以外を再生(今後のバージョンアップでサポート予定らしい)

 

連続音のみの音源に、ustが

 単独音→連続音で再生

 連続音→連続音化をかけなおしてから再生(最新版は歌詞通りに歌うっぽい?)

 CVVC→VCは無音でそれ以外を再生(今後のバージョンアップでサポート予定らしい)

 

CVVCのみの音源に、ustが

 単独音→CVVCオーバーラップ上げで再生

 連続音→CVVCオーバーラップ上げで再生

 CVVC→CVVCオーバーラップ上げで再生

 

連続音・CVVC両方ある音源に、ustが

 単独音→音階や表情が変わるところのみCVVC、あとは連続音(前述)

 連続音→ 〃 (CVVC変換されるところを連続音化させたいときは後述の「!」使用)

 CVVC→CVVCオーバーラップ上げで再生

 

※CVVCはCVとVCがある音源だが、CVとは単独音(れんたんじゅつ)のこと。つまり CVVC=単独音+α


ピッチの維持について

UTAUの仕様上2つ前のノートにはピッチが反映できないので

こういうピッチを「さ」のノートに設定すると「あ」に反映できない。

棒読みの「あ」と、ピッチが反映された「a s」がクロスして変な感じになる。


先に単独音状態でピッチ調声しちゃった時や、もともと連続音用に作ったustをCVVCの子に歌わせるような場合、手打ちやautoCVVCでCVVC化すると↑が起こり、ちゃんと歌ってくれないので注意!

(この現象自体はCVVC音源に限らず起こる)


そういう場合はautoCVVCではなくpreasampを使う。

単独音(or連続音)で調声してpresampでCVVC化すれば、一応この現象を回避できる。

ただし、すでに↑のような状態になったustをpresampで歌わせても効果がない。

ピッチがノートをまたげるのはpresampで(見えないところで)ノート分割する場合だけ。


例外

以上の法則を逸脱した歌わせ方をする場合は!,?を使う

 

例:

CVVCでa kを入れずに[あ][か]と歌わせたい→[あ][!か]

 

連続音で[- あ][- か]と歌わせたい→[あ][!- か]  ←別に「- あ」と打ってもいい。結局変換されるので同じ

連続音で[- あ][n か]と歌わせたい→[あ][!n か] ([- あ][n か]→[- あ][a か]に自動変換されるため)

→アップデートで連続音入力を汲み取ってくれるようになった模様?

 

※prefix.mapがある場合、音階名まで入力する必要はなくなったよ!

また、prefix.mapと違う音階の音を鳴らしたいときに!はいらないよ!

表情音で歌わせたいときも!はいらないよ!

 

?マークはprefix.mapを無視してほしいときに使う(UTAUの仕様)


その他

☆開発中バージョンについて

現在開発中バージョンはありません。 

 

☆クロスフェード最適化について

presampを使う時はUTAUエディタ上でクロスフェード最適化をする必要がない。

 

若干話が逸れるが、masaoさんが開発された「位相合わせ機能付きwavtool」というのがあって、これが自動的にクロスフェードを最適化してくれる優れものなのです!!

…で、presampでは自動でノートが分割・変換されるので、pre,ove,STPはうまく反映できないしクロスフェード部分の最適化もできない。そこでpresampに同梱していたwavtoolex(複雑なエンベロープに対応したwavtool。これもmasaoさん作)に位相合わせ機能も付けてもらってイマココ。


このページは、

http://www.twitlonger.com/show/n_1s76mu5

http://www.twitlonger.com/show/n_1s88nd5 に追記・訂正したものです