いろいろ試験的な

あれこれを置く場所

VoiSona Talkで田中傘に朗読してもらった

また少しご無沙汰でした。

 

先日のMYK-IVの詳細をまだまとめていないままですが、体験版の出た「VoiSona Talk」を試した話を先に。

 

「VoiSona Talk」は、AI技術でリアルな喋り声を再現する音声合成ソフトで、「VoiSona」のテクノスピーチさんが開発中です。

 

体験版の詳細はこちら。

Mac版、Windows版があります。本体は無料で、ボイスライブラリとして女性の声の「田中傘」が付属していますので、すぐにお試しできます。これは嬉しい。

 

起動直後の画面

左上の顔のアイコンをクリックして2.0.0を選ぶことで、ボイスライブラリがダウンロードできます。

 

トラックの「文」エリアをクリックして、文章を流し込みます。

 

VoiSonaと違うところは、漢字かな混じりのままで、ほぼ大丈夫なところ。これは日本語ならではのことなのかな。

 

試しに朗読っぽく、梶井基次郎の「桜の樹の下には」の1パラグラフを流し込んでみました。

 

すぐさま、画面上部で波形変換が実行される様子が表示されます。

 

トラックごとの再生は、トラックの左端の▶️、または画面下部のエディタ部分の▶️でもOK。

 

今回は主に、文章の漢字かな変換、イントネーションの調整、微妙なピッチの調整をしてみました。

 

まず赤文字のところ。原文は「二三日」のところ、発音が「にじゅうさんにち」になってしまうので、平仮名で「にさんにち」としました。

 

青文字のところは、ピッチの調整をした部分です。

 

ピッチの調整は、下部エディタ部分の「PIT」ボタンを押して、VoiSona同様にマウスのドラッグでできます。操作は簡単ですが、自然な発声にするのが素人には難しかったです。

 

続いてイントネーションの調整。

「ACC」ボタンをクリックすると、オレンジの丸印状態になるのですが、イントネーションには「上」か「下」か、しかないようなのです。普段の発声でもそうでしたっけ?

1つを上に持ち上げると、相対的に隣の丸が逆方向に上下します。

これで標準語っぽいイントネーションにしてみました。

 

再生しながら調整を繰り返します。

 

再生位置は、ちょっと分かりにくいですが、エディタの文章が表示されているところの下、秒数目盛りのある細いエリアをクリックすることで動かせます。

トラックの表示位置は横スクロールで移動できます。

 

トラックはwaveファイルで出力できます。書き出したいトラックの右端の「有効」チェックボックスにチェックを入れます。

 

ファイルメニュー >> エクスポート >> WAVファイルをエクスポート…を選択。

 

ダイアログが表示されますので、エクスポート…ボタンを押します。

出力するディレクトリしか選べないようで、ファイル名は自動的に「Talk99.wav」といった名前になりました。

 

調整後

 

自分なりには、だいたい良いと思うのですが、一箇所「やっとわかるときが来た。」の「来た」の発音がなんか機械っぽさが残っていて、直すことができませんでした。

 

これはいじっていない状態。文章を流し込むだけで、この仕上がり、すごいです。

 

ちなみに、ひらがなだけで入力すると、イントネーションがちょっと違うなぁ、という感じのところもあるんですが、漢字かな混じりだと、そこそこ標準語っぽくなります。

 

ピッチの曲線を表示すると、揺れ方が美しく、AIすごいなぁって思います。

 

ここまで素人が触って、この記事を書き終わって、ちょうど2時間です。恐るべし。

 

と、今回はそんなところで。