VoiSona Talkで田中傘に朗読してもらった
また少しご無沙汰でした。
先日のMYK-IVの詳細をまだまとめていないままですが、体験版の出た「VoiSona Talk」を試した話を先に。
「VoiSona Talk」は、AI技術でリアルな喋り声を再現する音声合成ソフトで、「VoiSona」のテクノスピーチさんが開発中です。
体験版の詳細はこちら。
Mac版、Windows版があります。本体は無料で、ボイスライブラリとして女性の声の「田中傘」が付属していますので、すぐにお試しできます。これは嬉しい。
起動直後の画面
左上の顔のアイコンをクリックして2.0.0を選ぶことで、ボイスライブラリがダウンロードできます。
トラックの「文」エリアをクリックして、文章を流し込みます。
VoiSonaと違うところは、漢字かな混じりのままで、ほぼ大丈夫なところ。これは日本語ならではのことなのかな。
試しに朗読っぽく、梶井基次郎の「桜の樹の下には」の1パラグラフを流し込んでみました。
すぐさま、画面上部で波形変換が実行される様子が表示されます。
トラックごとの再生は、トラックの左端の▶️、または画面下部のエディタ部分の▶️でもOK。
今回は主に、文章の漢字かな変換、イントネーションの調整、微妙なピッチの調整をしてみました。
まず赤文字のところ。原文は「二三日」のところ、発音が「にじゅうさんにち」になってしまうので、平仮名で「にさんにち」としました。
青文字のところは、ピッチの調整をした部分です。
ピッチの調整は、下部エディタ部分の「PIT」ボタンを押して、VoiSona同様にマウスのドラッグでできます。操作は簡単ですが、自然な発声にするのが素人には難しかったです。
続いてイントネーションの調整。
「ACC」ボタンをクリックすると、オレンジの丸印状態になるのですが、イントネーションには「上」か「下」か、しかないようなのです。普段の発声でもそうでしたっけ?
1つを上に持ち上げると、相対的に隣の丸が逆方向に上下します。
これで標準語っぽいイントネーションにしてみました。
再生しながら調整を繰り返します。
再生位置は、ちょっと分かりにくいですが、エディタの文章が表示されているところの下、秒数目盛りのある細いエリアをクリックすることで動かせます。
トラックの表示位置は横スクロールで移動できます。
トラックはwaveファイルで出力できます。書き出したいトラックの右端の「有効」チェックボックスにチェックを入れます。
ファイルメニュー >> エクスポート >> WAVファイルをエクスポート…を選択。
ダイアログが表示されますので、エクスポート…ボタンを押します。
出力するディレクトリしか選べないようで、ファイル名は自動的に「Talk99.wav」といった名前になりました。
調整後
自分なりには、だいたい良いと思うのですが、一箇所「やっとわかるときが来た。」の「来た」の発音がなんか機械っぽさが残っていて、直すことができませんでした。
これはいじっていない状態。文章を流し込むだけで、この仕上がり、すごいです。
ちなみに、ひらがなだけで入力すると、イントネーションがちょっと違うなぁ、という感じのところもあるんですが、漢字かな混じりだと、そこそこ標準語っぽくなります。
ピッチの曲線を表示すると、揺れ方が美しく、AIすごいなぁって思います。
ここまで素人が触って、この記事を書き終わって、ちょうど2時間です。恐るべし。
と、今回はそんなところで。