編集後記 TTS在原七海ちゃん編
!?
ある日の事
テキストを入力するとゆずソフトヒロインが音声合成で喋ってくれるヤバいサイトを見つけた ヤバい!https://t.co/T0HezHqrph pic.twitter.com/hRMtz1XU51
— ゆーきゃん(C面) (@yocqn) 2022年8月27日
bilibili(中国の動画投稿サイト)を見ていた時の事。凄い物を見つけた。まさしく自分が作りたいと思ってたプログラムを発見してしまったので、ノリノリでツイートしたら伸びてしまって複雑な気持ちになりました。
いわゆるディープラーニングというやつでしょうか、僕は詳しくないのでよくわかりませんが。大量のセリフデータを読み込んで、機械学習であーだこーだすることで音声合成モデルを作りだすというものです。この技術は数年前からあって、使用してる動画をチラチラ見かけていたので気になってました。
僕は四季ナツメさんが好きなので、この人を喋らせたいの気持ちで色々調べていて、わかりやすい日本語解説記事とかあったんですけどプログラミングの知識が無くて無理だったので諦めてました。
▼こういうのを見たので気になってた
プログラミングできないからな…と絶望してる時に見つけてしまったのがこれだったので非常にテンションが上がってました。
▼その場のノリで今回の動画を作ることになった様子
この合成音声と僕の動画編集とみなさんのSSで本家っぽい物を作れる可能性が出てきました
— ゆーきゃん(C面) (@yocqn) 2022年8月27日
以前からC面でSSを書いてる方を見ていて、こういうのを音声合成と僕の動画編集技術でなんか動画作れたらね……って思ってたのでマジでチャンスが来ました。
ちょくちょく仲良くさせてもらってる功さんに声をかけて貰ったので、このSSを元に動画を作ることになりました(何度も細かく注文してすみませんでした)
#ゆずソフトSS 在原 七海 冷たい頬 pic.twitter.com/DQmu2GyZgg
— 功 SSの下町食堂 (@Kou_Mahiru_V) 2022年4月4日
よって完成しました
●シナリオ
— 功 SSの下町食堂 (@Kou_Mahiru_V) 2022年9月2日
功 SSの下町食堂 (@Kou_Mahiru_V)
●音声
「MoeGoe」 CjangCjengh様https://t.co/XLBTzKwK9F
※一部ボイスはRIDDLE JOKERゲーム内からお借りしています
●動画
ゆーきゃん (@yocqn)
(c)YUZUSOFT/JUNOS INC. pic.twitter.com/zTVFieM40C
楽しかったけどかなり疲れました。しばらくはこういう動画はちょっと良いかな……。
ここからは編集のこだわりポイントを書きます。
ちなみにこの記事のタイトルのTTSはText To Speach、テキスト読み上げの事。この動画編集中はTTS七海という名前つけてやってました。
シナリオ
これは別に僕が書いたものではないので特にコメントすることはありません。功さんはしっかり原作を読み込んでて、一人称・二人称とかしっかり原作リスペクトしてて素晴らしいと思います。
今回は小説ではなくゲームシナリオなので、鍵括弧や数字の表記など一部変更しました。言い回しは何も変えてません。
音声
こちらのソフトウェアで制作しました。記事の上の方に貼ったbilibiliのリンクを参考にDLしました。
GitHubページの下の方に365 epochs版(?)とH除く版があります。
なんとなく比較した感じ365 epochs版の方が流暢に喋ってくれたのでそっちを採用しました。
イントネーションは記号を使って調整できるみたいですが、よくわかんなかったので「!」「?」「。」そして漢字を使うか使わないかで調整しました。毎回ランダムなイントネーションになるので何度か厳選とかもしました。また、文章を短くした方が自然になるときもあるのでまだまだ研究できる。
▼ファイル名の管理雑すぎ
ここから更に、VocalShifterというソフトで声の音程をいじって少しでも自然なイントネーションに近づけたりとかちょっとしてました。これが案外難しくて大変だった。
動画の一番最初の「3・2・1・今!」はゲーム内から録音して持ってきました。合成音声で作ったボイスは流石に音質が悪いので、ゲーム内録音はビットクラッシャーとか使って音質を意図的に下げて違和感を減らしました。
音MADを散々作ってて色々知識があるので、結構簡単にできるだろ!って思ってたけど意外と時間がかかって大変でした。難しいよ~。
動画
動画は公式のゲーム画面に寄せる為に全力で目コピしてます。テキストウィンドウとか全部自作しました。
最初の校門を乗り越えるシーンとかは原作の演出丸パクリ。
▼まずは比較用の公式画面
素材配布のコーナー
▼テキストウィンドウ
▼テキストウィンドウ(Another View)
▼BGM曲名表示(左上にしれっと出てくるやつ)
▼ボイス表示(オート再生)
▼声無い時のオート再生
▼オート再生ゲージ
▼クリック待ちでくるくるしてるやつ
(本来は透過aviファイルで作りましたが、今回は事情によりGB画像で置いときます)
▼Another View表示
これ六角形の模様とか結構細かく作ったけどマジで一瞬しか使うタイミングが無いことに後から気づいてショックになったやつ
フォント
うう
使用したフォントはフォントワークスの「キアロ Std B」です。Adobe Fontsで持ってた。
ゲーム内のフォントは、オプション画面からもわかる通り「スキップ Std B」。こちらのサイトで試し書きできます。
結構似てるんでぱっと見わからないんですけど違うフォントです。マジでスキップ欲しい。フォント買い切りさせろ!サブスクサービス反対!
でも学生なら年間1000円ぐらいでスキップ使えるらしい。買い得では?
テキストの表示速度はゲーム内のオート再生を参考に調整しました。体内時計で調整したので結構雑です。この調整が正直一番めんどくさかった。
▼おまけ
!?
最後は顔表示
原作のおまけ、立ち絵鑑賞機能がマジで便利すぎる。GB素材を作って並べただけです。
ゆずソフト作品は、シーンの時間帯で微妙に色調が変わるので、そこら辺は色調補正でなんとか再現しました(夜色調でGB素材作れば一発ですが、めんどくさかったので昼色調でやっちゃった)
まぁテキストウィンドウの左下のちっちゃい顔表示とかは昼色調になってるので結果オーライ。
立ち絵演出毎回悩まされてるのは、ポーズが違う立ち絵の切り替え。普通に透明度いじって切り替えようとすると違和感が産まれて結構難しいです。
上の横向き画像、正面A、正面Bの3種類のポーズがあります。横向き←→正面の切り替えの透明度調整がマジで難しかった。
シーンチェンジ
うわ、ゆずソフトでよく見るシーンチェンジだ!
これは再現とかでもなんでもなく、データぶっこ抜きで拾ってきました(小声)
GARbroというソフトを使ってます。美少女ゲーム音MADを作りたいみんな、GARbroを使おう(小声)
▼マジで今すぐAviUtlで使える白黒形式でデータ入ってた
ということで以上です。作るの結構疲れたけど楽しかった~~。
ここまで読んでいただきありがとうございました。