ケータイ Watch
連載バックナンバー
この“第三の手”ったら便利!! 「パナバイスジュニア」
[2009/06/22]

BlackBerry Bold用ケース買いまくり
[2009/06/15]

BlackBerry Boldちょ~好き!!
[2009/06/08]

ArduinoをShieldで遊ぼう
[2009/06/01]

2009年、Arduinoの現在
[2009/05/25]

SSDを使うニャ!! とか焦ってプチ失敗
[2009/05/18]

オリオスペックの静音PCを購入
[2009/05/11]

WILLCOM NSに興味津々!!
[2009/04/27]

ScanSnap最新型、S1500がイカシてる件
[2009/04/20]

カメラ周りをワイヤレスに!!
[2009/04/13]

電脳フィギュアARisで、話題の“拡張現実感”体験!
[2009/04/06]

6万円でお釣りがくる4TB NAS
「リンクステーション LS-Q1.OTL/1D」
[2009/03/30]

とても便利な“撮影スタンド"「WISTA サブスタンド88」
[2009/03/23]

イケてるiLife '09
[2009/03/16]

ワイヤレスマイクで音を撮る! ハンディカム「HDR-CX12」
[2009/03/09]

こんな雲台を連日使っとります
[2009/03/02]

WFT-E4がナイと拙者の生産性が激低下!!
[2009/02/23]

USB接続のサブモニターがアツい!?
[2009/02/16]

やっぱり気になる“まめカムHD”
[2009/02/09]

アクトビラってどーなのよ?
[2009/02/02]

電源回りにウルサい拙者
[2009/01/26]

ニコン謹製「メディアポートUP」を使ってみた!!
[2009/01/19]

無線LANで写真転送!! なSDメモリカード
[2009/01/05]


2008年

2007年

2006年

2005年

2004年

2003年

2002年

2001年

2000年

モバイルセントラル
モバイルセントラル一覧へ
スタパトロニクスタイトルGIF
喋るコンピュータにハマる年末の俺
スタパ齋藤 スタパ齋藤
1964年8月28日デビュー。中学生時代にマイコン野郎と化し、高校時代にコンピュータ野郎と化し、大学時代にコンピュータゲーム野郎となって道を誤る。特技は太股の肉離れや乱文乱筆や電池の液漏れと20時間以上の連続睡眠の自称衝動買い技術者。収入のほとんどをカッコよいしサイバーだしナイスだしジョリーグッドなデバイスにつぎ込みつつライター稼業に勤しむ。フォトエッセイのスタパデイズをAlt-R(http://www.alt-r.com/)にて連載中。


喋るコンピュータ

 あ、そうそう、そう言えば……と思い立って引っ張り出したソフトウェアは、一時期ハマった音声合成系ソフトであった。コンピュータにテキストを読み上げさせるソフトですな。

 東芝音声システム、95ReaderProTALKER等々、何年か前に買った古いバージョンのソフトを引っ張り出して使ってみたら、懐かしくもあり、やはり面白くもある。

 って、このテのソフト、本来はテキストの自動読み上げによりユーザーを支援するのが目的だが、俺としては“コンピュータが言葉を話す”という点が愉快でハマっていた。すなわち若干邪道な使い方。でも、良くなくなくなくないですか? 常用のマシンが日本語とか喋るのって。コンピュータが人工的な合成音声で言葉を話すのって、非常にサイバーだし楽しいと思いません!? 喋らせて遊んでるだけでおもしろかったりするんスよ。

 ともあれ、最近の音声合成ソフトはどーなってんのかナ!? と思っていろいろ調べたら、なんか低価格でありかつ音質もナカナカだったりしたので、むむむ!! これは再度ハマってみる価値あり!! などと急激に思いまくってババババッと買い集めて使ってみた。

 てなわけで今回は、好きな人はチョー好きな音声合成系ソフトをあれこれご紹介したい。


11カ国語対応・高品質は良いが……

 まずは最初に買った1本、高電社WORLD VOICE 2だ。Windows用のテキスト読み上げソフトとなる。

 コレを買った理由は、なんかこのソフト、いろんな国の言葉を発するという点にお得感があったから。購入価格は7,000円少々だが、この価格で11カ国語──日本語、英語、韓国語、中国語、フランス語、ドイツ語、イタリア語、スペイン語、ポルトガル語、オランダ語、ロシア語のテキスト読み上げが可能だ。なお、読み上げをさせるためには、Windows上で多国語を利用できる環境が必要となる。

 で、実際使ってみた感じとしては、価格のわりにはずいぶんしっかり喋ってくれるナ、と。例えばWebページ上の日本語テキストを読ませると、ほーんの少しイントネーションや漢字の読みを間違えるってケースがあるものの、たいていはユーザーが理解できる範囲で読み上げてくれる。ネイティブの外国語発音に関してはよくわなんない拙者だが、中国語や韓国語は人間が喋ってるっぽい音質・アクセントに聞こえるような気がする。もしかしたらコストパフォーマンスが非常に高いソフトかも!? とか思った。

 なお、WORLD VOICE 2の合成音声サンプルは高電社のWebサイトで聞くことができる。現在は英語日本語韓国語中国語が用意されている。

 WORLD VOICE 2は、テキストをクリップボード上へコピーできるアプリケーションで使える。Webブラウザやワープロソフト等々、普通一般多くのソフトに対応しているわけだ。使い方は簡単で、WORLD VOICE 2起動後、発音させる言語を選び、対象となるアプリケーション上のテキストを範囲選択し、朗読ボタンを押すだけ。設定により、声質(男女)、読み上げ速度、ピッチ(声の高さ)を調整できるが、デフォルトでも十分に聞き取りやすい音質・速度等である。

 でまあ、安価&簡単&多国語対応&けっこーイイ音ってコトでナイスな感じなのだが、機能的に若干物足りなさを感じた。例えば、Ctrl+Cでテキストをクリップボード上へコピーした瞬間読み上げてくれるような機能がない。テキストを範囲選択した後に毎回、朗読ボタンをクリックする必要があって若干面倒。それから、読み上げの音声をWAVファイル等として出力する機能もない。

 てなわけで、応用的に使いこなそうとすると不便だし、読み上げ音声をいじって遊ぼうとすると面倒だしで、若干寂しい感じ。まあ基本的にはテキストを読み上げるだけのソフトなんですな。とにかくテキストを読み上げればいい、多国語を読み上げればいい、って人にはいいかもしんない。が、合成音声萌え派な俺にはミョーな肩すかし感が残った。


WORLD VOICE 2使用時に使うのはこれら2種類のフローティングウィンドウだ。各国語を切り替えて使えるランゲージランチャーと、それぞれの国語で朗読を開始・終了等するための制御ウィンドウとなる。特定の国語のみで朗読させる場合は制御ウィンドウひとつの表示でも使える。


音声の設定ダイアログはシンプルでわかりやすい。ランゲージランチャーから英語・日本語・中国語・韓国語以外を選ぶ場合は、マルチボイスウィンドウを開いて、さらに言語選択をするかたちになる。


日本語音声合成ならコイツに任せろ!!

 ん~、もっと多機能で遊べるテキスト読み上げソフトが欲しいなぁ~と思って探したら、俺的音声合成史においてはかな~りスゴいと思われる一本を発見した。NTTデータボイス君のテキストスピーチ2。Windows版・日本語専用のテキスト読み上げソフトである。


ボイス君のテキストスピーチ2のメイン画面。発音音声等も比較的に細かく設定することができる。でも、まあ、フツーって感じですな。


 ボイス君のテキストスピーチ2を買った理由は、まず日本語に関しては(英語も一応読み上げるのダ)まずまずクオリティの高い発音をしてくれるという点。また、発音の韻律編集が可能なので、チューニング次第ですっげぇクオリティの高さ──イントネーションの正確さや声としての自然さが得られる。なお、ボイス君のテキストスピーチ2が発する声のサンプルはNTTデータの製品紹介ページにて聞くことができる。

 ちなみにボイス君のテキストスピーチ2はVectorからのダウンロード販売のみで、お値段8,925円。前述のWORLD VOICE 2と比べると、ボイス君のテキストスピーチ2は日本語専用(英語も読めるが日本語的発音となる)なので、割高感はある。が、結論から言えば日本語をキッチリと発音させたいならコイツがいちばんだと思う。

 さて、ボイス君のテキストスピーチ2の使用感だが、テキスト読み上げソフトとしては、一点を覗いて、わりあいフツーかもしれない。起動すると、テキスト読み上げ画面が表示されるので、そこにテキストを入力すれば読み上げる。また、クリップボードにコピーされたテキストを自動的に読み上げる設定にもできる。他、単語や定型文の登録、声質(男女とキャラクタ)、声の高さ、読み上げ速度、読み上げ時の抑揚など細かな設定も可能で、もちろん読み上げ音声をWAV形式ファイルで保存することもできる。

 読み上げ音声に関しては、前述のサンプルをお聞きになればおわかりいただけると思う。けど、ぶっちゃけ、デフォルトのボイス君だと、非常にキレイな発音をするって印象ではない。テキストによってはヘンなアクセントが付いたり、また設定によってはいかにも合成音声っぽい感じになる。

 しかし!! 韻律編集を行なうとそのフツー的クオリティを、思いっきり高めることができる!! 前述のサンプルページの下のほーに韻律編集前・後のサンプルもあるのでお聞きいただきたいが、実際に自分で使ってみると、そのサンプル以上のコトができるっていうか、従来の音声合成ソフトではムリだったり非常に面倒だったりした自然な読み上げ音声を作ることができる。

 使っていて(ていうか遊んでいて)、すげぇと思ったのは、例えば俺が書いてるよーな口語なフィーリングのテキストでも、韻律編集を行なうことによって“正しい口語の発音”へと追い込めることだ。具体的には下のような例である。

「すげぇびびったよ」
通常読上時韻律編集後
♪音声ファイル(WAV)を聴く♪♪音声ファイル(WAV)を聴く♪

「つーかマジすげぇと思ったんスよ韻律編集。」
通常読上時韻律編集後
♪音声ファイル(WAV)を聴く♪♪音声ファイル(WAV)を聴く♪


 ここで、韻律編集について大雑把にご説明。ボイス君のテキストスピーチ2の韻律編集の場合、まずは入力したテキストがフレーズ毎に分割される。例えば「お買いあげありがとうございます」ならば「おかいあげ」「ありがとー」「ございます」という3つのフレーズに分割される。韻律編集を使うと、これらそれぞれのフレーズに対し、先頭の音の高さ、イントネーションの強さや立ち上がり位置、文末のイントネーション(平常文か疑問文か等)を設定できる。ので、音声合成ソフトに(自動で)行なわせるとどーしてもヘンな感じになっちゃうよーな読み上げ音声をかなり自由に修正できるのだ。

ボイス君のテキストスピーチ2では、「お買いあげありがとうございます」というテキストなら「おかいあげ」「ありがとー」「ございます」という3つのフレーズに分割される。デフォルトのイントネーション等は画面のとおり。音声と合わせて画面を見るとイントネーション等の韻律を把握しやすいだろう。このイントネーション等は韻律編集により変更可能だ。また韻律編集結果は単語や単文として登録することが可能だ。
♪音声ファイル(WAV)を聴く♪


 フレーズは分割・結合可能だが、分割して韻律編集を行なうと、読み上げ音声に対して非常に細かなイントネーション等を設定していける。フレーズを分割しての韻律編集を行なうと、例えば容易に方言のイントネーションを付けられたりする。カタコト日本語の外国人が日本語を喋ってるよーな読み上げ音声にもできちゃう。ただし、イントネーションの強さは7段階にしか設定できないので、イントネーションの幅が非常に広い発音へと追い込むのは難しい。けれど、シロートが使える音声合成ソフトとして、この韻律編集機能は実にスゲェし有り難い機能と言えよう。


喋るし歌う日本語音声合成ソフト

 んーっボイス君のテキストスピーチ2はイイ!! 口語を口語として喋らせることができる!! 方言もイケる!! 韻律編集は若干手間がかかるが、実に楽しい!! と、久々に音声合成ソフト熱が再燃した俺は、新たな発見をした。

 もうけっこー前(というか昔!?)に発売されてたようだが、テキスト読み上げ機能を持ちつつ、歌も歌ってくれるという音声合成ソフトを2本見つけたのだ。具体的には、沖電気SMARTTALK 3.0クリエートシステムドキュメントトーカ for Windows Ver3.5である。


ドキュメントトーカ for Windows Ver3.5のウィンドウ表示の一例。選べる音声も豊富だ。複数のソフトウェアで構成されるパッケージだが、全体的に遊び心満載。コンピュータが発する言葉を愉快に楽しむにはうってつけのソフトだと思う。


SMARTTALK 3.0のメインウィンドウ表示と設定用ウィンドウ。どちらも小さなウィンドウだが実用性は高い。シンプルだが扱いやすく、また合成音声のクオリティも非常に高い。


 これら2本のソフトの詳細に関しては、メーカーのWebサイトをご参照いただきたい。また、読み上げサンプル音声等に関しては、SMARTTALK 3.0ココで、ドキュメントトーカ for Windows Ver3.5ココで聞くことができる。

 なお、ご参考までに、ボイス君のテキストスピーチ2、SMARTTALK 3.0、ドキュメントトーカ for Windows Ver3.5で、同じ言葉を音声合成・WAVファイル出力したものを以下に示す……けど各ソフトの音声設定等はソフトの性質上揃えることができなかったので、あくまでもご参考ってことでヒトツ。

※音声ファイル(WAV)は赤字をクリックしてお聞きください
ボイス君の
テキストスピーチ2
♪「良いお年をお迎えください」 ♪「あけましておめでとうございます」
SMARTTALK
3.0
♪「良いお年をお迎えください」 ♪「あけましておめでとうございます」
ドキュメントトーカ
for Windows Ver3.5
♪「良いお年をお迎えください」 ♪「あけましておめでとうございます」


 で、これら2本のソフトに関して、俺的結論をイキナリ言えば、日本語読み上げ音声的マトモ度からすればSMARTTALK 3.0がジョリーグッドであると感じた。デフォルトでかなり綺麗な発音をするので、イキナリ使い物になる。実用性は前述のボイス君のテキストスピーチ2よりも上かもしれない。

 ドキュメントトーカ for Windows Ver3.5が読み上げる日本語は、やや平凡って感じの聞きやすさで、若干クセがあったりする。実用には耐えるが、本来の目的でテキスト読み上げをさせるなら、他のソフトにしたほーがいいかもしんない。けれど、コレ、使っていて最強に楽しい!! 小さなアプリが多々セットになっていて、どれもかなり楽しめる。俺的結論からすれば、現在最も面白がれる音声合成ソフトじゃないかな~と思う。

 さて、肝心の“歌う機能”だが、とりあえず両ソフトに同じ曲・歌を歌わせてみたのでお聞きいただければと思う。が、約32秒で緊急開発したデタラメな曲なので、音楽的な期待はご勘弁いただきたい。

※音声ファイル(WAV)は赤字をクリックしてお聞きください
♪「ねこ踊り」♪
by SMARTTALK 3.0
♪「ねこ踊り」♪
by ドキュメントトーカ for Windows Ver3.5
SMARTTALK 3.0とドキュメントトーカ for Windows Ver3.5による歌唱。曲は約32秒で開発した「ねこ踊り」という、若干狂ったかんじのものですスマンす。ちなみに歌詞は「ねこ踊り~ねこ踊り~、ねこねこねこねこ、ねこ踊り~」である。


 両ソフトとも、けっこーちゃんと歌うんスよこれが。ちょっとビックリ。素直な声質で童謡なんかを歌わせると実用的(何の!?)ではなかろうかと思う。

 歌を歌わせる場合は、両ソフトとも旋律や歌詞などのデータ入力が必要になる。凝ったりトんだりしていない、普通っぽい曲ならだいたい歌わせることができると思う。のだが、データ入力時、さすがに音声合成ソフトっていうか非音楽系ソフトだけあって、効率が悪い=入力インターフェイスが非常に原始的である。


SMARTTALK 3.0の歌唱機能こと“歌唱ツール”。何となく良さげに見える表示だが、音符および音階の入力が非常に面倒である。DOS時代の音楽ソフト……にも劣る!? まあ音声合成ソフトのオマケ機能なので文句言っちゃダメですな。 ドキュメントトーカ for Windows Ver3.5の歌唱機能こと“歌います”。ベタなネーミングのアプリケーションだが、音符や音階の入力はSMARTTALK 3.0の“歌唱ツール”よりも数段ナイスで使いやすい……と思うが、ある程度本格的な音楽作成ソフトからすれば、どちらの音声合成ソフトのお歌機能も扱いにくいと言えよう。

 歌を歌わせる目的で使っていて、ちょいとイライラさせられるのがSMARTTALK 3.0、そこまではイライラしないのがドキュメントトーカ for Windows Ver3.5、というのが俺の実感だ。しかし、音楽作成専用ソフトウェアと比べると、両ソフトの旋律・歌詞入力インターフェイスは非常にかったりい使い勝手と言えよう。


コンピュータが上手に歌う!!

 SMARTTALK 3.0やドキュメントトーカ for Windows Ver3.5を使ってコンピュータに歌わせていたら、やっぱり案の定、例のあのソフトを徹底活用したくなった俺。

 すなわち、ヤマハのVOCALOIDという技術を採用した“歌を歌わせるために作られた音楽ソフト”である。具体的には、クリプトン・フューチャー・メディアから出ているVOCALOIDシリーズだ。


歌を歌わせたら世界一!! のVOCALOIDシリーズ。このソフトウェアの出現により、職を失っちゃったりする人が……いるよーな気がしてならない。


 VOCALOIDシリーズは現在4種類(4つの声)が発売されているが、日本語で歌わせることができるのは1本、MEIKOのみである。VOCALOIDシリーズ発売当初は英語で歌う製品しかなく、日本語で歌わせたくてしょーがねー俺は見送っていた。が、MEIKO発売後、使ってみたらこりゃビックリ。比較的に容易に扱えるわりには、実にしっかりかつマトモに歌ってくれるのだ。その衝撃にシビレていたら、タイミング良くMEIKOユーザー向け優待販売が始まり、他シリーズが30%OFFで買えたので即全買い!! 俺はVOCALOIDで一生遊んでいく!! ってホド、惚れた。

 なお、VOCALOIDの詳細は、ヤマハの技術紹介(!?)サイトクリプトン・フューチャー・メディアの製品紹介ページで見ていただきたい。また、それらのページにはサンプル音声(歌声)のリンクもあるので、実際の音もお聴きいただいたついでにビックリしてみて欲しい。

 VOCALOIDの使い方は簡単で、基本的には旋律と歌詞を入力すれば歌ってくれる。それらデータ入力はVOCALOID Editorというアプリケーションで行なう。使用感は、音楽ソフトとしてはわかりやすいし迷いにくいといった印象。ただ、今時的DTMのホストアプリケーションなんかと比べると、もっと快適&効率的な方向にブラッシュアップして欲しいという気もする。あと日本語で歌うシリーズをもっと出していただきたい。あとMEIKOのパッケージの絵はいかがなモンかと思ったりもした。

 ていうか話を戻そう。単に旋律と歌詞を入力するだけでプロっぽい声で歌ってくれるVOCALOIDシリーズであるが、とりあえず前述にあったデタラメな歌をVOCALOID MEIKOに入力してみた。その結果が以下のものである。

こんなふうに、入力した旋律の上に歌詞を書き込んで行く程度で歌を歌ってくれる。ただし、細かな味付けをしない状態だと、まだまだ機械的な歌声なのだ。また、音域によっては、入力した旋律・歌詞とピッタリとマッチした声を出してくれないこともある。このケースの場合、最初の「ねこおどり~」の「ど」が間延びして聞こえる(旋律上ではそうならないハズなのだが)。
♪音声ファイル(WAV)を聴く♪


 同じ音声合成ソフトでも、テキスト読み上げ用ソフトと歌唱用ソフトでは全然違いますな。ていうかVOCALOIDスゴ過ぎ!! 手元にある譜面やら歌やら全部入力してみたい気持ち!! ……だが、単に旋律と歌詞を入力しただけだと、まだまだ非人間的なVOCALOID MEIKO。しかし、VOCALOIDシリーズには歌声にアタックやビブラート等の“歌唱的味付け”を施す機能が多々ある。その一部機能を適用してみたのが以下のものだ。

上の旋律・歌詞に歌唱的味付けをしたもの(上の歌の間延び問題を解決するため、曲の音階を相対的にずらしている)。歌声にアタックやビブラートを付加したり、音の強さを微妙に変えたことなどで、歌から機械的な印象が薄らいだ。
♪音声ファイル(WAV)を聴く♪


 徐々に人間の歌声っぽくなってきた……が、まだVOCALOID歴の浅い拙者でありかつ曲があんなんなので、さらなる歌声的ブラッシュアップは近未来の俺に任せていきたい!!

 ところで、VOCALOIDシリーズはひとつのVOCALOID Editorから一括して扱える。VOCALOID Editorと音声(歌声)データが独立してるんですな。また、VOCALOID Editorでは、複数の歌手を混在させることができる。さらに、ちょうどExcelのシートのような感じで、複数のレイヤーを使って同時に別の歌手を使うこともできる。つまりVOCALOID Editor上でMEIKOとMIRIAMとLOLAとLEONを一緒に歌わせることが可能なのだ。もちろん合唱なんかもできる。てなわけで、全員で歌わせてみたのが以下である。

上の旋律・歌詞(機械的な印象を減らしたもの)に、新たなシンガーを加えたもの。現行のVOCALOIDシリーズ歌手(!?)全員、MEIKOとMIRIAMとLOLAとLEONが一緒に歌っている。ちなみに、最初のコーラスの低い声と、ベースのような音を出しているのがLEON。歌い始めがMEIKO。カタコト英語の歌がLOLA。最初のコーラスの高い声と最後の「ラララ~」およびソロがMIRIAMとなる。ていうかヘンな歌を歌わせてすみません>VOCALOIDご一行様。
♪音声ファイル(WAV)を聴く♪


 あぁオモシロ過ぎだよVOCALOID!! ちょっといじった程度でここまで歌ってくれるとなると、音遊びっていうかDTMの真似事も一気かつ急激に愉快化する!! そして前述のテキスト読み上げソフトとVOCALOIDシリーズをDTMソフトで統合すれば……サイバーでしょうがねえ曲ができるかも!! かもーっ!!

 思い立って引っ張り出した古い音声合成系ソフトから、新たな音遊びが始まっちゃった年末の俺なのであった。



URL
  ヤマハ「VOCALOID」製品情報
  http://www.vocaloid.com/jp/
  高電社「WORLD VOICE 2」製品情報
  http://www.kodensha.jp/jis/soft/wvs.html
  NTTデータの「ボイス君のテキストスピーチ2」製品情報
  http://www.voistage.com/products/vts02/
  沖電気「SMARTTALK 3.0」製品情報
  http://www.oki.com/jp/Cng/Softnew/JIS/sm.htm
  クリエートシステム「ドキュメントトーカ for Windows Ver3.5」製品情報
  http://www.createsystem.co.jp/dtalkerWin.html

2004/12/27 17:17

ケータイ Watchホームページ

ケータイWatch編集部 k-tai@impress.co.jp
Copyright (c) 2004 Impress Corporation, an Impress Group company. All rights reserved.