Some parts of this page may be machine-translated.

 

多言語ローカリゼーションにおけるAI自動音声ツール活用

多言語ローカリゼーションにおけるAI自動音声ツール活用

目次

1.AI自動音声ツールとは

「AI自動音声」をご存じでしょうか。AI自動音声とは、人間の声によるナレーションではなく、入力されたテキストを自動音声が自然に読み上げるものを指します。皆さんも駅の放送や電話音声ガイダンスで一度は耳にしたことがあるでしょう。AI自動音声ツールの性能はその登場以来進化し続け、今ではすっかり身近なものになっています。
本ブログでは、そんなAI自動音声あるいはAI自動音声ツールを、多言語ローカリゼーションにおいて使用することのメリットや注意点、また、弊社での活用事例を2回の記事に分けてご紹介していきます。

2.多言語ローカリゼーションにおけるAI自動音声活用

人によるナレーションの課題とAI自動音声による解決

人によるナレーションは、声色や抑揚による繊細かつ強い訴求力を持っているため、コマーシャルやドラマチックなナレーションでは欠かせません。
しかし一方で、製作上課題となる点があります。実際に製作に携わった方は実感されたことがあるかもしれません。
例えば、ナレーターや収録のためのスタジオとのスケジュール調整が必要になったり、原稿に変更が入った際の再録がスムーズにできなかったり、あるいは日本ではそもそもその言語のナレーターを見つけるのが難しいという場合もあります。
もちろんナレーションに繊細な訴求力が必要な場合は、そのうえでも人によるナレーションで作成する必要があります。しかし、そうではないものの場合、AI自動音声を使用することでこういった課題を解決できる場合があります。

弊社では、下記のようなものを対象にAI自動音声ツールを活用しています。

・操作説明
・教材

これらに共通する点は、正確な情報伝達が優先され、「上手い」読み方や、情感を伝える読み方をする必要がないことです。
近年のAI自動音声ツールは、ときに「素人が読むより上手いのでは」と思わせるほど流暢な音声が作成できます。そのため、こういった繊細な訴求力は求められていないものに使用する上では品質上全く不足がないものがほとんどなのです。

それでは、具体的にどういった点でAI自動音声にメリットがあるのかをご紹介していきます。

メリット

多言語ローカリゼーションプロジェクトにおける音声作成に、人によるナレーションではなくAI自動音声を活用することには、次のようなメリットがあります。

・時間とコスト
・修正のしやすさ、品質の均一化

■時間とコスト

時間やコストは想像しやすいのではないでしょうか。

人によるナレーション録音では、録音機材/環境の準備から実際のナレーションの録音まで、大きな手間と時間がかかります。収録に立ち会うためのスケジュール調整が必要なときもあるでしょう。
一方で、AI自動音声ツールを使用する場合は、音声化したいテキストを入力し、音声生成ボタンを押せばものの数秒で音声が完成します。この分の時間的・コスト的メリットは非常に大きいです。

■修正のしやすさ、品質の均一化

2つ目のメリットとして、修正のしやすさを挙げました。

一度作成した音声をチェックしていると、「この単語の読み方を変えたい」「もっと親しみやすい表現に変えたい」「この文はもっとゆっくり読んでほしい」という希望が出ることがあります。しかし、その修正を反映した再収録は、人によるナレーションでは簡単にはいかない場合もあります。再収録するためには、当然録音スタジオやナレーターのスケジュールを再度押さえる必要があるからです。1箇所の変更であっても、数十など多くの言語に展開する多言語ローカリゼーションにおいては、全ての言語での採り直しが発生してしまうことから、修正が現実的でない場合も少なくありません。

これに対し、AI自動音声ツールを活用した音声作成であれば、機械が読み上げるテキストを修正したり、速度指示を入力したりして再度音声生成するだけで、その修正をすぐに反映することができます。修正が多くなりがちな多言語プロジェクトにおいては大きなメリットです。
また、人によるナレーションでは言語により品質の差が出てしまうというお悩みも、AI自動音声ツールを使用すれば細部の調整が可能になりますので、言語間の品質の均一化が叶います。

3.AI自動音声活用にあたっての事前準備

「AI自動音声ツールのメリットや活用シーンはわかった。早速使ってみたいがどうすればよいのか。」次はこうした疑問にお答えしたいと思います。
非常に便利なAI自動音声ツールですが、事前準備により更なる高効率化や最終成果物の品質向上を目指すことが可能です。

スケジュール

AI自動音声の大きなメリットに「修正のしやすさ」があるとご紹介しました。人によるナレーションではスケジュール等の都合で難しかった細部の調整が、AI自動音声ツールを活用することで可能になる……この利点を生かさない理由はありません。
AI自動音声ツールは、製品にもよりますが、多くが分量・または期間によるコスト体系となっています。(製品によるコスト体系の違いは次回ブログにてご紹介します)
そのため、音声生成後に修正が入る前提のスケジュールを立てて、それにあったAI自動音声ツールの選定と購入を必要があります。ひと手間あると感じるかもしれませんが、人によるナレーションでのプロジェクトに比べると、トータルでは時間的・コスト的メリットが生じるのではないでしょうか。

略語の読み方を確定させる

一般的によく知られた略語であっても、言語により読み方が異なる場合があります。
一例として「ISO」が挙げられます。下の表のとおり、英語やインドネシア語では、日本語とは異なる読み方が一般的に使用されています。

日本語 英語 インドネシア語
アイエスオー アイソ/
アイエスオー
イソ/
アイエスオー

 

このような場合、どの読み方に統一させるか事前に指定せずに音声出力してしまうと、 どの読み方で出力されるか、はたまた読み方が音声全体の中で統一されるのか保証がありません。よって、事前に読み方を決めてツール側で読み方を登録/指定しておくのが、後からの余計な修正を防ぐ上で重要です。

チェックリスト

AI自動音声を使用したプロジェクトでも、人によるナレーションのプロジェクトと同様、作成した音声の確認が不可欠です。
「機械的に読んでいるのだから、読み間違いなど起こりえないのでは?」という印象を持たれる方も多いかもしれません。しかし実際には、文脈によるイントネーションの違いや不自然な間が開いてしまう・必要な間が無くわかりづらいなど、まだ自動音声では対応しきれない点もあります。
特に多言語ローカリゼーションにおいては、言語によってはイントネーションの違いで意味が変わってしまうものも少なくないため、生成後のチェックは必要不可欠なのです。
しかし、チェック担当者が無作為にチェックをしてしまうと、担当者の感覚で不要な修正を入れなければならなくなったり、逆に「この程度なら」と見逃されてしまったりする恐れがあります。多くの言語の品質を均一にするためには、チェック観点を言語間で揃えることが非常に重要です。
必要なチェック観点をリストアップしたチェックリストを作成しておくと、多言語の音声作成をスムーズに進めることができます。具体的にどのようなチェック観点が必要なのかについては、次回のブログでご紹介します。

4. まとめ

本記事では、多言語ローカリゼーションにAI自動音声ツールを使用するメリット・活用シーン・事前準備についてご説明しました。次回は、AI自動音声ツールで出力した音声のチェック方法や弊社でのツール活用事例をご紹介します。

人気記事ランキング
アーカイブ
カテゴリ

翻訳について
詳しく知りたい方

東京:03-5321-3111 
名古屋:052-269-8016

受付時間 9:30~17:00

お問い合わせ・資料請求