音声認識QAテスティング

音声認識QAテスティング

iPhoneのSiri、GoogleのGoogle Now、MicrosoftのCortana、最近ではAmazon Echoの登場によって、音声認識技術がより身近なものになりました。
音声認識技術がより一層注目される今、ヒューマンサイエンスは、ローカリゼーションベンダーとしての長年の実績を基に、音声認識のQA、QAセミ
ナー、QAトレーニングをご提供し、音声認識技術を使用したお客様のサービスをサポートいたします。

音声認識QAとは?

音声認識とは、人の音声をコンピューターに認識させてテキストに変換する技術です。そしてその技術を応用したサービス(デバイス)として、先に述べたSiriやGoogle Nowなどがあります。
音声認識QA(Quality Assurance)では、”コンピューターが音声を正しく認識して、正しくテキスト化する”、”テキスト化された音声に対して、デバイスが期待された動作を実行する”という品質を保証します。


音声認識ソフトウェアとして、Dragon(Nuance社)、Speech Assistant(Lyric社)などがありますが、音声認識の基本的な仕組みは、音声を”音の波形”から”ヨミ”に変換し、”ヨミ”に言語情報(単語や文法)をあてて“テキスト”に変換します。そして音声認識デバイスはこの”変換されたテキスト”に対応した動作を実行します。


音声認識の基本的な仕組み


しかし、環境音などのノイズやユーザーの年齢や性別、話し方の癖などの様々な要因で、ソフトウェアが音声を誤認識したままテキスト化したり、デバイスがユーザーの期待に副わない動作を実行したりする可能性があります。そのため、上記で述べた”コンピューターが音声を正しく認識して、正しくテキスト化する”、”テキスト化された音声に対して、デバイスが期待された動作を実行する”ことを保証することが、ユーザーの満足度に直接結び付きます。

音声認識とディープラーニング

音声認識の分野は、ディープラーニング(深層学習)が非常に盛んな分野でもあります。以前までは同じ発話でもユーザーが異なる場合は、ユーザーごとの発話を全て学習させる必要がありました。しかし、ディープラーニングでは、発話のパターンを学習させることで、異なるユーザーの発話に対する認識精度を飛躍的に向上させることが出来ます。


以前までの方法


ディープラーニング


ディープラーニングが、音声認識精度向上のベストアンサーであり、音声認識サービスのユーザー満足度の向上には欠かせないものです。

HSの音声認識QA

長年のIT翻訳の経験を持つヒューマンサイエンスでは、下記の音声認識QAで、ソフトウェアの音声認識精度の向上およびお客様のサービスのユーザー満足度の向上に貢献いたします。


音声認識分析・評価

高精度の音声認識実現のためには、ディープラーニングによる学習が重要ですが、音声パターンや専門用語を学習させた後の分析・評価も非常に重要です。音声パターンを正しく学習したか、認識精度が向上したか、ディープラーニング後の分析・評価は、音声認識向上のために不可欠なステップです。


分析・評価1 分析・評価2


ヒューマンサイエンスでは、弊社に登録している経験豊富な日本在住の日本語ネイティブが作業することにより、多様な地域、年齢層の日本語の発話、IT、医療、ソーシャルメディアで頻出する新語、業界用語、専門用語を正しく聞き分け、ソフトウェアの認識精度を正確に分析・評価いたします。分析・評価の結果は、問題点や課題とその改善策までを含めた品質改善案としてレポートいたします。

ユーザーエクスペリエンステスティング

ユーザーの発話を正しく認識させることができたら、次はそれに対する適切な処理をデバイスに実行させることになります。基本的にデバイスは、発話に含まれる”キーワード”に対応して、そのキーワードに設定された動作を実行します。


例えば「コーヒーが飲めるお店を探して」といった発話には、”コーヒー”、”飲む”、”店”、”探す”といったキーワードが含まれています。デバイスはこれらのキーワードに対応する動作を取捨選択して実行します。


デバイスの動作例


しかし残念ながらユーザーが期待する動作を必ずしも実行できるわけではありません。

この発話をしたユーザーのほとんどは、「カフェでコーヒーでも飲みながら一休みしたい」はずです。しかし、テイクアウト専門のコーヒー店へ案内したらユーザーはどのように感じるでしょうか?100km先のコーヒー店を表示したら、ユーザーはそこに行くでしょうか?


テイクアウト専門店も、100km先のお店でも、「コーヒーが飲めるお店を探して」への反応としては間違いではありません。しかしユーザーの意図を精査し、ユーザーにとって有益な結果を実行するためには、人による綿密なテスティングが必要となります。


ヒューマンサイエンスには、ユーザーの発話内容を解釈するために必要な言語や文化的知識を持ち合わせたエキスパートがおり、デバイスにユー
ザーの意図を正確に認識させるためのノウハウも豊富にあります。ノウハウを駆使したエキスパートによるテスティングで、デバイスのユーザー満足度向上に貢献いたします。


社内にはSecured Access Roomも完備しておりますので、セキュリティ性の高いリリース直前の製品テストなどにつきましても、安心してご依頼ください。

音声QAセミナー/音声QAトレーニング

ローカリゼーションベンダーとして長年培ったナレッジを基に、お客様のサービス内容や背景に合わせてQAセミナー/QAトレーニングを企画・提案いたします。

  • ・音声認識を取り入れたサービスの品質管理方法
  • ・既存音声認識サービスの品質改善・効率的な品質管理方法
  • ・音声認識QAの内製化