機械翻訳の導入にあたってよく聞かれる疑問のひとつに、
「これまでの翻訳資産を活かすことができるか?」というものがあります。
みなさま、翻訳メモリなどの形式で蓄積してきた原文と訳文のデータベースを、
機械翻訳にも活用したいというご要望をお持ちのようです。
今回は、翻訳資産をより活かしつつさらなる効率化を図ることが出来る、
「機械翻訳エンジンと翻訳支援ツールの合わせ技」についてご紹介します。
●類似訳がコーパスにあれば正しい訳に?
機械翻訳において過去の資産を活かすというと、
最初に挙げられるのは、やはり「コーパス」でしょう。
統計ベースのエンジンに、過去に翻訳した原文と訳文が紐づけられた対訳集を
「コーパス」として読み込ませることによって、翻訳の精度を向上させていくことが出来ます。
しかし、この資産の活かし方にも欠点があります。
これが統計ベースエンジンの難しいところなのですが、
「類似の訳がコーパス中にあるからと言って、必ずしも良い訳になるわけではない」と言うことです。
英日翻訳を例にご説明します。
以下の訳が、コーパスに含まれていたとしましょう。
——————————————————————
Press the [Finish] button to close the window.
[終了]ボタンを押下して、ウィンドウを閉じます。
——————————————————————
そうすると、なんとなくイメージとしては、
以下の原文に対して比較的「良い訳」が出力されるような気がしてしまいます。
——————————————————————
Press the [OK] button to close the window.
——————————————————————
しかし、実際には、こんな訳が出力されたりするのです。
——————————————————————
押して [OK] ボタンは閉じるウィンドウ
——————————————————————
※あくまで分かりやすくモデル化した例であり、
特定のエンジンの出力結果や翻訳品質を示すものではありません。
これには、エンジンによる解析が狙い通りにいかなかったとか、
コーパス中の他の翻訳に引きずられたとか、色々な要因が考えられます。
「こんな訳になるくらいなら、これをポストエディットするより、
最初から過去の翻訳を参照して自分で翻訳した方が早いんじゃないか?」
と思った方がいらっしゃるかもしれません。
実は、まさにその通り!なのです。
●類似訳がある場合は、翻訳支援ツールで翻訳を
TRADOS をはじめとする翻訳支援ツールは、
過去の翻訳資産(=翻訳メモリ)に類似の訳がある場合、
それを「一致率」として数値化して提示してくれます。
上記の例でいえば、翻訳メモリ中に ”Press the [Finish] button to close the window.”
があるのであれば、”Press the [OK] button to close the window.” を翻訳しようとしたときに、
「90%一致する訳がありますよ」などと提案してくれます。
なので、翻訳メモリに一致率の高い訳がある場合にはそれを参照して翻訳し、
それがない場合にのみ、機械翻訳+ポストエディットを行うことで、
より精度を上げつつ、効率的に翻訳を進めることが出来るようになります。
弊社が取り扱った事例でも、
一定の一致率をしきい値にしてそれより低いもののみに機械翻訳を適用し、
それより高いものは翻訳メモリを参照しながら人の手で翻訳した結果、
翻訳費用を15%程度削減できたものがあります。
「では、どのくらいの一致率をしきい値にするとよいのか?」という点が
気になった方もいらっしゃるかと思います。
しかし、この数値は、対象文書やエンジン、翻訳メモリやコーパスの質・量などによって変動します。
そのため、事前にいくつかのしきい値でサンプル翻訳を行って、
適切なしきい値を見きわめておくと、より確実に運用できるでしょう。
また、翻訳支援ツールと機械翻訳エンジンの連携については、
標準的な機能として連携が可能なものもあれば、
APIを通じて連携させることができるものもあります。
「機械翻訳を導入したいけど、過去の資産も活かしたい」という方は、
翻訳支援ツールと連携できるかという点も、翻訳エンジンを選定する上でのポイントとなるでしょう。
●まとめ
今回は、機械翻訳エンジンと翻訳支援ツールをうまく組み合わせることで、
より精度を上げつつ効率化を図ることができる、ということをご紹介させていただきました。
「このエンジンを使いたいんだけど、翻訳支援ツールの連携は可能なの?」
「うちの翻訳資産と対象文書なら、しきい値は何%が適切?」など、
気になる点がございましたら、是非ヒューマンサイエンスまでご相談ください。
関連サービス
Trados/Memsource 機械翻訳連携ソリューション