• 東京03-5321-3111
  • 名古屋052-269-8016
  • 言語切り替え
    • English

Some parts of this page may be machine-translated.

 

  • 翻訳サービス:HOME
  • ブログ
  • 機械翻訳の傾向やよくある間違いと修正(ポストエディット)のコツ④ ~読みやすさを考慮し文章を二つ以上に分ける~

機械翻訳の傾向やよくある間違いと修正(ポストエディット)のコツ④ ~読みやすさを考慮し文章を二つ以上に分ける~

機械翻訳の傾向やよくある間違いと修正(ポストエディット)のコツ④ ~読みやすさを考慮し文章を二つ以上に分ける~

機械翻訳では、原文が一文の場合、訳文も一文で生成する傾向があります。また、日本語の特長として、複数の内容を複雑な文法や構成で一文にまとめる傾向があります。そのため、場合によっては、英訳された文章を二つ以上に分け、読みやすくする必要があります。

 

今回は、このような例をいくつか紹介したいと思います。

目次

1. 一つの文章を二つに分ける例①

  • • 原文:ただ、偏差だけではデータのばらつき具合を正しく表現できないので、分散と標準偏差が必要になります。
  • •機械翻訳:However, deviation alone cannot accurately represent the degree of variability in the data, so variance and standard deviation are required.
  • •修正後:However, the condition of data variation cannot be expressed correctly using only deviation. To do this, we also need variance and standard deviation.

 

ここでは、原文が一文であることから、機械翻訳も一文で訳されています。しかし、原文を以下のように分けて訳すほうが読みやすいため、適切に修正をしました。

 

「ただ、偏差だけではデータのばらつき具合を正しく表現できないのです。(正しく表現するには)分散と標準偏差が必要になります。」

 

機械翻訳が一文の原文を二つ以上に分けて訳する場合もあります。しかし、文章が不自然に分かれている場合もあるため注意が必要です。次の例文をご覧ください。

2. 一つの文章を二つに分ける例②

  • •原文: 分散とは、ばらつきの大小を表す指標で、偏差平方和の平均値で、分散が大きいほどばらつきが大きいということになります。
  • •機械翻訳:The variance is an index showing the magnitude of the variation. It is the average value of the sum of squared deviations, and the larger the variance, the larger the variation.
  • •修正後: Variance is an indicator of the extent of variation, and is the mean value of the sum of squared deviations. The greater the variance, the greater the variation.

 

機械翻訳では文章が以下のように分かれています。

 

「分散とは、ばらつきの大小を表す指標です。(分散とは、)偏差平方和の平均値で、分散が大きいほどばらつきが大きいということになります。」

 

しかし、読みやすくするためには、原文を以下のように分けることがおすすめです。

 

「分散とは、ばらつきの大小を表す指標で、偏差平方和の平均値です。分散が大きいほどばらつきが大きいということになります。」

3. 一つの文章を二つに分ける例③

  • •原文: そこで、気温と来客数を1ヵ月間調査し、そのデータを使って散布図を作成し、仕込み数量の予測を立ててみました。
  • •機械翻訳:Therefore, I investigated the temperature and the number of visitors for one month, created a scatter plot using the data, and made a forecast of the quantity to be charged for each problem.
  • •修正後:In response, the temperature and number of customers were measured for one month. The owner used this data to create a scatter diagram and try to predict the order quantity to address his problem.

 

機械翻訳は、「I investigated ……, created ……, and made…….」と、長くて読みにくい構成になっています。従って、ポストエディットで、原文を以下のように分けて訳ました。

 

「そこで、(店主は)気温と来客数を1ヵ月間調査しました。そのデータを使って散布図を作成し、困りごとの仕込み数量の予測を立ててみました。」

 

(👉他のポストエディットポイント:機械翻訳では主語が「I」となっていますが、文脈的に主語は「店主」なので、「the owner」にしました。)

4. 一つの文章を二つに分ける例④

  • •原文: DTCの基本的な考え方の1つで、現場・現物・現実で集めたデータを分析し、物事の良否を判断して、行動することが重要なポイントとなります。
  • •機械翻訳:One of the basic ideas of DTC, it is important to analyze the data collected in the field, in kind, and in reality, judge the quality of things, and take action.
  • •修正後:This is one of the DTC basic concepts. The key point of fact finding is to analyze data gathered from actual locations, actual objects, and actual conditions to make judgments about things before acting.

 

原文を見ると、「・・・で、・・・し、・・・して、・・・となります」の複雑な構成で、複数の内容を一つの文章でまとめています。その結果、機械翻訳で生成された訳文は、一文で構成も不自然です。従って、以下のように文章を分けるのが読みやすいと判断し、修正しました。

 

「(事実直視は、)DTCの基本的な考え方の1つです。現場・現物・現実で集めたデータを分析し、物事の良否を判断して、行動することが重要なポイントとなります。」

 

(👉他のポストエディットポイント:「現場・現物・現実」⇒「the field, in kind, and in reality」と、意味不明な訳になっているので、適切に「actual locations, actual objects, and actual conditions」と修正しました。)

 

5. 一つの文章を二つに分ける例⑤

  • • 原文: 機器Cの機種がDR5600Sであり、かつソフトウェアバージョン(手順8-9-4にて確認)がVer.3.2より前である場合は、スタック未対応バージョンであるため、スイッチ番号は4(固定値)となります。
  • •機械翻訳(Google翻訳):If the model of device C is DR5600S and the software version (confirmed in step 8-9-4) is earlier than Ver.3.2, the switch number is 4 (fixed value ).
  • •機械翻訳(DeepL):If Device C is a DR5600S and the software version is earlier than Ver. 3.2 (as confirmed in Step 8-9-4), the switch number is 4 (fixed value) because the stack is not supported by this version.
  • •修正後:If the model of device C is DR5600S and the software version (confirmed in step 8-9-4) is earlier than Ver. 3.2, the stack functionality is not supported. In this case, the switch number will be 4 (fixed value).
  • •さらに改善:If the model of device C is DR5600S and the software version confirmed in step 8-9-4 is earlier than Ver. 3.2, the stack functionality is not supported. In this case, the switch number will remain fixed at 4.

 

最後の例では、比較のために、対象の原文をGoogle翻訳とDeepLで処理してみました。その結果、DeepLの方が明らかに品質が高いことがわかりました。

 

Google翻訳の結果を見ると、まず、原文にある「スタック未対応バージョンであるため」が完全に省略されていることが分かります。これは訳漏れとなるため、致命的なエラーです。 また、「(fixed value )」において、「value」の後に不明なスペースが入っていることが分かります。

 

DeepLはこのような問題がないため、ポストエディットを行う際の負担が少ないと考えています。

 

ただし、DeepLの結果も、元の文章が一文であるため、機械翻訳も一文で訳されています。 この例でも、比較的多くの情報が一つの文章に含まれているため、読みやすさを考慮して二つの文章に分けることをおすすめします。その結果が、上記の「修正後」になります。

 

さらに読みやすくするために、原文にある括弧内の情報(「手順8-9-4にて確認」、「固定値」)を文章に統合することも検討できます。上記の「さらに改善」の例がそれを示しています。

 

機械翻訳は、原文が一文である場合、読みやすさを考慮し文章を二つ以上に分けて訳する能力に欠けています。そのため、ポストエディット作業において、このような対応は重要なポイントではないかと思います。

 

 

執筆者情報

アンディ パークマルチリンガルトランスレーショングループ
日英翻訳レビューアー

  • ・前職では、4年ほどITエンジニアとして従事、その後8年間英会話講師として教育プログラムの策定や講師育成に従事。
  • ・IT関連分野、ビジネス分野を中心とした翻訳歴11年。
  • ・現在はFA関連製品を中心に、製品マニュアル、ヘルプ、業務マニュアルなどの日英翻訳作業や翻訳品質管理に従事。
  • ・機械翻訳エンジンの日英翻訳品質評価・検証を担当。
人気記事ランキング
アーカイブ
カテゴリ

翻訳について
詳しく知りたい方

東京:03-5321-3111 
名古屋:052-269-8016

受付時間 9:30~17:00

お問い合わせ・資料請求