Some parts of this page may be machine-translated.

 

ChatGPTによる医学翻訳の効率アップは可能?プロンプトを用いたリアルな検証結果をご紹介!

ChatGPTによる医学翻訳の効率アップは可能?プロンプトを用いたリアルな検証結果をご紹介!

ヒューマンサイエンスのスタッフは、日々、ChatGPTによる翻訳の効率アップに取り組んでおり、その成果は当ブログでも随時、ご紹介しています。今回は、「プロンプト」を用いた「医学翻訳」の「効率アップ」を中心に、検証結果をご紹介してまいります。

目次

1. ChatGPTで医学翻訳を行ったこれまでの検証結果

ヒューマンサイエンスのブログサイトでは、これまでにも2つの記事でChatGPTによる医学翻訳の検証結果を紹介してきました。

1-1. ChatGPTで医学翻訳を検証

「ChatGPTと医学翻訳」では、
・医学論文のMethodのみそのまま入力し、サマリー作成を試行
・上記と同じ論文のIntroductionとMethodsの翻訳を試行
・翻訳チェック時の調べ物に使えるかを検証
しました。
単純に「サマリー作成をお願いします」とするだけでは思うような結果は得られず、翻訳についても、1回あたりのアウトプット文字数の制約等の問題はあるが、背景知識確認などの翻訳周辺の補助的な作業については、情報の正確性のチェックは必要なものの、大いに活用できそうであることをお伝えしました。

1-2. ChatGPTのプロンプトを検証

「ChatGPTと医学翻訳② 医学翻訳でも「プロンプト」は有効か?試してみた」では、
・治験同意・説明文書を題材に、医学用語の訳語指定をして翻訳
・学会講演のスクリプトを題材に、語数制限を付けて字幕翻訳
について検証し、プロンプト作成についての一定のコツをつかめば、大いに有用なツールになり得ることについても考察しました。

ご興味があれば、ぜひご覧ください。

2. ChatGPTで医学翻訳の効率を上げるには?試みをいくつかご紹介

弊社メディカルグループでは、その後も、医学翻訳で発生するさまざまな周辺業務にChatGPTを役立てるために有効なプロンプトについての検証を行ってきました。ここでは、そのうちいくつかご紹介します。

2-1. 1つの文章内で生じた不要な改行を削除できる?→「不要な改行を削除してください」

PDF生成やSRTファイル(字幕作成で使われるファイル)作成等で、文章内に不要な改行が生じてしまうことがありますが、これにより本来なら1つの文が2つの文に分断されてしまい、機械翻訳や翻訳支援ツール使用の際の支障となってしまいますが、上記のプロンプトで改行削除ができました。

また、「各文をピリオド(日本語の場合は読点)の後ろで改行してください」というプロンプトで1文ごとに改行され、字幕翻訳など、翻訳関連作業をやりやすくできます。
これらはWordの置換でも可能ですが、シンプルに言葉で指示ができること、より少ない操作ステップでできること、結果が直感的にわかりやすいというメリットはありました。

2-2. バックトランスレーション(BT)チェックで、原文とBT文の差分抽出は可能?→「以下の「文章1」と「文章2」の、「意味的に」異なる箇所を挙げてください。」

翻訳作業のなかで、バックトランスレーションという工程を挟むことがあります。これは、「原文を翻訳した訳文」を使って再び「原文と同じの言語の訳文」(これをバックトランスレーション文:BT文といいます)を作成し、原文とBT文を比較することで、誤訳がないか確認することをいいます。
原文とBT文は、誤訳でなくても同一の文になることは少ないので、プロンプトを工夫して「“意味的に”異なる箇所」を抽出するようにすることで、表現上違うだけで意味は同じ文は抽出せずに、誤訳により原文と意味が異なる文になってしまった箇所だけを抽出できないか試みてみました。
結果としては、意図的に原文「組み入れ基準」のところ、BT文を反対の意味の「除外基準」に変えて検証したところ、しっかりとその箇所は指摘されていました。
もちろん、ChatGPTで指摘されなかった箇所も人間がチェックしなければなりませんが、チェック手段のひとつとして一定の効果はありそうです。

2-3. 頻出単語の抽出はできる?→「次の文章で複数回登場する用語を上位10個抽出して」

医療分野に限らず、産業翻訳において用語集があると作業効率はアップします。
翻訳済みの文書について、重要な用語をピックアップして対訳リストを作成しておけば、後続の翻訳に大いに役に立ちます。

精神医学関係の報告書で検証したところ、BZRA (benzodiazepine receptor agonist) や乱用患者、市販薬といった用語がピックアップされ、さらに「それぞれの用語が何回ずつ登場しているかを教えて」とプロンプトを入れることにより、抽出された用語の登場回数も示され、提示された出現数にも誤りはありませんでした。

一方で、「2018年」といった、用語というにはふさわしくない言葉が選ばれていることなどから、実運用する場合は注意が必要ですが、文書内の登場頻度順に対訳を作成することは簡単にできますし、プロンプトの工夫次第で重要な用語のみ抽出できる可能性も秘めているといえそうです。

2-4. 方言や癖のある口調を訳者が理解しやすいように標準語にすることはできる?→「以下の文章のべらんめぇ口調を、わかりやすい標準語にしてください。」

英語ネイティブが日本語を英訳する場合、講演話者が独特の口調だったり、方言や昔の言葉だったりすると、翻訳の正確性に影響が出ることがままあります。
ちょっと変わったケースではありますが、「べらんめぇ口調」の日本語を標準的な日本語にできるか試したところ、内容を端折ってしまう傾向はみられるものの、標準語へのリライトを試みてくれていました。人の目でのチェックは必要だが、人間がゼロから行うよりは時間の短縮がはかれそうという印象を持ちました。

2-5. 正規表現の検索時間の短縮はできる?→「XXXXの正規表現を教えてください。」

正規表現は翻訳の効率アップに有効です。
そもそも正規表現とは、「^[a-zA-Z0-9]+$」といったプログラミングになじみのない方だと何の意味のない文字の羅列ですが、正規表現を用いれば、複雑な文字列の検索や置換等ができ、さまざまな文字列の処理の効率がアップします。
例えばビジネスの現場であれば、「膨大なテキストデータのなかから電話番号と思われる文字列だけを抽出する」といった用途に使われます。
日英翻訳の場合なら、すでに英語になっている箇所や図表中の英数字は翻訳する必要がなく、それらのみを正規表現で抽出してあらかじめ翻訳対象から除外できれば、ドキュメントの分量が多ければ多いほど効率アップに繋がるわけです。

しかし、「半角英数字のみを抽出する正規表現」をWeb検索して該当する情報を探し当てるのは意外に苦労するものですし、本来ならば「正規表現」なるものを基礎から学ぶのが筋という考えもあるかもしれません。そんなとき、ChatGPTで「半角英数字のみを抽出する正規表現を教えてください」と指示すれば、目当ての正規表現「^[a-zA-Z0-9]+$」そのものずばりが得られるわけです。

この正規表現を使えば、WordやTradosなどの翻訳支援ツール等で検索して抽出し、翻訳不要な半角英数字を翻訳対象から外すことができます。

2-6. ブラケットによる語順崩れのない訳生成はできる?

人による厳重なポストエディットは不可欠とはいえ、現在の翻訳は機械翻訳を抜きに考えることはできません。
しかしながら、原文が長文であれば係り受けの誤りが生じやすく、意外な盲点として「」や()(英語であれば” “や[ ])が文中に多くある文章だと、最悪の場合、訳文が文章として破綻してしまうことが起こりえます。
そして、長文かつ括弧書きがふんだんに盛り込まれた文章が頻出するのが、治験関連文書や医学論文だったりします。
ChatGPTのプロンプトで、「」や()、” “や[ ]等を削除するよう指示することは可能ですが、それならWordの置換でもできるでしょう。
そこで、長文かつ括弧書きがふんだんに盛り込まれた治験関連文書の文章を、ChatGPTにそのまま翻訳させたところ、ChatGPTの方が、長文や括弧書きによる悪影響を受けにくかったという結果が得られました。
これについては、引き続き、再現性などを検証していきたいところです。

上記のほか、医療機器の取説などで時折出てくるWindow等のUIにあたる部分だけ公式の訳語を表記させることができるか、複数言語から特定の言語だけ抽出することはできるか、等々について検証中です。

3. まとめ

3-1. ChatGPTで医学翻訳は効率的できる

以上、頻出用語の抽出、正規表現の検索、標準語など翻訳しやすい文体へのリライト、強制改行の解除等々、さまざまな翻訳周辺作業がプロンプトの工夫次第で容易になることをご紹介いたしました。
AIが人の仕事を奪ってしまうのでないか等々、脅威論もありますが、今、現実に翻訳業界に身を置く者としては、むしろ能動的にAIをうまく乗りこなして、使えるものは使うというスタンスで付き合っていくのがよいのではないかという印象を新たにしました。

3-2. 医学翻訳もヒューマンサイエンスにお任せください

ヒューマンサイエンスは、機械翻訳や翻訳支援ツールを用いた翻訳業務の効率化に定評があります。また、今回ご紹介した、ChatGPTなどのAIを活用した翻訳や周辺業務の効率化を常に探求し、ブログで皆様にご紹介しています。

ヒューマンサイエンス ブログサイト

また、人手翻訳サービスやポストエディットサービスもご提供しております。TradosやPhrase TMS (旧称Memsource)等の翻訳支援(CAT)ツールや、自動翻訳ツールを活用し、翻訳の効率化と品質向上に取り組み、お客様の更なる発展に貢献してまいります。

ドキュメントテクノロジー・メディカルサイエンスの知識ともに高い専門性を備えた、ヒューマンサイエンスのメディカル翻訳をぜひお試しください。

お悩みやご興味などございましたら、是非お気軽にお問い合わせください。

メディカル翻訳サービス
ポストエディット代行

その他にも、以下のような医療/医学翻訳に関する情報を発信しております。お役立てください。

関連ブログ

医療・医薬翻訳 とは?翻訳が難しい理由と、依頼先の選定ポイント
医療翻訳でのDeepLの翻訳精度は? Google/Microsoft/Amazonとの比較結果
医療翻訳の精度は向上したか-DeepLとGoogle翻訳、2020年と2023年を比較
医学翻訳のプロが翻訳品質アップに役立った書籍を紹介!
ライフサイエンスとは?ライフサイエンス研究の重要性から高品質の翻訳を得る方法までを解説!

 

 

人気記事ランキング
アーカイブ
カテゴリ

翻訳について
詳しく知りたい方

東京:03-5321-3111 
名古屋:052-269-8016

受付時間 9:30~17:00

お問い合わせ・資料請求