Some parts of this page may be machine-translated.

 

ChatGPTと医学翻訳

ChatGPTと医学翻訳

昨今、ITやビジネス関係のみならず、一般のニュースでもChatGPTの名前を聞かない日はないと言っても過言ではない状況ですが、弊社のブログでは、以前よりChatGPTに注目し、その翻訳力に焦点を当てた記事を掲載しています。

単純に翻訳させただけでなく、ChatGPTを使用して、用語指定、スタイル指定、訳文チェック、日本語校正、用語集作成を試みており、興味深い内容となっておりますので、ぜひご覧ください。

 

関連ブログChatGPTの翻訳力は?翻訳の各工程で徹底検証

 

さて、本稿では、医療翻訳におけるChatGPTにフォーカスしてお伝えしてまいります。

目次

医学論文のサマリー作成はできるのか?

ChatGPTに対しては、逐次翻訳の性能もさることながら、コンテンツのサマリー作成能力に興味があったため、まず、全文が無料公開されている、循環器関係の英語論文を題材に、英文・和文のサマリー作成を試みました。

 

いきなり全文を入力して、翻訳やサマリー作成をお願いしても、「The message you submitted was too long, please reload the conversation and submit something shorter.」というエラーメッセージが出て、受け付けてもらえません。論文をまるまる入力して、いっぺんにアブストラクトを作成してもらうことはできませんでした。

 

 

そこで、同論文のMethodのみ抜粋して入力し、「サマリー作成」をお願いしたら英語の文が、「抄訳作成」をお願いしたら日本語の文が生成されました。原文のワード数は977、生成された英文サマリーのワード数は223でした。日本語のサマリーの文字数は485でした。

 

内容的には、本研究が、循環器疾患を有する妊娠の患者における薬物治療の妊娠転帰への潜在的な影響を調べるための、無作為化対照試験を対象とした系統的レビューとメタ解析であることは述べられていましたが、原文には明記されていた、対象とする妊婦の疾患の詳細等の条件の記載はありませんでした。また、研究内で行われたデータベース検索で用いられたキーワードも、日本語サマリーでは列記されていませんでした。

 

今回の結果からは、単純にサマリー作成を指示しても、英語論文から研究者からみて適切な箇所を抽出したものを生成してもらうのは、厳しいと考えられます。現状では、AIが行うのはあくまで高度な自然言語処理と統計処理であることが反映された結果、と言えるのかもしれません。

 

ただし、都度、適当な検索条件を入力することで回答を改善できる可能性はありますし、現在、さまざまな研究機関がChatGPT等のAIを活用した論文の作成・校正について試行錯誤を行っており、サマリー作成法を含め、ChatGPTによる効果的な論文作成法が開発されている可能性はあります。その一方で、出版社等の媒体では大規模言語モデルの使用を制限する動きもあり、注視していく必要がありそうです。

医学論文の翻訳は?

ChatGPT には、1回の質問文の文字数制限はありません。ただし、質問欄に入力できる文字数に制限はなくても、回答の文字数には限りがあるようです。

実際、先述のとおり、3800ワード超の英語の論文を質問フィールドに入力はできましたが、翻訳をお願いしても、エラーメッセージが表示され、訳文は生成されませんでした。

 

続いて、同じ論文について、対象をIntroductionとMethods(1300ワードあまり)に絞り、翻訳をお願いしましたが、553文字のところで翻訳は止まってしまいました。

 

1回の操作でこなせる英日翻訳の量の目安は、翻訳後の日本語で500文字、原文で1000ワード程度といったところでした。1回1回の処理速度は確かに高速なのですが、産業翻訳で扱う量から考えると、これは少々力不足かもしれません。対話型AIによる柔軟性で得られる利益や将来の正確性の向上への期待はあるとはいえ、処理能力という点からいえば、大量のコンテンツを翻訳する必要があり、すでに機械翻訳を導入されているのであれば、現状では、あえてChatGPTに乗り換える必要はないと感じられました。

翻訳チェックの調べ物には使えるか?

ChatGPTは、そもそも自然な言語で対話ができるAIなので、原点に戻り(?)、翻訳チェックでの調べ物に使うのが、現状でのベストの使い方ではないかと思い、機密情報や個人情報につながるようなことは入力しないよう十分に注意したうえで、いろいろ試してみました。

 

医学翻訳とは言っても、医療システムや社内管理システムのような案件では、IT用語やマーケティング用語が頻出する場合があります。純粋に医学を専門に翻訳や翻訳チェックをメインにやってきた人からすると、一般的な言葉で訳してしまっていいのか、そのままカタカナ表記にしたほうが良いのか、または決まった訳があるのか、わからない場合や、よく意味が取れない用語に出くわすことがあります。

 

そこで、例えば、「IT」に対する「OT」について、ChatGPTに尋ねてみると、

「ITとOTは、それぞれ異なる種類の情報技術を表します。
IT(Information Technology)は、情報処理、情報共有、通信技術などを含む、主にデジタル情報技術のことを指します。例えば、コンピューターシステムやソフトウェア、ネットワークなどが含まれます。

一方、OT(Operational Technology)は、主に産業プロセスの自動化、制御、監視を行うためのハードウェア、ソフトウェア、およびシステムを指します。OTは、製造業、エネルギー、交通、農業、建設、医療など、様々な産業分野で使用されます。例えば、プロセス制御システム、自動化システム、センサー、アクチュエーター、SCADAシステムが含まれます。

ITとOTは、両方とも重要な役割を果たしていますが、それぞれ異なる目的を持っています。ITは、情報の処理、共有、管理に焦点を当てていますが、OTは、物理的なプロセスの制御、監視、自動化に焦点を当てています。最近では、ITとOTの統合が進んでおり、IoT(Internet of Things)やインダストリー4.0のような技術が登場し、両者の融合が促進されています。」

という回答が得られました。ネット検索で検証してみるとおおむね妥当な回答といえそうです。

 

また、英訳では、辞書ソフトや辞書サイトに出ていない、かと言ってウェブ検索ではどう検索したらほしい情報が得られるかわからずもどかしい、ということが時々あります。

 

そのようなとき、例えば、
「withコロナ」はそのまま「with COVID-19」と訳しても通じますか?

「チューブを〇〇〇〇側に出す」を英語で言うと?

といった問いかけを入力すれば、それに対して直接的に回答してくれます。そのまま使うことはなくても、出てきた回答をきっかけに煮詰まった思考が再び動き出す効果はあるかもしれないと感じました。

 

メディカル関係の用語にしても、案件の主要な用語を随時、確認・再確認しながら翻訳や翻訳チェックを行うというやり方も考えられます。

 

例えば、細胞解析機器の案件の際に、「マルチプレックスとは?」、「シングルセル解析とは」、「細胞解析におけるバッチ効果とは?」、「細胞解析における「ビーズ」とは?」といった問いかけを随時していくと、ブラウザ画面上に3段落程度の文章の説明が表示されているのは、それらの用語をある程度、承知していたとしても、それはそれで作業時の安心感が得られるように感じました。

 

ちなみに「マルチプレックスとは?」の回答は以下の通りでした。

マルチプレックスとは、複数の情報を同時に伝送するための技術や手法のことを指します。具体的には、同じ伝送路を複数の信号が共有して使うことで、複数の情報を同時に伝送する方法を指します。

 

例えば、テレビ局が複数のチャンネルを同時に放送する際には、それぞれのチャンネルの映像と音声を合成して、同じ電波を使って伝送することで、多くの情報を同時に伝送することができます。また、インターネット上で複数の通信を同時に行うための技術や、高速道路で複数の車線を設けることで複数の車両を同時に走行させることも、マルチプレックスの例です。

 

近年では、マルチプレックス技術を用いたデータ解析やバイオメディカル分野において、複数のデータや試料を同時に処理することで、高い効率性や高精度の解析が可能になっています。

 

上述の通り、ブラウザ画面上に、知りたいことの情報だけが直接的に、3段落程度の文字情報だけで表示されていることに一定の利便性を感じました。ウェブ検索では、自分が望む情報が載ったサイトを探すというステップを踏まないといけない、知りたいこと以外の情報や、広告など気の散るものが表示される、という悪条件がありますが、ChatGPTにはそれがありません。

必ず内容確認を!

ChatGPTに対する指摘として、古い情報や新しい情報はない、日本語版では情報の整備がまだまだこれから、そもそもネット上の情報しかないといった指摘は多く聞かれます。

 

しかし、それ以上に、ときどき「自信満々に間違ったことを言う」という、翻訳チェックにおいてはかなりの注意を要する問題があります。

 

間違った回答の一例ですが、バイオ翻訳を学ぶための教育機関はないか尋ねたところ、「フジタ・ヘルスコミュニケーションズ・インスティチュート(FHCI)」、「リベラルアーツ・ジャパン(LAJ))、「日本医学翻訳アカデミー」という、3つの機関を紹介し、それぞれ、「医学・バイオ翻訳の分野で、翻訳・ライティング・編集などのトレーニングを提供しているスクールです。通信教育やオンライン学習もあります。」といった説明も付けてくれました。

 

しかし…、これら3校ともウェブ検索してもヒットせず、実在しない可能性が高いものと考えられました。

 

そこで、「フジタ・ヘルスコミュニケーションズ・インスティチュート(FHCI)は存在しないのではないでしょうか?」と尋ねたところ、「申し訳ありません、私の先に述べた情報が正確でなかった可能性があります。私は、最新情報を持っているわけではないため、確実な情報を提供できなかったことをお詫び申し上げます。バイオ翻訳を学ぶために、より信頼できる情報源を確認することをお勧めします。ありがとうございました。」と回答されました。

 

もう1例、強迫性障害や不安性障害に関連する質問を入力したところ、
そのような症状は、強迫性障害の一種である「強迫性過剰検査症候群(OCD)」の可能性があります。OCDは、不合理な不安や強迫観念に苦しむことで特徴づけられ、その不安や強迫観念を払拭するために、繰り返し同じ行動を行うというパターンを持っています。(以下略)

 

「強迫性過剰検査症候群」という用語は耳慣れないものでしたし、Google検索してもやはり出てきません。そこで、「名前が違うのでは?」と入力したところ、申し訳ありません、誤った用語を使用してしまいました。正しい用語は「強迫性障害(OCD)」です。 という回答が表示されました…。

 

悪い冗談のような話ですが、これらは2023年4月時点で現実に起きた現象です。

 

これから日進月歩で情報の確度は上がっていくことは想像に難くありませんが、今回の検証にあたり決して膨大な数の質問をしたわけではなく、少なくとも現状では、誤った情報が表示される可能性は、ChatGPTに寄せられる期待値と比べて、やや高いのではないかと考えられます。

 

いずれにしても、もともと情報の裏を取ることは、翻訳や翻訳チェックにおける調べ物の大原則ですから、ChatGPTの情報についても、逐一確認するなど、十分な裏取りが求められると言えそうです。

まとめ

ChatGPTは、そもそも翻訳の専用サービスではなく、医学をはじめとする専門的な翻訳には向かないと思われがちですが、対話型AIの柔軟性や多機能性を活用して翻訳や翻訳チェックに補助的に使うことはできそうですし、それらについては追ってさらに検証してお伝えしていきたいと思います。

 

ただし、1回の操作のアウトプットが500文字あまりというのは、ビジネスベースの翻訳には使いづらいものがあります。加えて、アウトプットへの信頼性は現状では完全とは言えません。

 

翻訳関係の作業でも大きな可能性を感じさせるChatGPTですが、大切な医療コンテンツは、翻訳支援ツール、機械翻訳、人手翻訳のソリューションを提案できる翻訳会社とパートナーシップを組んで翻訳業務を行うことをお勧めします。

 

弊社では、人手翻訳サービスやポストエディットサービス、ChatGPT連携機能を搭載した自動翻訳ソフトMTrans for Officeもご提供しております。お悩みやご興味などございましたら、是非お気軽にお問合せ下さい。

 

>メディカル翻訳サービス

>ポストエディット代行

>Officeをかんたん翻訳ソフトMTrans for Office

 

その他にも、以下のような医療/医学翻訳に関する情報をご提供しております。お役立て頂けますと幸いです。

 

◆ブログ

・医療・医薬翻訳 とは?翻訳が難しい理由と、依頼先の選定ポイント

・医療翻訳でのDeepLの翻訳精度は? Google/Microsoft/Amazonとの比較結果

 

 

人気記事ランキング
アーカイブ
カテゴリ

翻訳について
詳しく知りたい方

東京:03-5321-3111 
名古屋:052-269-8016

受付時間 9:30~17:00

お問い合わせ・資料請求