Some parts of this page may be machine-translated.

 

医療AIの信頼性を高めるために:教師データの品質とセキュリティ管理

alt

2025.3.10

医療AIの信頼性を高めるために:教師データの品質とセキュリティ管理



医療は、患者の生命と健康を直接左右する診断・治療を担うため、極めて高い信頼性が求められる分野です。近年この分野におけるAIの技術が進化しており、診断支援や病理画像の解析支援などで成果が上げられていますが、一方で現場ではAIに対しての慎重な姿勢も存在しています。例えばAIがどのように判断を下したのかが分からない「ブラックボックス問題」は、医療従事者にとって大きな懸念材料の一つです。厚生労働省が「AIは診療プロセスの中で医師主体判断のサブステップにおいて、その効率を上げて情報を提示する支援ツール」 *1であると位置づけていることからも分かるように、医療の現場では理由が分からないままAIの判断を信頼するには抵抗があるのが現実と言えます。

こうした課題を解決するアプローチは、出力結果を人間が理解できるように説明することに焦点を当てる説明可能なAI(XAI)の開発や、AIモデルの内部構造そのものを解析してその動作原理を理解しようとする手法など、さまざまに存在しています。その中でもまず取り組むことができるのは、AIの学習に使う教師データの質を最大限に高めることによって信頼性を向上させることです。今回は、医療AIの信頼性を高める鍵となる教師データの質と、それを支えるセキュリティ管理に焦点を当てて説明いたします。

*1:人工知能(AI)を用いた診断、治療等の支援を行うプログラムの利用と医師法第17条の規定との関係について(厚生労働省)
参考リンク:https://www.pmda.go.jp/files/000227450.pdf

目次

1. 信頼性の高い医療AI開発:品質と安全性の両立

AIの性能は、学習に使用する教師データの質に大きく依存します。そのため、データの正確性や症例の偏りがないバランスの取れたデータがAI全体の性能に直結いたします。特に医療分野では、判断基準のバラつきや不適切な判定リスクを避けるため、教師データの作成においては、ラベリング基準の標準化、一貫性のある判断、臨床的妥当性の確保といった点に細心の注意を払った品質管理が求められます。

一方で、これらの教師データに用いられる医療用画像は、患者の個人情報や機微な医療情報を多く含むため、厳格なセキュリティ管理が不可欠です。具体的には、個人情報保護法を遵守した匿名加工処理、不正アクセスや情報漏洩リスクを低減するためのデータ保存・管理方法の確立、適切なアクセス権限の設定など、教師データの収集から加工、データのラベル付け(アノテーション)の実施、保存、学習利用に至るまでのすべての工程において厳格なセキュリティ対策が求められます。 このように、医療AIの信頼性を確保するためには、高品質な教師データと徹底したデータセキュリティ管理の両立が必要不可欠です。

2. 医療AIにおける教師データ品質の重要性

AIは与えられた教師データをもとに学習するため、教師データの量と品質が欠かせません。そして、必要な期間内にそれら両方を実現するための作業者の確保が重要となります。

しかし本職の医師が、教師データの作業に多くの時間を割くのは容易ではありません。仮に医師に1日2〜3時間程度の作業時間を確保してもらったとしても、AIが学習するために必要な量の教師データを作成するには、一般の作業者に比べて長い期間が必要になります。作業を行う医師の人数を増やした場合、スケジュール調整やラベリングの判定に関する医師間の意見の相違が生じた際の調整が必要になるなど、マネジメントまで含めて作業負荷がさらに高まります。また、当然ながら一般の作業者に比べてコストが高くなってしまいます。
一方で一般作業者だけで作業を担当すると、コストや作業期間の問題は解決できる可能性が高まりますが、肝心な品質が疎かになり、信頼性が損なわれるリスクがあります。

また、開発側と医師の間で品質の認識にズレが生じないようにすることも重要です。両者の間に立って意見を調整する役割が不在であれば、AIの開発方針に沿った品質基準からズレてしまう可能性もあるでしょう。
医師による妥当性が確保された品質を実現するためには、ラベル付けの判定基準を明確に整理しつつ、開発側と医師双方の意見を適切にすり合わせながら進めていくプロジェクトマネージャーの存在が求められます。

3. 医療データの特性と機密性の重要性

医療データは、個人の健康状態や診断情報を含むため、慎重な取り扱いが求められます。このような機密性の高いデータにおいてAI技術の応用が進む中で、プライバシー保護とセキュリティ対策はますます重要になっています。

医療データの取り扱いには、個人情報保護法や関連する医療規制の順守が欠かせません。特にデータをAI開発に活用する場合は、匿名化や暗号化を徹底することが求められます。匿名化は、個人を特定できない形にデータを加工する方法で、これによりプライバシーを保護しながらAIの学習に活用できます。また、データを外部と共有する際には、契約の明確化や利用目的の厳格な管理が必要です。法的なルールを守ることで、医療機関やAI開発者はリスクを減らし、信頼性を高めることができます。

医療AIの開発・運用に関わるベンダーには、高いセキュリティ意識が求められます。その指標の一つが、情報資産を適切に管理し、外部からの脅威や内部のリスクを抑えるための国際基準であるISMS(情報セキュリティマネジメントシステム)認証です。認証を取得しているベンダーは、データの取り扱いに関する適切なルールを持ち、継続的に改善を図っていると判断できます。

さらに医療データに関わる業務を委託する際、機密情報の流出を防ぐために、NDA(秘密保持契約)をしっかりと取り交わすことが重要です。契約には、「秘密情報の範囲」「データの管理方法」「違反時の責任」などを明記し、関係者全員が情報管理の重要性を理解できる仕組みを作る必要があります。

4. 適切な外部ベンダーを活用するためのポイント

医療AI開発には質の高い教師データが不可欠です。そのうえでコスト・納期のバランスを保つためには、適切なベンダーの活用が効果的です。

参考ブログ:医療系AIのアノテーションにおける課題と解決〜ノウハウを持つ外注ベンダーの活用〜

医療系アノテーション作業に経験豊富な一般作業者を主体とし、それを数名の医師がチェックする体制を構築することで、QCDのバランスを最適化できます。この体制により、開発企業は高品質な教師データを確保しながらも、現実的なコストと納期で開発を進められます。

外部ベンダーを活用する際には、情報セキュリティマネジメントシステム(ISMS)認証を取得していることや、適切な秘密保持契約(NDA)を結ぶことが重要な選定基準と言えるでしょう。また、高セキュリティ要件に対応できるかも確認すべきです。クラウドワーカー中心の体制ではリモートワークが基本となり、ネットワーク経由やクラウド環境でのデータ保管が禁止されているケースには対応できないことがあります。専用セキュリティルームの有無や指定場所でのオンサイト作業対応の可否など、セキュリティ要件への対応力を加えて確認することで、貴重な医療データを安全に取り扱うことが可能かどうかを見極めることができます。

医療データにおける教師データの品質向上やセキュリティ管理に精通したベンダーを活用することは、効率的で高品質な教師データの作成を支援するだけでなく、厳格なセキュリティ対策を確保する上でも大きな利点となります。経験豊富なベンダーを選び、適切に連携体制を構築することが、医療AI開発の成功を左右する重要な要素といえるでしょう。

5. まとめ

信頼性が強く求められる医療AIにおいては、高品質な教師データと堅牢なセキュリティ対策が不可欠です。AIの学習精度は、正確でバランスの取れたアノテーションによって大きく左右されるため、医療系アノテーション経験を持つ一般作業者と医師によるチェック体制の構築が効果的です。これにより、品質を維持しながらコストと期間のバランスを取ることができます。同時に、患者情報を含む医療データを扱う上では、ISMS認証を取得しているなど、適切にデータを管理できるベンダー選定や、専用セキュリティ環境の確保など、厳格なデータ保護体制が求められます。
教師データの品質とセキュリティ管理に精通した専門ベンダーとの連携により、医療現場から信頼される安全なAIシステムの開発が実現できるでしょう。

6. ヒューマンサイエンスの医療系アノテーションサービス

●医療系画像の豊富なアノテーション経験

弊社では手術画像やMRI画像など、スキルトランスファーが必要とされる難易度や専門性の高い医療系画像アノテーションに多くの経験がございます。医療系画像アノテーションプロジェクトの経験豊富なPMに加え、作業経験者も多く、難易度や専門性が高く、スキルトランスファーが必要な案件であっても高品質のアノテーションを実現いたします。

●医師監修や医師によるアノテーションへの対応

一般の作業者だけで全ての作業を行うのは、やはり心配な場合もあるでしょう。そうした場合に一部チェック作業などで医師の監修をつけるなどのご要望もいただきます。こうしたご要望に応えるべく医師の監修体制もさらに強化しており、より難易度の高いアノテーションにも対応可能です。また、一般の作業者ではなく医師によるアノテーションをご要望の場合でも、リソース確保から品質・進捗管理までPMが伴走して万全のマネジメントサービスをご提供いたします。

●クラウドソーシングを利用しないリソース管理

ヒューマンサイエンスではクラウドソーシングは利用せず、当社が直接契約した作業担当者でプロジェクトを進行します。各メンバーの実務経験や、これまでの参加プロジェクトでの評価をしっかりと把握した上で、最大限のパフォーマンスを発揮できるチームを編成しています。

●自社内にセキュリティルームを完備

ヒューマンサイエンスでは、新宿オフィス内にISMSの基準をクリアしたセキュリティルームを完備しています。そのため、守秘性の高いデータを扱うプロジェクトであってもセキュリティを担保することが可能です。当社ではどのプロジェクトでも機密性の確保は非常に重要と捉えています。リモートのプロジェクトであっても、ハード面の対策のみならず、作業担当者にはセキュリティ教育を継続して実施するなど、当社の情報セキュリティ管理体制はお客様より高いご評価をいただいております。

●アノテーションのみならず生成系AI LLMデータセット作成・構造化にも対応

データ整理ためのラベリングや識別系AIのアノテーションのみでなく、生成系AI・LLM RAG構築のためのドキュメントデータの構造化にも対応します。創業当初から主な事業・サービスとしてマニュアル制作を行い、様々なドキュメントの構造を熟知している当社ならではのノウハウを活かした最適なソリューションを提供いたします。

 

 

 

関連ブログ

 

 

人気記事ランキング

お問い合わせ・資料請求

TOP