著者:
(1)シャダブ・アハメド、ブリティッシュコロンビア大学、ブリティッシュコロンビア州バンクーバー、BCがん研究所、ブリティッシュコロンビア州バンクーバー。また、米国ワシントン州レドモンドのMicrosoft AI for Good LabのMitacs Accelerateフェロー(2022年5月~2023年4月)でもありました(電子メール:[email protected])。
(2)Yixi Xu、Microsoft AI for Good Lab、レドモンド、ワシントン州、米国
(3)クレア・ガウディ、BC小児病院、バンクーバー、BC州、カナダ
(4) Joo H. O、聖マリア病院、ソウル、大韓民国
(5)イングリッド・ブロワズ、BCキャンサー、バンクーバー、BC州、カナダ
(6)ドン・ウィルソン、BCキャンサー、バンクーバー、BC州、カナダ
(7)パトリック・マルティノー、BCキャンサー、バンクーバー、BC、カナダ
(8)フランソワ・ベナール、BCがん、バンクーバー、BC州、カナダ
(9)フェレシュテ・ユセフィリジ、BCがん研究所、バンクーバー、BC州、カナダ
(10)Rahul Dodhia、Microsoft AI for Good Lab、レドモンド、ワシントン州、米国
(11)フアン・M・ラビスタ、Microsoft AI for Good Lab、レドモンド、ワシントン州、米国
(12)ウィリアム・B・ウィークス、マイクロソフトAI for Good Lab、ワシントン州レドモンド、米国
(13)カルロス・F・ウリベ、BCがん研究所、カナダ、ブリティッシュコロンビア州バンクーバー、ブリティッシュコロンビア大学、カナダ
(14)アルマン・ラミム、BCがん研究所、カナダ、ブリティッシュコロンビア州バンクーバー、ブリティッシュコロンビア大学、カナダ、ブリティッシュコロンビア州バンクーバー。
この研究では、PET/CT 画像からリンパ腫病変をセグメンテーションするための 4 つのニューラル ネットワーク アーキテクチャ (UNet、SegResNet、DynUNet、および SwinUNETR) の包括的な評価を実施しました。これらのネットワークは、611 症例の多様な多施設データセットでトレーニング、検証、およびテストされました。内部テスト (88 症例、総代謝腫瘍体積 (TMTV) 範囲 [0.52、2300] ml) では、SegResNet が最高のパフォーマンスを示し、Dice 類似度係数 (DSC) の中央値は 0.76、偽陽性体積 (FPV) の中央値は 4.55 ml でした。すべてのネットワークの偽陰性体積 (FNV) の中央値は 0 ml でした。目に見えない外部テスト セット (TMTV 範囲: [0.10, 2480] ml の 145 症例) では、SegResNet が最高の DSC 中央値 0.68 と FPV 21.46 ml を達成し、UNet が最高の FNV 0.41 ml を達成しました。6 つの病変測定の再現性を評価し、その予測誤差を計算し、これらの病変測定との関係で DSC パフォーマンスを調べて、セグメンテーションの精度と臨床的関連性に関する洞察を提供しました。さらに、病変を識別し、その数を数え、代謝特性に基づいてセグメンテーションを行うという臨床上の必要性に対応する 3 つの病変検出基準を導入しました。また、より回復力のあるセグメンテーション アルゴリズムの開発を支援するために、専門家による観察者内変動分析を実施し、「簡単な」症例と「難しい」症例をセグメンテーションする際の課題を明らかにしました。最後に、複数の専門家による注釈者が関与する標準化されたグラウンド トゥルース セグメンテーション プロトコルの重要性を強調する観察者間合意評価を実施しました。コードはhttps://github.com/microsoft/lymphoma-segmentationdnnで入手できます。
索引用語— 陽電子放出断層撮影、コンピュータ断層撮影、ディープラーニング、セグメンテーション、検出、病変測定、観察者内変動、観察者間変動
18F-FDG(18Fフルオロデオキシグルコース)PET/CT画像はリンパ腫患者の標準治療であり、正確な診断、病期分類、治療反応評価を提供します。しかし、ドーヴィルスコア[1]などの従来の定性評価では、画像解釈における観察者の主観により変動が生じる可能性があります。平均病変標準化摂取値(SUVmean)、総代謝腫瘍容積(TMTV)、総病変解糖(TLG)などの病変指標を組み込んだ定量PET分析を使用すると、より信頼性の高い予後決定への有望な道が開かれ、リンパ腫の患者転帰をより高い精度と信頼性で予測する能力が向上します[2]。
PET/CTイメージングにおける定量的評価は、多くの場合、手作業による病変のセグメンテーションに依存していますが、これは時間がかかり、観察者内および観察者間のばらつきが生じやすいものです。従来の閾値ベースの自動化技術では、低摂取疾患を見逃したり、放射性トレーサーの生理学的高摂取領域で偽陽性を生成したりする可能性があります。そのため、ディープラーニングは、病変のセグメンテーションを自動化し、ばらつきを減らし、患者のスループットを向上させ、困難な病変の検出に役立つ可能性があります[3]。
有望ではあるものの、ディープラーニング手法には独自の課題があります。畳み込みニューラル ネットワーク (CNN) には、入手が難しい、十分に注釈が付けられた大規模なデータセットが必要です。小規模なデータセットでトレーニングされたモデルは、一般化できない可能性があります。さらに、リンパ腫病変はサイズ、形状、代謝活動が大きく異なるため、明確に定義された事前確率がない場合、ディープ ネットワークを正確にトレーニングすることは困難です。ディープラーニングは、観察者の変動性を減らすことを目的としていますが、トレーニングに使用される一貫性のない手動注釈は、エラーの永続化につながる可能性があります。これらの課題を理解することは、PET/CT 定量分析でこれらの手法の可能性を最大限に活用するために不可欠です。
この論文はCC 4.0ライセンスの下でarxivで公開されています。