Journal of Digestive Cancer Research 2024; 12(1): 31-37
Published online April 20, 2024
https://doi.org/10.52927/jdcr.2024.12.1.31
© Korean Society of Gastrointestinal Cancer Research
Correspondence to :
Jae Keun Park
E-mail: jaekpark@hallym.or.kr
https://orcid.org/0000-0002-8323-9660
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0). which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
Pancreatic cancer is a highly fatal malignancy with a 5-year survival rate of < 10%. Endoscopic ultrasound (EUS) is a useful noninvasive tool for differential diagnosis of pancreatic malignancy and treatment decision-making. However, the performance of EUS is suboptimal, and its accuracy for differentiating pancreatic malignancy has increased interest in the application of artificial intelligence (AI). Recent studies have reported that EUS-based AI models can facilitate early and more accurate diagnosis than other preexisting methods. This article provides a review of the literature on EUS-based AI studies of pancreatic malignancies.
KeywordsArtificial intelligence (AI) Endoscopic ultrasound (EUS) Pancreatic neoplasms
췌장암(pancreatic cancer, PC)은 가장 치명적인 암으로 5년 전체 생존율(5-year overall survival rate)은 모든 병기에서 9%로 4기 질환의 경우 3%에 불과하다[1]. 현재 악성 췌장 병변의 진단에는 CT 스캔, 자기공명영상(magnetic resonance imaging), 초음파내시경(endoscopic ultrasound, EUS) 등 다양한 기법이 사용되고 있는데, 이중에서도 초음파내시경(EUS)은 췌관 암종(pancreatic ductal adenocarcinoma) 및 췌관 선상세포 암종(pancreatic acinar cell carcinoma)과 같은 외분비계 세포에서 발생하는 악성 종양뿐 아니라 신경내분비 종양(pancreatic neuroendocrine tumors, PNETs), 췌장 낭포성 병변(pancreatic cystic lesions)과 같은 내분비 세포에서 발생하는 악성 췌장 병변의 진단에도 매우 유용하다[2]. 하지만, 만성 췌장염(chronic pancreatitis, CP)이 동반된 경우 EUS는 특이도가 낮아 감별 진단이 어렵고[3], 또한 시술자의 의존도가 높아 진단이 주관적일 수 있어 아직까지는 초음파내시경 유도하 세침 흡인 생검술(endoscopic ultrasound guided fine needle aspiration)을 이용한 세포학적 진단이 췌장암 진단의 gold standard이다.
인공지능(artificial intelligence, AI)은 생물학적 두뇌를 학습하고 모방하기 위해 개발된 모든 컴퓨터 시스템에 적용되는 기술로 특히, 머신 러닝(machine learning, ML)은 대량의 데이터를 이용해 다양한 패턴을 찾아내는 AI의 한 형태다(Fig. 1) [4]. 이러한 ML에는 지도 학습(supervised learning), 비지도 학습(unsupervised learning), 강화 학습(reinforced learning)의 세 가지 유형이 있는데, 이중 지도 학습은 의학, 특히 진단 분야에서 연구되고 응용이 되고 있다. 특히, EUS에서는 신경망(neural networks, NN)이라고도 불리는 인공 신경망(artificial neural networks, ANN)과 서포트 벡터 머신(support vector machine, SVM)이라는 두 가지 유형의 지도 학습 방법이 연구되었다[5]. 딥 러닝(deep learning, DL)은 ANN에서 유래한 고급 개념으로, 인간 두뇌의 뉴런에서 영감을 받아 ANN의 여러 복잡한 층을 사용한다. 최근 널리 쓰이는 DL 알고리즘의 중 하나인 합성 곱 신경망(convolutional neural network, CNN)은 데이터에서 지식을 추출해 학습이 이루어졌지만, 데이터의 특징을 추출하여 특징들의 패턴을 파악하는 알고리즘이다. 반면, support vector machine (SVM)은 이미 입력 및 출력으로 훈련된 매우 많은 양의 데이터가 공급되는 지도 ML 유형으로 훈련을 위해 더 많은 데이터 입력 없이는 더 많은 범주 지식을 자체 학습할 수 없다[6].
지난 몇 년 동안 인공지능(AI) 활용이 의료 전반에 걸쳐 급격히 확대되었으며, Xu 등[7]은 EUS 영상을 이용하여 췌장암에서 예후 평가에 대한 연구를 시행하여 발표하였다. 실제로 2015년부터 2023년까지 PubMed 검색에서 인공지능, 췌장암을 핵심 용어로 조사해보면 발표된 연구 수가 기하급수적으로 증가했음을 알 수 있다(Fig. 2). 본 고에서는 문헌 고찰을 통한 췌장 악성종양 진단에 대한 EUS 기반 AI 연구에 대한 효능에 대해서 논의하고자 한다.
Table 1에 현재까지 시행된 EUS를 이용한 췌장암 진단에 관한 인공지능 연구들을 정리하였다[8-18]. 대부분의 연구들이[8-10,13-15,17,18] 정지 EUS 이미지를 사용하였고, 2개의 연구에서는[11,12] 비디오 EUS 이미지를 대상으로 하였으며, 1편의 연구에서는[16] 정지 EUS 이미지와 비디오 EUS 이미지를 동시에 사용하였다. 연구에 사용된 AI model별로 살펴보면, 서포트 벡터 머신 연구(SVM) [8,9]가 2편, 인공 신경망(ANN) 연구[10-14]가 5편, 나머지 4편이 합성 곱 신경망(CNN)을 이용한 연구였다[15-18]. 이들 연구에 사용된 AI 모델마다 복잡성이 다른데, SVM은 시스템에 입력된 데이터를 두 개 이상의 범주에 대해 선형으로 구분된 두 개 이상의 범주로 분류하고 두 개 이상의 범주에 대해 계획하는 일종의 지도 ML 방법이다. SVM은 NN보다 상당히 간단하고 일반화 가능하지만 ML을 위해서는 많은 양의 데이터가 필요하다. ANN은 시스템이 인간 두뇌의 신경 회로를 모방하려는 AI의 한 형태로서 데이터는 노드로 연결된 여러 레이어를 통과하며 각 연결에는 특정 가중치가 부여되어 시스템이 학습하면서 조정할 수 있다[5,6]. CNN은 생물학적 두뇌가 처리하는 시각적 신호를 모방하도록 설계되었기 때문에 가장 정교한 AI 시스템으로 알려져 있다[5,6].
Table 1 . Study Characteristics of AI in Diagnosis of Pancreatic Malignancies Using EUS
Reference | Sample size | AI model | Task | AUC-ROC |
---|---|---|---|---|
Zhu et al. [8] | 388 patients | SVM | Extract EUS image parameters in differentiating PC from CP | N/A |
Zhang et al. [9] | 216 patients | SVM | Recognize PC from normal tissue using EUS images | 0.98 |
Das et al. [10] | 56 patients | ANN | Divided in regions from patients with NP, CP, and PC | 0.93 |
Săftoiu et al. [11] | 258 patients | ANN | Prospective multicenter-blinded analysis of real-time EUS elastography to differentiate PC from CP | 0.94 |
Săftoiu et al. [12] | 68 patients | ANN | Real time EUS elastography to differentiate malignancy (PNETs) from benign pattern | 0.93 |
Ozkan et al. [13] | 332 patients | ANN | EUS images from patients with PC and non-cancer patient | 0.88 |
Norton et al. [14] | 35 patients | ANN | EUS image from each procedure compared to EUS diagnosis in differentiating PC from FP | N/A |
Kuwahara et al. [15] | 50 patients | CNN | EUS images to differentiate benign from malignant IPMN | 0.98 |
Marya et al. [16] | 583 patients | CNN | Differentiate NP, CP, AIP, and PDAC | 0.98 |
Gu et al. [17] | 491 patients | CNN | Assessment of PDAC diagnosis from EUS images | 0.94 |
Tonozuka et al. [18] | 139 patients | CNN | EUS images in differentiation of PC from CP and NP | 0.92 |
AI, artificial intelligence; AIP, autoimmune pancreatitis; ANN, artificial neural network; CNN, convolutional neural network; EUS, endoscopic ultrasound; IPMN, intraductal papillary mucinous neoplasm; NP, normal pancreas; PC, pancreatic cancer; PDAC, pancreatic ductal adenocarcinoma; PNET, pancreatic neuroendocrine tumor; SVM, support vector machine.
각각의 사용된 AI model별로 살펴보면 정상 조직과 췌장암을 구별하는 SVM AI 지원 모델을 이용한 경우, Zhang 등[9]은 0.98의 area under the receiver-operating characteristic curve (AUC)를 달성하였으며, 정확도(accuracy), 민감도(sensitivity), 특이도(specificity)가 각각 98%, 94.3%, 99.5%로 좋은 성적을 발표하였다(Table 2). Zhu 등[8]도 SVM AI 지원 모델을 이용하여 민감도, 특이도가 각각 96.25%, 93.38%로 발표하여 정상 조직과 췌장암을 구별하는 데 SVM AI 지원 모델이 효과적일 수 있음을 발표하였다(Table 2). 단, 두 연구 모두에서 후향적 연구이며, 정지 EUS 영상을 이용하였다. 인공 신경망(ANN) 연구에서는 4편 중 3편에서 AUC가 0.875–0.94로 높았으며, 각각 83–100%, 50–94%, 75–97%, 57–100% 범위의 민감도, 특이도, 양성 예측값(positive predictive value, PPV) 및 음성 예측값(negative predictive value, NPV)을 보고하였다. 3개 연구에서는 AI 시스템에 공급하기 위해 정지 이미지를 사용했고, 다른 3개 연구에서는 분석을 위해 비디오 이미지를 사용하였다. 한 연구[16]에서는 환자를 연령별로 분류한 결과 60세 미만 환자의 경우 민감도가 85.7% (40–60세), 87.5%로 감소한 것에 비해 60세 이상 환자의 PC 검출에서 AI 민감도(93.3%)가 더 높았다. CNN을 사용한 세 가지 연구 중 두 개는 PC를 인식하는 AI의 진단 가치를 연구했고, 한 개는 양성 intraductal papillary mucinous neoplasms (IPMN)과 악성 IPMN의 구별을 연구했습니다. PC 인식을 평가한 두 연구에서는 각각 92–95%, 84–91%, 87%, 91–97% 범위의 민감도, 특이도, PPV 및 NPV를 보고했다. 세 번째 연구에서는 민감도, 특이도, PPV, NPV가 각각 96%, 93%, 92%, 96%로 보고되었다. 세 가지 연구 모두 EUS의 정지 이미지를 사용했으며 하나는 비디오 이미지도 포함했다. 3개 연구 중 2개 연구에서는 환자 수가 50명과 139명으로 작은 표본 크기를 갖고 데이터를 사용했다.
Table 2 . Diagnostic Performance of AI in Diagnosis of Pancreatic Malignancies Using EUS
Reference | Sn | Sp | PPV | NPV | Accuracy |
---|---|---|---|---|---|
Zhu et al. [8] | 0.96 | 0.93 | 0.92 | 0.97 | N/A |
Zhang et al. [9] | 0.94 | 0.99 | 0.99 | 0.98 | 0.98 |
Das et al. [10] | 0.93 | 0.92 | 0.87 | 0.96 | 0.93 |
Săftoiu et al. [11] | 0.88 | 0.83 | 0.96 | 0.57 | N/A |
Săftoiu et al. [12] | 0.91 | 0.88 | 0.89 | 0.91 | 0.90 |
Ozkan et al. [13] | 0.83 | 0.93 | N/A | N/A | 0.88 |
Norton et al. [14] | 1.00 | 0.50 | 0.75 | 1.00 | N/A |
Kuwahara et al. [15] | 0.96 | 0.93 | 0.92 | 0.96 | 0.98 |
Marya et al. [16] | 0.95 | 0.91 | 0.87 | 0.97 | 0.98 |
Gu et al. [17] | N/A | N/A | N/A | N/A | 0.94 |
Tonozuka et al. [18] | 0.94 | 0.84 | 0.87 | 0.91 | 0.92 |
AI, artificial intelligence; EUS, endoscopic ultrasound; Sn, sensitivity; Sp, specificity; PPV, positive predictive value; NPV, negative predictive value.
초음파내시경을 이용한 악성 췌장 병변에서 인공지능의 응용에 대한 대부분의 연구들이 췌장암(PC)과 만성 췌장염(CP)을 구별하는 데 중점을 두고 있다. 이들 연구들에서는 각각 88–100% 및 50–94% 범위의 민감도와 특이도로 CP를 구별할 수 있다고 발표하였으며, 양성 예측값(PPV) 및 음성 예측값(NPV)은 각각 75–97%, 57–100% 범위로 보고하였다[8,10,16,18]. 췌장암(PC)과 만성 췌장염(CP)을 구별하기 위한 SVM을 사용한 한 연구에서는 각각 96%의 민감도, 93%의 특이도, 94%의 정확도를 보고했다[8]. 이들 연구들 중에서 현재와 비교하여 초기 AI 모델을 가지고 작은 샘플 크기로 연구한 Norton 등[14]의 연구를 제외하면 민감도와 특이도는 각각 88–96%와 83–94%로 높게 나왔다. 한편, PC, CP 및 정상 췌장 환자의 이미지로 CNN 모델을 훈련하여 시행한 연구에서는 각각 민감도 94%, 특이도 84%와 AUC 0.92의 높은 결과로 PC를 식별하였다고 발표하였다(Table 2).
Kuwahara 등[15]은 연구에서 CNN을 사용하여 데이터 증강을 이용하여 분석된 508,160개의 이미지(3,970개의 정지 이미지로 구성된 악성 사례 23개와 양성 사례 27개) 사용하여 양성 IPMN과 악성 IPMN을 구별했다. 이 연구에서 사용된 모델은 악성 IPMN을 식별하는 데 0.98의 높은 AUC 값과 94%의 정확도, 95.7%의 민감도, 92.6%의 특이도를 보고하였다. 흥미로운 점은 Sendai guidelines과 Fukuoka guidelines의 민감도와 특이도가 각각 민감도 100%, 특이도 7.6%과 민감도 84.8%, 특이도 45%였다는 점으로 미루어 보아 AI 모델을 이용하는 것이 불필요한 췌장 절제술을 예방할 수 있다는 가능성을 보여준다[19].
췌장 신경내분비 종양(PNET)은 췌장의 내분비 세포에서 발생하며 기능하지 않는 종양의 경우 악성 종양의 유병률이 더 높아 비전이성 PNET의 경우, 수술적 절제를 통해 치료하는 경우가 많다. EUS는 매우 정밀한 검사이지만, 관찰하였을 때 대개 저에코성(hypoechoic) 음영으로 관찰되기 때문에 PNET, 췌장암 그리고 종괴 형성 췌장염 감별하는 것이 어려워 초음파 조영제를 이용한 조영 EUS (CE-EUS)가 도움이 된다. Săftoiu 등[12]은 ANN 모델을 이용하여 췌장암(PC)과 췌장 신경내분비 종양(PNET)을 구별하였으며, 0.93의 높은 AUC 값과 90%의 정확도, 91.4%의 민감도, 87.9%의 특이도를 보고하였다(Table 2).
앞서 살펴본 바와 같이 최근 몇 년 동안 췌장암의 진단에 있어 AI 지원 EUS 모델의 진단 정확도가 더 높다는 연구들이 보고되었다. 그러나 다른 진단 테스트와 마찬가지로 AI 지원 EUS 모델 역시 몇 가지 중요한 한계점들이 있다. 우선, AI 알고리즘에 대한 표준화 예를 들면, 데이터 수집, 처리 및 저장 등의 표준화된 가이드라인이 없다는 점이다[20]. 각기 다른 영상들을 이용하여 제작된 AI 지원 EUS 모델의 경우 관심 영역(area of interest)의 이미지를 얻는 데 각기 다른 방식으로 입력하지 않는 경우, 실제 연구에서 수행되었던 만큼의 진단의 정확도가 나오지 않을 수 있다. 물론, 극복하기 위해 입력 데이터에 대한 범용 프로토콜을 만들 수 있지만 이는 시간과 노동력이 극도로 많이 든다는 단점을 가지고 있다[20]. 다음으로는 인공지능의 지나치게 매개변수화 된 블랙박스(black box) 문제를 들 수 있다. ‘블랙박스’ AI는 출력 데이터를 도출하는 데 사용된 프로세스 및 작업에 대한 정보 없이 관찰자가 입력 및 출력 데이터를 시각화 할 수 있도록 하는 AI 알고리즘이다. 따라서 관찰자는 AI 알고리즘 내에서 특정 변수의 가중치가 어떻게 부여되었는지에 대한 추론을 해석하고 결정할 수 없기 때문에 환자에게 불리한 결과를 초래할 수 있는 오류를 방지하는 것이 불가능하다[21]. 따라서 아직까지의 기술로는 AI를 활용한 EUS 모델은 췌장암 진단과 치료에 있어서 보조 수단으로 활용되어야 한다. 마지막으로 민감한 환자 정보의 처리 및 저장과 관련된 수많은 윤리적 딜레마가 있다[22].
이러한 한계에도 불구하고 소화기 분야에서 AI 기술의 성장과 접목이 기하급수적으로 증가하였으며 초음파내시경을 이용한 악성 췌장 병변의 응용면에서도 여러 연구들이 발표되었다. 그러나 AI 지원 모델이나 사람의 진단 모두 완벽한 진단은 없었다는 점에서 인간을 대체하기보다는 보조자의 역할을 하는 방향으로 발전해 나가야 한다. 아직까지는 실제 임상에서 AI 기술을 적용하는 것은 초기 단계로 개선과 활용 범위가 넓다. 이를 위해서는 다른 분야와 마찬가지로 여러 검사 결과들을 동시에 분석하는 통합된 다중 양식 알고리듬(multi-modality algorithms)과 췌장암의 진단, 치료 및 예후 예측을 유기적이고 복합적으로 연결한 다중 작업 알고리듬(multi-task algorithm)의 개발이 필요하다[23]. 또한 기관 및 정부의 환자 개인 정보 보호법에 따른 데이터 접근 계약 및 사이버 보안 고려 사항 등과 같은 AI 기술의 안전한 개발 및 채택을 위한 기본 구성 요소에 대한 원칙을 세우고, 임상의와 기술자는 이 원칙을 따르도록 서로 협력해야 한다.
EUS를 이용한 췌장암의 응용 분야에서 AI의 활용은 초기 단계이며, 임상에 적합한 알고리즘을 개발하려면 임상의의 많은 노력이 필요하다. AI 지원 EUS 모델은 아직 개발 및 활용 초기 단계임에도 불구하고 높은 정확도로 췌장암의 조기 발견에 대한 가능성을 보여주었다. AI 모델별로 살펴보면 ANN 및 CNN보다 간단한 시스템인 SVM 시스템은 특히 고위험 개인의 빠른 선별 도구로서 유용해 보이지만 이를 개선하고 일상생활에 활용하기 위해서는 더 많은 대규모 전향적인 연구가 필요하다. 전반적으로 인간의 해석에 비해 AI 기술은 췌장암을 식별하고 이를 구별하는 데 있어 우수하였으나, 적절한 표준화 및 데이터 품질 부족, AI ‘블랙박스’ 문제, 민감한 환자 정보와 관련된 윤리적 딜레마 등의 한계점은 우리가 앞으로 더 많은 연구와 기술 진보를 통해 극복해야 할 사항들이다. 이러한 한계에도 불구하고 AI 기술은 대규모 데이터 세트를 분석하고 처리하는 정확성으로 인해 의료, 췌장암의 조기 진단 미래를 변화시키는 데 중요한 역할을 할 수 있으며, 내시경 검사자의 ‘보조자’ 역할을 하여 진단 정확도를 향상시킬 수 있다. 이를 위해서는 다중 양식 알고리듬(multi-modality algorithms)과 다중 작업 알고리듬(multi-task algorithm)과 같은 새로운 기술의 개발과 더불어 대규모 전향적 임상 시험을 통한 검증이 필요하다. 더불어 임상의와 기술자는 윤리적인 한계를 뛰어넘기 위해 원칙을 정하고 따르도록 서로 협력해야 한다.
None.
No potential conflict of interest relevant to this article was reported.
Conceptualization: Jae Keun Park. Data acquisition: Jae Hee Ahn. Formal analysis: Hwehoon Chung. Investigation: Hwehoon Chung. Software: Hwehoon Chung. Supervision: Jae Keun Park. Validation: Hwehoon Chung. Writing—original draft: Jae Hee Ahn. Writing—review & editing: Hwehoon Chung, Jae Keun Park.
Journal of Digestive Cancer Research 2024; 12(1): 31-37
Published online April 20, 2024 https://doi.org/10.52927/jdcr.2024.12.1.31
Copyright © Korean Society of Gastrointestinal Cancer Research.
안재희, 정회훈, 박재근
한림대학교 의과대학 강남성심병원 소화기내과
Jae Hee Ahn , Hwehoon Chung , Jae Keun Park
Department of Gastroenterology, Kangnam Sacred Heart Hospital, Hallym University College of Medicine, Seoul, Korea
Correspondence to:Jae Keun Park
E-mail: jaekpark@hallym.or.kr
https://orcid.org/0000-0002-8323-9660
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0). which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
Pancreatic cancer is a highly fatal malignancy with a 5-year survival rate of < 10%. Endoscopic ultrasound (EUS) is a useful noninvasive tool for differential diagnosis of pancreatic malignancy and treatment decision-making. However, the performance of EUS is suboptimal, and its accuracy for differentiating pancreatic malignancy has increased interest in the application of artificial intelligence (AI). Recent studies have reported that EUS-based AI models can facilitate early and more accurate diagnosis than other preexisting methods. This article provides a review of the literature on EUS-based AI studies of pancreatic malignancies.
Keywords: Artificial intelligence (AI), Endoscopic ultrasound (EUS), Pancreatic neoplasms
췌장암(pancreatic cancer, PC)은 가장 치명적인 암으로 5년 전체 생존율(5-year overall survival rate)은 모든 병기에서 9%로 4기 질환의 경우 3%에 불과하다[1]. 현재 악성 췌장 병변의 진단에는 CT 스캔, 자기공명영상(magnetic resonance imaging), 초음파내시경(endoscopic ultrasound, EUS) 등 다양한 기법이 사용되고 있는데, 이중에서도 초음파내시경(EUS)은 췌관 암종(pancreatic ductal adenocarcinoma) 및 췌관 선상세포 암종(pancreatic acinar cell carcinoma)과 같은 외분비계 세포에서 발생하는 악성 종양뿐 아니라 신경내분비 종양(pancreatic neuroendocrine tumors, PNETs), 췌장 낭포성 병변(pancreatic cystic lesions)과 같은 내분비 세포에서 발생하는 악성 췌장 병변의 진단에도 매우 유용하다[2]. 하지만, 만성 췌장염(chronic pancreatitis, CP)이 동반된 경우 EUS는 특이도가 낮아 감별 진단이 어렵고[3], 또한 시술자의 의존도가 높아 진단이 주관적일 수 있어 아직까지는 초음파내시경 유도하 세침 흡인 생검술(endoscopic ultrasound guided fine needle aspiration)을 이용한 세포학적 진단이 췌장암 진단의 gold standard이다.
인공지능(artificial intelligence, AI)은 생물학적 두뇌를 학습하고 모방하기 위해 개발된 모든 컴퓨터 시스템에 적용되는 기술로 특히, 머신 러닝(machine learning, ML)은 대량의 데이터를 이용해 다양한 패턴을 찾아내는 AI의 한 형태다(Fig. 1) [4]. 이러한 ML에는 지도 학습(supervised learning), 비지도 학습(unsupervised learning), 강화 학습(reinforced learning)의 세 가지 유형이 있는데, 이중 지도 학습은 의학, 특히 진단 분야에서 연구되고 응용이 되고 있다. 특히, EUS에서는 신경망(neural networks, NN)이라고도 불리는 인공 신경망(artificial neural networks, ANN)과 서포트 벡터 머신(support vector machine, SVM)이라는 두 가지 유형의 지도 학습 방법이 연구되었다[5]. 딥 러닝(deep learning, DL)은 ANN에서 유래한 고급 개념으로, 인간 두뇌의 뉴런에서 영감을 받아 ANN의 여러 복잡한 층을 사용한다. 최근 널리 쓰이는 DL 알고리즘의 중 하나인 합성 곱 신경망(convolutional neural network, CNN)은 데이터에서 지식을 추출해 학습이 이루어졌지만, 데이터의 특징을 추출하여 특징들의 패턴을 파악하는 알고리즘이다. 반면, support vector machine (SVM)은 이미 입력 및 출력으로 훈련된 매우 많은 양의 데이터가 공급되는 지도 ML 유형으로 훈련을 위해 더 많은 데이터 입력 없이는 더 많은 범주 지식을 자체 학습할 수 없다[6].
지난 몇 년 동안 인공지능(AI) 활용이 의료 전반에 걸쳐 급격히 확대되었으며, Xu 등[7]은 EUS 영상을 이용하여 췌장암에서 예후 평가에 대한 연구를 시행하여 발표하였다. 실제로 2015년부터 2023년까지 PubMed 검색에서 인공지능, 췌장암을 핵심 용어로 조사해보면 발표된 연구 수가 기하급수적으로 증가했음을 알 수 있다(Fig. 2). 본 고에서는 문헌 고찰을 통한 췌장 악성종양 진단에 대한 EUS 기반 AI 연구에 대한 효능에 대해서 논의하고자 한다.
Table 1에 현재까지 시행된 EUS를 이용한 췌장암 진단에 관한 인공지능 연구들을 정리하였다[8-18]. 대부분의 연구들이[8-10,13-15,17,18] 정지 EUS 이미지를 사용하였고, 2개의 연구에서는[11,12] 비디오 EUS 이미지를 대상으로 하였으며, 1편의 연구에서는[16] 정지 EUS 이미지와 비디오 EUS 이미지를 동시에 사용하였다. 연구에 사용된 AI model별로 살펴보면, 서포트 벡터 머신 연구(SVM) [8,9]가 2편, 인공 신경망(ANN) 연구[10-14]가 5편, 나머지 4편이 합성 곱 신경망(CNN)을 이용한 연구였다[15-18]. 이들 연구에 사용된 AI 모델마다 복잡성이 다른데, SVM은 시스템에 입력된 데이터를 두 개 이상의 범주에 대해 선형으로 구분된 두 개 이상의 범주로 분류하고 두 개 이상의 범주에 대해 계획하는 일종의 지도 ML 방법이다. SVM은 NN보다 상당히 간단하고 일반화 가능하지만 ML을 위해서는 많은 양의 데이터가 필요하다. ANN은 시스템이 인간 두뇌의 신경 회로를 모방하려는 AI의 한 형태로서 데이터는 노드로 연결된 여러 레이어를 통과하며 각 연결에는 특정 가중치가 부여되어 시스템이 학습하면서 조정할 수 있다[5,6]. CNN은 생물학적 두뇌가 처리하는 시각적 신호를 모방하도록 설계되었기 때문에 가장 정교한 AI 시스템으로 알려져 있다[5,6].
Table 1 . Study Characteristics of AI in Diagnosis of Pancreatic Malignancies Using EUS.
Reference | Sample size | AI model | Task | AUC-ROC |
---|---|---|---|---|
Zhu et al. [8] | 388 patients | SVM | Extract EUS image parameters in differentiating PC from CP | N/A |
Zhang et al. [9] | 216 patients | SVM | Recognize PC from normal tissue using EUS images | 0.98 |
Das et al. [10] | 56 patients | ANN | Divided in regions from patients with NP, CP, and PC | 0.93 |
Săftoiu et al. [11] | 258 patients | ANN | Prospective multicenter-blinded analysis of real-time EUS elastography to differentiate PC from CP | 0.94 |
Săftoiu et al. [12] | 68 patients | ANN | Real time EUS elastography to differentiate malignancy (PNETs) from benign pattern | 0.93 |
Ozkan et al. [13] | 332 patients | ANN | EUS images from patients with PC and non-cancer patient | 0.88 |
Norton et al. [14] | 35 patients | ANN | EUS image from each procedure compared to EUS diagnosis in differentiating PC from FP | N/A |
Kuwahara et al. [15] | 50 patients | CNN | EUS images to differentiate benign from malignant IPMN | 0.98 |
Marya et al. [16] | 583 patients | CNN | Differentiate NP, CP, AIP, and PDAC | 0.98 |
Gu et al. [17] | 491 patients | CNN | Assessment of PDAC diagnosis from EUS images | 0.94 |
Tonozuka et al. [18] | 139 patients | CNN | EUS images in differentiation of PC from CP and NP | 0.92 |
AI, artificial intelligence; AIP, autoimmune pancreatitis; ANN, artificial neural network; CNN, convolutional neural network; EUS, endoscopic ultrasound; IPMN, intraductal papillary mucinous neoplasm; NP, normal pancreas; PC, pancreatic cancer; PDAC, pancreatic ductal adenocarcinoma; PNET, pancreatic neuroendocrine tumor; SVM, support vector machine..
각각의 사용된 AI model별로 살펴보면 정상 조직과 췌장암을 구별하는 SVM AI 지원 모델을 이용한 경우, Zhang 등[9]은 0.98의 area under the receiver-operating characteristic curve (AUC)를 달성하였으며, 정확도(accuracy), 민감도(sensitivity), 특이도(specificity)가 각각 98%, 94.3%, 99.5%로 좋은 성적을 발표하였다(Table 2). Zhu 등[8]도 SVM AI 지원 모델을 이용하여 민감도, 특이도가 각각 96.25%, 93.38%로 발표하여 정상 조직과 췌장암을 구별하는 데 SVM AI 지원 모델이 효과적일 수 있음을 발표하였다(Table 2). 단, 두 연구 모두에서 후향적 연구이며, 정지 EUS 영상을 이용하였다. 인공 신경망(ANN) 연구에서는 4편 중 3편에서 AUC가 0.875–0.94로 높았으며, 각각 83–100%, 50–94%, 75–97%, 57–100% 범위의 민감도, 특이도, 양성 예측값(positive predictive value, PPV) 및 음성 예측값(negative predictive value, NPV)을 보고하였다. 3개 연구에서는 AI 시스템에 공급하기 위해 정지 이미지를 사용했고, 다른 3개 연구에서는 분석을 위해 비디오 이미지를 사용하였다. 한 연구[16]에서는 환자를 연령별로 분류한 결과 60세 미만 환자의 경우 민감도가 85.7% (40–60세), 87.5%로 감소한 것에 비해 60세 이상 환자의 PC 검출에서 AI 민감도(93.3%)가 더 높았다. CNN을 사용한 세 가지 연구 중 두 개는 PC를 인식하는 AI의 진단 가치를 연구했고, 한 개는 양성 intraductal papillary mucinous neoplasms (IPMN)과 악성 IPMN의 구별을 연구했습니다. PC 인식을 평가한 두 연구에서는 각각 92–95%, 84–91%, 87%, 91–97% 범위의 민감도, 특이도, PPV 및 NPV를 보고했다. 세 번째 연구에서는 민감도, 특이도, PPV, NPV가 각각 96%, 93%, 92%, 96%로 보고되었다. 세 가지 연구 모두 EUS의 정지 이미지를 사용했으며 하나는 비디오 이미지도 포함했다. 3개 연구 중 2개 연구에서는 환자 수가 50명과 139명으로 작은 표본 크기를 갖고 데이터를 사용했다.
Table 2 . Diagnostic Performance of AI in Diagnosis of Pancreatic Malignancies Using EUS.
Reference | Sn | Sp | PPV | NPV | Accuracy |
---|---|---|---|---|---|
Zhu et al. [8] | 0.96 | 0.93 | 0.92 | 0.97 | N/A |
Zhang et al. [9] | 0.94 | 0.99 | 0.99 | 0.98 | 0.98 |
Das et al. [10] | 0.93 | 0.92 | 0.87 | 0.96 | 0.93 |
Săftoiu et al. [11] | 0.88 | 0.83 | 0.96 | 0.57 | N/A |
Săftoiu et al. [12] | 0.91 | 0.88 | 0.89 | 0.91 | 0.90 |
Ozkan et al. [13] | 0.83 | 0.93 | N/A | N/A | 0.88 |
Norton et al. [14] | 1.00 | 0.50 | 0.75 | 1.00 | N/A |
Kuwahara et al. [15] | 0.96 | 0.93 | 0.92 | 0.96 | 0.98 |
Marya et al. [16] | 0.95 | 0.91 | 0.87 | 0.97 | 0.98 |
Gu et al. [17] | N/A | N/A | N/A | N/A | 0.94 |
Tonozuka et al. [18] | 0.94 | 0.84 | 0.87 | 0.91 | 0.92 |
AI, artificial intelligence; EUS, endoscopic ultrasound; Sn, sensitivity; Sp, specificity; PPV, positive predictive value; NPV, negative predictive value..
초음파내시경을 이용한 악성 췌장 병변에서 인공지능의 응용에 대한 대부분의 연구들이 췌장암(PC)과 만성 췌장염(CP)을 구별하는 데 중점을 두고 있다. 이들 연구들에서는 각각 88–100% 및 50–94% 범위의 민감도와 특이도로 CP를 구별할 수 있다고 발표하였으며, 양성 예측값(PPV) 및 음성 예측값(NPV)은 각각 75–97%, 57–100% 범위로 보고하였다[8,10,16,18]. 췌장암(PC)과 만성 췌장염(CP)을 구별하기 위한 SVM을 사용한 한 연구에서는 각각 96%의 민감도, 93%의 특이도, 94%의 정확도를 보고했다[8]. 이들 연구들 중에서 현재와 비교하여 초기 AI 모델을 가지고 작은 샘플 크기로 연구한 Norton 등[14]의 연구를 제외하면 민감도와 특이도는 각각 88–96%와 83–94%로 높게 나왔다. 한편, PC, CP 및 정상 췌장 환자의 이미지로 CNN 모델을 훈련하여 시행한 연구에서는 각각 민감도 94%, 특이도 84%와 AUC 0.92의 높은 결과로 PC를 식별하였다고 발표하였다(Table 2).
Kuwahara 등[15]은 연구에서 CNN을 사용하여 데이터 증강을 이용하여 분석된 508,160개의 이미지(3,970개의 정지 이미지로 구성된 악성 사례 23개와 양성 사례 27개) 사용하여 양성 IPMN과 악성 IPMN을 구별했다. 이 연구에서 사용된 모델은 악성 IPMN을 식별하는 데 0.98의 높은 AUC 값과 94%의 정확도, 95.7%의 민감도, 92.6%의 특이도를 보고하였다. 흥미로운 점은 Sendai guidelines과 Fukuoka guidelines의 민감도와 특이도가 각각 민감도 100%, 특이도 7.6%과 민감도 84.8%, 특이도 45%였다는 점으로 미루어 보아 AI 모델을 이용하는 것이 불필요한 췌장 절제술을 예방할 수 있다는 가능성을 보여준다[19].
췌장 신경내분비 종양(PNET)은 췌장의 내분비 세포에서 발생하며 기능하지 않는 종양의 경우 악성 종양의 유병률이 더 높아 비전이성 PNET의 경우, 수술적 절제를 통해 치료하는 경우가 많다. EUS는 매우 정밀한 검사이지만, 관찰하였을 때 대개 저에코성(hypoechoic) 음영으로 관찰되기 때문에 PNET, 췌장암 그리고 종괴 형성 췌장염 감별하는 것이 어려워 초음파 조영제를 이용한 조영 EUS (CE-EUS)가 도움이 된다. Săftoiu 등[12]은 ANN 모델을 이용하여 췌장암(PC)과 췌장 신경내분비 종양(PNET)을 구별하였으며, 0.93의 높은 AUC 값과 90%의 정확도, 91.4%의 민감도, 87.9%의 특이도를 보고하였다(Table 2).
앞서 살펴본 바와 같이 최근 몇 년 동안 췌장암의 진단에 있어 AI 지원 EUS 모델의 진단 정확도가 더 높다는 연구들이 보고되었다. 그러나 다른 진단 테스트와 마찬가지로 AI 지원 EUS 모델 역시 몇 가지 중요한 한계점들이 있다. 우선, AI 알고리즘에 대한 표준화 예를 들면, 데이터 수집, 처리 및 저장 등의 표준화된 가이드라인이 없다는 점이다[20]. 각기 다른 영상들을 이용하여 제작된 AI 지원 EUS 모델의 경우 관심 영역(area of interest)의 이미지를 얻는 데 각기 다른 방식으로 입력하지 않는 경우, 실제 연구에서 수행되었던 만큼의 진단의 정확도가 나오지 않을 수 있다. 물론, 극복하기 위해 입력 데이터에 대한 범용 프로토콜을 만들 수 있지만 이는 시간과 노동력이 극도로 많이 든다는 단점을 가지고 있다[20]. 다음으로는 인공지능의 지나치게 매개변수화 된 블랙박스(black box) 문제를 들 수 있다. ‘블랙박스’ AI는 출력 데이터를 도출하는 데 사용된 프로세스 및 작업에 대한 정보 없이 관찰자가 입력 및 출력 데이터를 시각화 할 수 있도록 하는 AI 알고리즘이다. 따라서 관찰자는 AI 알고리즘 내에서 특정 변수의 가중치가 어떻게 부여되었는지에 대한 추론을 해석하고 결정할 수 없기 때문에 환자에게 불리한 결과를 초래할 수 있는 오류를 방지하는 것이 불가능하다[21]. 따라서 아직까지의 기술로는 AI를 활용한 EUS 모델은 췌장암 진단과 치료에 있어서 보조 수단으로 활용되어야 한다. 마지막으로 민감한 환자 정보의 처리 및 저장과 관련된 수많은 윤리적 딜레마가 있다[22].
이러한 한계에도 불구하고 소화기 분야에서 AI 기술의 성장과 접목이 기하급수적으로 증가하였으며 초음파내시경을 이용한 악성 췌장 병변의 응용면에서도 여러 연구들이 발표되었다. 그러나 AI 지원 모델이나 사람의 진단 모두 완벽한 진단은 없었다는 점에서 인간을 대체하기보다는 보조자의 역할을 하는 방향으로 발전해 나가야 한다. 아직까지는 실제 임상에서 AI 기술을 적용하는 것은 초기 단계로 개선과 활용 범위가 넓다. 이를 위해서는 다른 분야와 마찬가지로 여러 검사 결과들을 동시에 분석하는 통합된 다중 양식 알고리듬(multi-modality algorithms)과 췌장암의 진단, 치료 및 예후 예측을 유기적이고 복합적으로 연결한 다중 작업 알고리듬(multi-task algorithm)의 개발이 필요하다[23]. 또한 기관 및 정부의 환자 개인 정보 보호법에 따른 데이터 접근 계약 및 사이버 보안 고려 사항 등과 같은 AI 기술의 안전한 개발 및 채택을 위한 기본 구성 요소에 대한 원칙을 세우고, 임상의와 기술자는 이 원칙을 따르도록 서로 협력해야 한다.
EUS를 이용한 췌장암의 응용 분야에서 AI의 활용은 초기 단계이며, 임상에 적합한 알고리즘을 개발하려면 임상의의 많은 노력이 필요하다. AI 지원 EUS 모델은 아직 개발 및 활용 초기 단계임에도 불구하고 높은 정확도로 췌장암의 조기 발견에 대한 가능성을 보여주었다. AI 모델별로 살펴보면 ANN 및 CNN보다 간단한 시스템인 SVM 시스템은 특히 고위험 개인의 빠른 선별 도구로서 유용해 보이지만 이를 개선하고 일상생활에 활용하기 위해서는 더 많은 대규모 전향적인 연구가 필요하다. 전반적으로 인간의 해석에 비해 AI 기술은 췌장암을 식별하고 이를 구별하는 데 있어 우수하였으나, 적절한 표준화 및 데이터 품질 부족, AI ‘블랙박스’ 문제, 민감한 환자 정보와 관련된 윤리적 딜레마 등의 한계점은 우리가 앞으로 더 많은 연구와 기술 진보를 통해 극복해야 할 사항들이다. 이러한 한계에도 불구하고 AI 기술은 대규모 데이터 세트를 분석하고 처리하는 정확성으로 인해 의료, 췌장암의 조기 진단 미래를 변화시키는 데 중요한 역할을 할 수 있으며, 내시경 검사자의 ‘보조자’ 역할을 하여 진단 정확도를 향상시킬 수 있다. 이를 위해서는 다중 양식 알고리듬(multi-modality algorithms)과 다중 작업 알고리듬(multi-task algorithm)과 같은 새로운 기술의 개발과 더불어 대규모 전향적 임상 시험을 통한 검증이 필요하다. 더불어 임상의와 기술자는 윤리적인 한계를 뛰어넘기 위해 원칙을 정하고 따르도록 서로 협력해야 한다.
None.
No potential conflict of interest relevant to this article was reported.
Conceptualization: Jae Keun Park. Data acquisition: Jae Hee Ahn. Formal analysis: Hwehoon Chung. Investigation: Hwehoon Chung. Software: Hwehoon Chung. Supervision: Jae Keun Park. Validation: Hwehoon Chung. Writing—original draft: Jae Hee Ahn. Writing—review & editing: Hwehoon Chung, Jae Keun Park.
Table 1 . Study Characteristics of AI in Diagnosis of Pancreatic Malignancies Using EUS.
Reference | Sample size | AI model | Task | AUC-ROC |
---|---|---|---|---|
Zhu et al. [8] | 388 patients | SVM | Extract EUS image parameters in differentiating PC from CP | N/A |
Zhang et al. [9] | 216 patients | SVM | Recognize PC from normal tissue using EUS images | 0.98 |
Das et al. [10] | 56 patients | ANN | Divided in regions from patients with NP, CP, and PC | 0.93 |
Săftoiu et al. [11] | 258 patients | ANN | Prospective multicenter-blinded analysis of real-time EUS elastography to differentiate PC from CP | 0.94 |
Săftoiu et al. [12] | 68 patients | ANN | Real time EUS elastography to differentiate malignancy (PNETs) from benign pattern | 0.93 |
Ozkan et al. [13] | 332 patients | ANN | EUS images from patients with PC and non-cancer patient | 0.88 |
Norton et al. [14] | 35 patients | ANN | EUS image from each procedure compared to EUS diagnosis in differentiating PC from FP | N/A |
Kuwahara et al. [15] | 50 patients | CNN | EUS images to differentiate benign from malignant IPMN | 0.98 |
Marya et al. [16] | 583 patients | CNN | Differentiate NP, CP, AIP, and PDAC | 0.98 |
Gu et al. [17] | 491 patients | CNN | Assessment of PDAC diagnosis from EUS images | 0.94 |
Tonozuka et al. [18] | 139 patients | CNN | EUS images in differentiation of PC from CP and NP | 0.92 |
AI, artificial intelligence; AIP, autoimmune pancreatitis; ANN, artificial neural network; CNN, convolutional neural network; EUS, endoscopic ultrasound; IPMN, intraductal papillary mucinous neoplasm; NP, normal pancreas; PC, pancreatic cancer; PDAC, pancreatic ductal adenocarcinoma; PNET, pancreatic neuroendocrine tumor; SVM, support vector machine..
Table 2 . Diagnostic Performance of AI in Diagnosis of Pancreatic Malignancies Using EUS.
Reference | Sn | Sp | PPV | NPV | Accuracy |
---|---|---|---|---|---|
Zhu et al. [8] | 0.96 | 0.93 | 0.92 | 0.97 | N/A |
Zhang et al. [9] | 0.94 | 0.99 | 0.99 | 0.98 | 0.98 |
Das et al. [10] | 0.93 | 0.92 | 0.87 | 0.96 | 0.93 |
Săftoiu et al. [11] | 0.88 | 0.83 | 0.96 | 0.57 | N/A |
Săftoiu et al. [12] | 0.91 | 0.88 | 0.89 | 0.91 | 0.90 |
Ozkan et al. [13] | 0.83 | 0.93 | N/A | N/A | 0.88 |
Norton et al. [14] | 1.00 | 0.50 | 0.75 | 1.00 | N/A |
Kuwahara et al. [15] | 0.96 | 0.93 | 0.92 | 0.96 | 0.98 |
Marya et al. [16] | 0.95 | 0.91 | 0.87 | 0.97 | 0.98 |
Gu et al. [17] | N/A | N/A | N/A | N/A | 0.94 |
Tonozuka et al. [18] | 0.94 | 0.84 | 0.87 | 0.91 | 0.92 |
AI, artificial intelligence; EUS, endoscopic ultrasound; Sn, sensitivity; Sp, specificity; PPV, positive predictive value; NPV, negative predictive value..