Theo một bài báo khoa học được công bố trên Tạp chí của Hiệp hội Da liễu Hoa Kỳ (JAAD), một phương pháp tiếp cận sử dụng machine learning (máy học) có thể dự đoán chính xác nguy cơ ngưng điều trị thuốc sinh học trên bệnh nhân vảy nến trong vòng 5 năm điều trị.
Các nhà nghiên cứu đã so sánh độ chính xác của machine learning với mô hình sử dụng thống kê y học truyền thống để dự đoán khả năng ngưng điều trị thuốc sinh học trong vòng 5 năm ở bệnh nhân vảy nến. Dữ kiện được thu thập từ 3388 bệnh nhân tại Đan Mạch.
Các thuốc sinh học được phân tích gồm adalimumab, etanercept, guselkumab, infliximab, ixekizumab, secukinumab, và ustekinumab. Các biến số gồm tuổi, giới tính, BMI, tuổi tại thời điểm chẩn đoán, tuổi tại thời điểm điều trị thuốc sinh học lần đầu tiên, các lần điều trị thuốc sinh học trước đó, mắc viêm khớp vảy nến kèm theo, đang sử dụng methotrexate đồng thời, bệnh đồng mắc, điểm PASI nền, điểm DLQI nền.
Tỷ số rủi ro (hazard ratio) được tính toán cho các yếu tố tiên đoán (predictive factors) bằng phân tích hồi quy Cox, việc ngưng điều trị thuốc sinh học là biến phụ thuộc (outcome) và adalimumab là giá trị tham chiếu.
Các mô hình của machine learning bao gồm: Mô hình tuyến tính tổng quát (Generalized Linear Model), mô hình phân lớp Naive Bayes, mô hình học sâu (Deep Learning), mô hình cây quyết định (Decision Tree), mô hình rừng cây (Random Forest), và mô hình Gradient Boosted Trees. Hiệu suất của từng mô hình được đánh giá bằng đường cong AUROC.
Ustekinumab và ixekizumab có nguy cơ ngừng điều trị thấp nhất, sau đó là adalimumab, và etanercept có nguy cơ ngừng điều trị cao nhất. Việc tiếp xúc với thuốc sinh học trước đó và giới tính cũng là những biến số quan trọng.
Những người đàn ông không có tiếp xúc với thuốc sinh học trước đó có thời gian sử dụng thuốc lâu nhất trước khi ngưng thuốc (longest drug survival). Cân nặng và điểm PASI nền là những yếu tố dự đoán có ý nghĩa thống kê, mặc dù hiệu quả không đáng kể so với các yếu tố dự đoán khác.
Sử dụng adalimumab làm tham chiếu, tỉ số nguy cơ (HR) cho từng biến số để dự đoán nguy cơ ngưng điều trị thuốc sinh học trong phân tích hồi quy Cox như sau:
• Etanercept (HR, 1.59; 95% CI, 1.34-1.88, P <.001);
• Guselkumab (HR, 0.45; 95% CI, 0.20-1.01; P =.05);
• Infliximab (HR, 1.32; 95% CI, 1.07-1.64; P =.01);
• Ixekizumab (HR, 0.63; 95% CI, 0.39-0.97; P =.04);
• Secukinumab (HR, 0.91; 95% CI, 0.74-1.12; P =.37);
• Ustekinumab (HR, 0.61; 95% CI, 0.52-0.72; P <.001);
• Chưa tiếp xúc với thuốc sinh học (HR, 0.72; 95% CI, 0.64-0.82; P <.001);
• Giới tính (HR, 0.77; 95% CI, 0.68-0.87; P <.001); và
• Cân nặng (HR, 1.00; 95% CI, 1.00-1.00; P =.02).
Giá trị đường cong AUROC là 0.61, cho thấy giá trị phân biệt (discriminatory value) thấp.
Tất cả các thuật toán machine learning đều dự đoán khả năng ngưng điều trị thuốc sinh học trong vòng 5 năm với độ chính xác cao, từ 65.3% đối với mô hình phân lớp Naive Bayes, tới 77.5% đối với mô hình Gradient Boosted Trees. Thuật toán machine learning hiệu quả nhất có thể dự đoán kết quả điều trị với sai số phân loại dưới 23%, trong khi chỉ sử dụng các thông tin cơ bản của bệnh nhân trên lâm sàng.
Các chỉ số dự đoán quan trọng nhất là loại thuốc sinh học sử dụng, giới tính bệnh nhân, và cân nặng. Đường cong AUROC cho mô hình Gradient Boosted Trees có giá trị 0.85, cho thấy hiệu suất vượt trội.
Các nhà nghiên cứu kết luận: “Cuối cùng, một phương pháp tiếp cận dựa trên machine learning, hơn cả mô hình thống kê truyền thống, đã dự đoán chính xác nguy cơ ngừng điều trị thuốc sinh học trong vòng 5 năm dựa trên các biến số bệnh nhân đơn giản mà bác sĩ da liễu có thể sử dụng trong thực hành lâm sàng.”