Phát triển mô hình trí tuệ nhân tạo có khả năng tự động phân tích và khoanh vùng tổn thương trong ảnh nội soi y tế, Lã Kiều Ngọc Thăng – sinh viên năm thứ tư ngành Truyền thông số và Kỹ thuật đa phương tiện – đã giành giải Nhất cuộc thi sinh viên nghiên cứu khoa học của Đại học Bách khoa Hà Nội.
Sản phẩm do Thăng phát triển mang tên LViTES (Leveraging Vision and Text for Endoscopic Segmentation) – một công cụ ứng dụng thị giác máy tính kết hợp xử lý ngôn ngữ tự nhiên, có khả năng nhận diện và phân đoạn các tổn thương nghi ngờ như polyp, viêm loét, hay dấu hiệu tiền ung thư trong ảnh nội soi.
Đặc biệt, mô hình có thể tích hợp thông tin từ bệnh án hoặc ghi chú của bác sĩ để nâng cao độ chính xác trong chẩn đoán.
LViTES đã được thử nghiệm thành công trên bộ dữ liệu Kvasir-SEG – tập dữ liệu khoa học mở chuyên về hình ảnh tổn thương hệ tiêu hóa. Qua đó, mô hình cho thấy hiệu suất vượt trội, đặc biệt ở khả năng phân vùng tổn thương.
Thăng bắt đầu quan tâm đến lĩnh vực thị giác máy tính từ khi học môn Xử lý ảnh số. Dưới sự hướng dẫn của PGS.TS Trần Thị Thanh Hải (giảng viên Viện Điện - Điện tử), Thăng thực hiện đề tài phân tích ảnh nội soi y tế bằng AI.
![]() |
Lã Kiều Ngọc Thăng - chàng sinh viên ĐH Bách Khoa Hà Nội đã biến AI thành trợ lý cho bác sĩ nội soi. Ảnh: Tổng hợp |
Thăng chia sẻ trên Báo VnExpress, bác sĩ thường phải mất nhiều giờ phân tích hình ảnh nội soi mà lại thiếu công cụ hỗ trợ nhanh và chính xác. Đó là động lực để em bắt đầu phát triển LViTES.
>> Ngành học trước bị gắn mác ‘tiền ít’, nay tốt nghiệp đi làm 40 triệu/tháng: Có tới hơn 70 trường đào tạo, điểm chuẩn chỉ từ 15 điểm
Đề tài được thực hiện trong khoảng nửa năm, gồm ba giai đoạn: thu thập – xử lý dữ liệu từ bộ Kvasir-SEG và ảnh nội soi thực quản, dạ dày; xây dựng mô hình dựa trên mạng nơ-ron tích chập EfficientNet kết hợp kiến trúc Transformer; cuối cùng là thử nghiệm mô hình với dữ liệu thực tế.
Kết quả cho thấy LViTES vượt trội hơn so với các phương pháp truyền thống, với độ chính xác cao theo các chỉ số IoU và Dice coefficient.
Toàn bộ quá trình nghiên cứu được Thăng thực hiện độc lập, từ việc tìm hiểu tài liệu, xây dựng mô hình, đến đánh giá hiệu quả. Một trong những khó khăn lớn là thiếu dữ liệu văn bản mô tả đi kèm ảnh – yếu tố quan trọng trong huấn luyện mô hình thị giác-ngôn ngữ. Để khắc phục, Thăng xây dựng module sinh mô tả tự động, chuyển các nhãn ảnh thành văn bản chi tiết.
PGS.TS Trần Thị Thanh Hải đánh giá, Ngọc Thăng là sinh viên có tư duy khoa học tốt, kỹ năng kỹ thuật vững vàng và đặc biệt kiên trì với hướng nghiên cứu còn khá mới mẻ. Em ấy đã thể hiện nỗ lực sáng tạo đáng ghi nhận trong lĩnh vực kết hợp AI với y học.
Chia sẻ về định hướng tương lai, Thăng cho biết đang phát triển phiên bản nâng cấp của LViTES, hướng tới việc tích hợp vào các hệ thống y tế để hỗ trợ bác sĩ nội soi phát hiện sớm tổn thương.
Ngoài ra, nam sinh cũng có kế hoạch mở rộng mô hình sang các kỹ thuật chẩn đoán hình ảnh khác như X-quang và CT scan.
>> Nam sinh Yên Bái từ chối ngành Y, bị gia đình phản đối dữ dội: Nay tốt nghiệp Sư phạm với GPA gần tuyệt đối, hiện đứng trước 4 lựa chọn