TRANG THÔNG TIN LUẬN ÁN TIẾN SĨ

Tên đề tài luận án tiến sĩ: Nghiên cứu kỹ thuật xử lý ảnh dựa vào công nghệ quang tử tích hợp

Chuyên ngành: Kỹ thuật máy tính

Mã số: 9.48.01.06

Họ và tên NCS: Bùi Thị Thùy

Người hướng dẫn khoa học:

1. PGS.TS. Lê Trung Thành

2. PGS.TS. Đặng Thế Ngọc

Cơ sở đào tạo: Học viện Công nghệ Bưu chính Viễn thông

NHỮNG KẾT QUẢ MỚI CỦA LUẬN ÁN

Luận án đã nghiên cứu, thiết kế thành công bộ biến đổi DHT, DCT và KLT trong miền quang, ứng dụng cho xử lý ảnh tốc độ cao. Đồng thời Luận án đã đề xuất và thiết kế cấu trúc nơ-ron mới toàn quang có khả năng tính toán tích chập trong miền quang tốc độ cao. Từ đó ứng dụng cho tách biên ảnh sử dụng toán tử Roberts, Prewitt và Sobel trong miền quang. Luận án đã đề xuất và thiết kế thành công mạng nơ-ron quang tử và thử nghiệm cho phân loại dữ liệu ảnh. Các kết quả Luận án là nghiên cứu liên ngành hướng đến thiết kế các hệ thống tính toán, máy tính toàn quang trong tương lai không xa. Đóng góp mới của quá trình nghiên cứu thể hiện trong luận án như sau:

1. Thiết kế được các bộ biến đổi toàn quang DHT, DCT, KLT ứng dụng cho nén ảnh

Xử lý ảnh trong miền quang trước đây được thực hiện thông qua các hệ thống thấu kính, Fourier quang và sợi quang [38]. Từ năm 2013 lần đầu tiên xử lý ảnh trong miền quang được thực hiện trong cấu trúc quang tích hợp sử dụng ống dẫn sóng quang trên vật liệu polymer [5, 3], trong đó hệ thống xử lý ảnh được thiết kế dựa vào cấu trúc giao thoa đa mode kết hợp với bộ ghép có hướng. Nhược điểm của các phương pháp này là kích thước lớn, cần ghép nhiều bộ cấu trúc có hướng với nhau nên suy hao lớn. Đồng thời để đạt độ chính xác của bộ ghép cần giải pháp chế tạo chính xác. Băng thông hay tốc độ dữ liệu cũng bị hạn chế khi sử dụng cấu trúc ghép có hướng vì hệ số ghép thay đổi nhanh khi thay đổi bước sóng hoạt động, đặc 2 biệt hoạt động trong dải bước sóng của ảnh màu RGB.

Luận án đã thiết kế, phân tích kỹ thuật nén ảnh sử dụng các biến đổi DHT, DCT và KLT chỉ sử dụng cấu trúc giao thoa đa mode MMI. Ưu điểm giải pháp mới này là có khả năng tích hợp toàn bộ hệ thống trên một vi mạch đơn chiếc, có khả năng tích hợp với các hệ thống xử lý thông tin trong các node cảm biến, máy tính với hệ điều hảnh nhỏ gọn, tiêu thụ ít năng lượng và yêu cầu tài nguyên thấp. Bên cạnh đó, các cấu trúc do Luận án đề xuất có ưu điểm thực hiện chính xác các phép biến đổi mà với sai số chế tạo cho phép lớn đến ±18µm, băng thông và tốc độ dữ liệu xử lý cao. Cấu trúc mới có khả năng tích hợp với hệ thống camera thông minh, xử lý dữ liệu tốc độ cao, băng thông lớn, thời gian thực. Các cấu trúc đề xuất được thiết kế đơn giản, có độ chính xác cao so với công nghệ vi mạch hiện tại.

2. Thiết kế được nơ-ron quang mới, từ đó thiết kế mạng nơ-ron quang ứng dụng cho tách biên ảnh và phân loại ảnh trong miền quang. Cấu trúc mới có khả năng tích hợp, tốc độ cao gấp 5 lần so với hệ thống hiện tại.

Mặc dù mạng nơron quang đã được nghiên cứu từ những năm 1991 [[103], các nghiên cứu trước đây dựa vào quang hình học và các thiết bị sợi quang. Từ năm 2017 [21], thuật toán học sâu lần đầu tiên đã được thực hiện thành công trên cấu trúc vi mạch quang, tạo ra hướng nghiên cứu mới cho thiết kế các hệ thống mạng nơron cho các bài toán học sâu, hồi quy phức tạp [104]. Tuy nhiên, các giải pháp thiết kế mạng nơron quang sử dụng chủ yếu các cấu trúc vi cộng hưởng dựa vào bộ ghép có hướng. Điều này hạn chế xây dựng các mạng nơron có nhiều node mạng với khả năng xử lý các bài toán dữ liệu lớn, cần lưu trữ các giá trị trọng số trung gian trong quá trình học. Bên cạnh đó, rất khó để điều khiển hàng chục nút mạng một lúc với độ chính xác cao nếu sử dụng cấu trúc vi cộng hưởng đó.

Do vậy, Luận án đã đề xuất kiến trúc và thuật toán mới hiết kế mạng nơron sử dụng cấu trúc giao thoa đa mode kết hợp với ống dẫn sóng vòng tạo ra vi cộng hưởng nhỏ gọn, băng thông lớn, tốc độ cao, có thể điều khiển chính xác hệ số bộ lọc kernel tương ứng. Luận án đã thiết kế, mô phỏng, đánh giá các thuật toán tách biên ảnh và nhận dạng chữ viết tay trên cấu trúc mới này. Mặc dù độ chính xác của nhận dạng chưa đạt được như thực hiện qua hệ thống máy tính hiện nay do hạn chế về số bit mã hóa trong miền quang so với 32 và 64 bit, nhưng tốc độ xử lý dữ liệu trong miền quang cao gấp hàng chục lần so với miền điện.

CÁC ỨNG DỤNG, KHẢ NĂNG ỨNG DỤNG TRONG THỰC TIỄN HOẶC NHỮNG VẤN ĐỀ CÒN BỎ NGỎ CẦN TIẾP TỤC NGHIÊN CỨU

Trên cơ sở kết quả của Luận án, có một số vấn đề và hướng nghiên cứu mới như:

• Thiết kế hệ thống tích hợp bộ biến đổi ảnh trong miền quang với các bộ nhớ quang trong các hệ thống camera thông minh và xử lý dữ liệu ảnh thời gian thực. Đồng thời thiết kế các hệ thống toàn quang xử lý dữ liệu AR/VR.

• Phát triển mô hình mạng OONN cho các ứng dụng AI thời gian thực, đặc biệt thiết kế các hàm kích hoạt hoàn toàn trong miền quang.

• Cải tiến cấu trúc ống dẫn sóng cấu trúc graphene để tăng tốc độ xử lý dữ liệu và tốc độ học, từ đó thực hiện các bài toán phân tích dữ liệu lớn.

Quyết định
Tóm tắt luận án tiến sĩ
Luận án tiến sĩ
Trang thông tin luận án tiến sĩ Tiếng Việt
Trang thông tin luận án tiến sĩ Tiếng Anh