Tên đề tài luận án tiến sĩ: NGHIÊN CỨU, PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU TRÊN DỮ LIỆU CÓ CẤU TRÚC
Chuyên ngành: Hệ thống thông tin Mã số: 09.48.01.04
Họ và tên nghiên cứu sinh: Hoàng Minh Quang
Người hướng dẫn khoa học:
1. GS. TS. Vũ Đức Thi
- TSKH. Nguyễn Ngọc San
Đơn vị đào tạo: Học viện Công nghệ Bưu chính Viễn thông
Cơ sở đào tạo: Học viện Công nghệ Bưu chính Viễn thông NHỮNG KẾT QUẢ MỚI CỦA LUẬN ÁN
- Phát hiện thuật toán tìm một rút gọn thuộc tính trong thời gian đa thức không sử dụng heuristic.
- Phát hiện thuật toán tìm một rút gọn đối tượng trong thời gian đa thức mà vẫn bảo toàn quá trình tìm tất cả các rút gọn thuộc tính.
- Cải tiến phương pháp sinh cây quyết định thực hiện nhanh hơn quá trình sinh cây quyết định của thuật toán
- Phát hiện thuật toán PSICFSM giải quyết đẳng cấu đồ thị con trong thời gian đa thức trong khai phá đồ thị con thường xuyên đóng.
- Xây dựng độ đo trên dàn giao khái niệm khác với độ đo dựa trên vector áp dụng cho phân loại đa nhãn đồ thị theo lý thuyết Dempster-Shafer.
CÁC ỨNG DỤNG, KHẢ NĂNG ỨNG DỤNG TRONG THỰC TIỄN HOẶC NHỮNG VẤN ĐỀ CÒN BỎ NGỎ CẦN TIẾP TỤC NGHIÊN CỨU
- Thuật toán tìm rút gọn đối tượng, tìm một rút gọn thuộc tính, sinh cây quyết định được ứng dụng để giảm kích thước dữ liệu, tăng tính hiệu quả khai phá dữ liệu trên bảng quyết định nhất quán.
- Khai phá đồ thị con thường xuyên đóng được ứng dụng trong việc trợ giúp hữu ích trong lĩnh vực y tế như khám phá các thành phần thuốc đặc trị, hoặc hỗ trợ khám phá quy luật biến đổi của tế bào có khả năng gây bệnh chẳng hạn như ung thư.
- Phân loại đa nhãn đồ thị được ứng dụng hỗ trợ cho dữ liệu sinh trắc học phân loại các mẫu gen đồng thời gây nhiều bệnh, phân loại thuốc mới có thể chữa được nhiều bệnh đồng thời.
Xác nhận của tập thể người hướng dẫn khoa học
TS. VŨ ĐỨC THI VÀ G S. TSKH. NGUYỄN NGỌC SAN
Nghiên cứu sinh
HOÀNG MINH QUANG
Subject: RESEARCH AND DEVELOP SOME METHODS OF DATA MINING ON STRUCTURED DATA
Specialty: Information System Code: 09.48.01.04
Ph.D. student: Hoang Minh Quang
Supervisor 1: Vu Duc Thi, Professor, Ph.D
Supervisor 2: Nguyen Ngoc San, Professor, Ph.D of Science Academic institute: Posts and Telecommunications Institute of Technology THESIS CONTRIBUTIONS
- Find an attribute reduction in polynomial time without using heuristic like other methods to find an attribute
- Finding an object reduction in polynomial time while preserving the process of finding all attribute
- Improve decision tree generation method to perform faster than decision tree generation of ID3 algorithm.
- Prove the problem of subgraph isomorphism solved in polynomial time in closed frequent subgraph mining while other algorithms have not solved the problem of subgraph isomorphism in polynomial
- Building measurement on lattice concept to apply to multi-label graph classification using Dempster-Shafer theory. While other multi-label classification methods according to Dempster-Shafer theory must build measurements based on vector representations, but graphs cannot be represented in vector
APPLICATIONS, POSSIBILITIES OF APPLICATION IN PRACTICE OR THE RESEARCH QUESTIONS TO CONTINUE
- The object reduction algorithm applies to reducing data size while preserving the search for all attribute reduction. The attribute reduction algorithm helps speed up data mining processes on the consistent decision
- Closed frequent subgraph mining is used to help in medical field, such as discovering drug components, or helping to discover transform rules of potentially pathogenic cells such as
- The multi-label graph classification is applied to biometrics data to classify gene samples that can simultaneously be involved in metabolism or cause many diseases at the same
Supervisor
Prof. PhD. VU DUC THI Prof. Sci PhD. NGUYEN NGOC SAN
Ph.D student
HOANG MINH QUANG
Trang Thông tin Luận án tiếng việt