[Audio] 1.6 Data Mining And Applications Nhóm 12 Nguyễn Xuân Khánh Đào Tuấn Anh Phạm Thành Duy Phạm Trần Hiếu.
[Audio] I. KHÁI NIỆM. I. KHÁI NIỆM.
[Audio] DATA MINING Data mining là quá trình khám phá và phân tích khối lượng lớn dữ liệu để tìm ra các mẫu và quy tắc có ý nghĩa. Data mining là một lĩnh vực nghiên cứu khoa học dữ liệu, khai thác và sử dụng các dữ kiện, thông tin có giá trị từ dữ liệu để phục vụ đưa ra các dự báo, quyết định trong tương lai. Ứng dụng trải rộng từ kinh doanh, tìm kiếm web, mạng xã hội cho đến sinh học và y tế..
[Audio] II. ỨNG DỤNG. II. ỨNG DỤNG.
[Audio] 1. Business Intelligence (BI) Phân tích thị trường và khách hàng: phân nhóm, gợi ý sản phẩm, phân khúc thị trường Quản lý khách hàng: dự đoán rời bỏ, giá trị khách hàng Chuỗi cung ứng và tồn kho: dự báo nhu cầu, phát hiện bất thường, tối ưu vận chuyển Phân tích đối thủ Hiệu suất và dự báo kinh doanh: phát hiện gian lận, dự đoán doanh thu, theo dõi KPI.
[Audio] 2. Web Search Engines Xếp hạng kết quả tìm kiếm: phân tích độ liên quan (ranking algorithms). Phân loại truy vấn (Query Classification): hiểu mục đích tìm kiếm (ví dụ: “apple” → trái cây hay thương hiệu). Cá nhân hóa kết quả: dựa trên lịch sử tìm kiếm & hồ sơ người dùng. Gợi ý truy vấn (Query Recommendation): đề xuất tìm kiếm liên quan theo ngữ cảnh Khai thác dữ liệu log: phân tích clickstream để cải thiện chất lượng kết quả. Phân tích xu hướng (Trend Analysis): nhận diện hot topics từ các truy vấn phổ biến..
[Audio] 3. Social Media và Social Networks Social Media Social Networks Phát hiện sự kiện (Event Detection): nhận diện xu hướng, sự kiện nóng. Giám sát sức khỏe cộng đồng: theo dõi dịch bệnh, hành vi cộng đồng. Phân tích cảm xúc (Sentiment Analysis): đo lường thái độ người dùng về sản phẩm/dịch vụ. Hệ thống gợi ý (Recommendation): nội dung, bạn bè, sản phẩm. Phát hiện spammer / fake news: đảm bảo độ tin cậy thông tin. Phân tích cấu trúc mạng: tìm cộng đồng ẩn, nhóm ảnh hưởng. Tính toán chỉ số mạng: centrality, similarity, reciprocity... Phân tích lan truyền thông tin: cách tin tức, memes lan tỏa. Đo lường ảnh hưởng (Influence Modeling): xác định “người dẫn dắt” trong mạng xã hội. Location-based analysis: phân tích hành vi và kết nối theo vị trí địa lý..
[Audio] 4.Sinh học, y khoa và chăm sóc sức khỏe Genomics & Proteomics: khai thác dữ liệu gene, protein để tìm mối liên hệ bệnh – di truyền. Mạng sinh học (Biological Networks): phân tích protein-protein interactions, regulatory networks. Phân tích hình ảnh y khoa: classification, chẩn đoán & dự đoán từ ảnh CT, MRI, X-ray. Text Mining y sinh: khai thác dữ liệu từ biomedical literature & biotext. Electronic Health Records (EHRs): khai thác hồ sơ bệnh án để dự báo bệnh, hỗ trợ quyết định lâm sàng. Dự đoán & phát hiện bệnh: phát hiện sớm bệnh hiểm nghèo, cá nhân hóa điều trị..
[Audio] XIN CẢM ƠN MỌI NGƯỜI VÌ ĐÃ LẮNG NGHE. XIN CẢM ƠN MỌI NGƯỜI VÌ ĐÃ LẮNG NGHE.