MODULE: CÔNG CỤ TÌM KIẾM (SEARCH ENGINE)#
1. Tổng quan Nghiệp vụ#
Module Công cụ tìm kiếm đảm nhiệm việc thu thập, phân tích và theo dõi thứ hạng từ khóa trên các bộ máy tìm kiếm (Google, Bing). Hệ thống tự động quét và gán nhãn trạng thái cho các tên miền (Domain Sạch / Domain Bị chặn / Domain Đối thủ).2. Luồng xử lý (Business Logic Flow)#
Hệ thống xử lý khối lượng dữ liệu lớn nên áp dụng mô hình Bất đồng bộ (Async Crawler) để tránh lỗi Timeout:1.
Tiếp nhận (Store): Người dùng nạp hàng ngàn từ khóa và tên miền mục tiêu. Hệ thống lưu vào bảng search_engines với trạng thái Pending.
2.
Thu thập (Crawl): Daemon Cronjob (/cron-search-engine) đánh thức hệ thống cào dữ liệu. Dựa vào cấu hình XPath trong search_engine_settings, hệ thống bóc tách kết quả trang SERP.
3.
Trả kết quả (Update & Fetch): Webhook bắn dữ liệu thứ hạng về lưu vào bảng search_engine_histories. Giao diện Frontend gọi Polling để vẽ Data Grid hoặc người dùng chọn xuất file Excel.
3. Danh sách API Liên kết#
| Method | Endpoint | Chức năng |
|---|
POST | /api/search-engine/store | Tạo yêu cầu quét từ khóa mới. |
GET | /api/search-engine/get-result | Lấy dữ liệu và phân trang kết quả tìm kiếm đã quét. |
POST | /api/search-engine/download-file | Xuất và tải file Excel báo cáo thứ hạng. |
GET | /api/search-engine/cancel | Hủy các phiên check hạng từ khóa đang xử lý. |
POST | /webhook/update-search-result | Webhook nhận kết quả từ Serverless Crawler. |
Ngày cập nhật 2026-03-25 10:09:45