1. Bussiness | Logic
Marketing Tool
  • Module mặc định
    • TỔNG QUAN
    • Bussiness | Logic
      • XÁC THỰC & HỒ SƠ NGƯỜI DÙNG
      • THỐNG KÊ & NHẬT KÝ
      • CÔNG CỤ TÌM KIẾM
      • TRÍCH XUẤT URL
      • KIỂM TOÁN CHUYỂN HƯỚNG
      • THEO DÕI WEBSITE
      • KIỂM TRA TRANG WEB
      • TÌM KIẾM VĂN BẢN NEO
      • WHITELIST
    • Project
      • Hướng dẫn sử dụng
        • User Guide
        • CÔNG CỤ TÌM KIẾM
        • TÌM KIẾM VĂN BẢN NEO
        • TRÍCH XUẤT URL
        • SO SÁNH NỘI DUNG
        • CHUYỂN HƯỚNG URL
        • KIỂM TRA TRANG WEB
        • KIỂM TRA NỘI DUNG
        • KIỂM TRA ĐỊNH KÌ
        • THEO DÕI WEBSITE
        • TẠO TRANG WEB MKT
      • API Interface
        • API Interface
      • Architecture
        • Code Structure
        • System Architecture
        • Database Schema
      • Deployment
        • Staging
        • Production
  1. Bussiness | Logic

CÔNG CỤ TÌM KIẾM

MODULE: CÔNG CỤ TÌM KIẾM (SEARCH ENGINE)#

1. Tổng quan Nghiệp vụ#

Module Công cụ tìm kiếm đảm nhiệm việc thu thập, phân tích và theo dõi thứ hạng từ khóa trên các bộ máy tìm kiếm (Google, Bing). Hệ thống tự động quét và gán nhãn trạng thái cho các tên miền (Domain Sạch / Domain Bị chặn / Domain Đối thủ).

2. Luồng xử lý (Business Logic Flow)#

Hệ thống xử lý khối lượng dữ liệu lớn nên áp dụng mô hình Bất đồng bộ (Async Crawler) để tránh lỗi Timeout:
1.
Tiếp nhận (Store): Người dùng nạp hàng ngàn từ khóa và tên miền mục tiêu. Hệ thống lưu vào bảng search_engines với trạng thái Pending.
2.
Thu thập (Crawl): Daemon Cronjob (/cron-search-engine) đánh thức hệ thống cào dữ liệu. Dựa vào cấu hình XPath trong search_engine_settings, hệ thống bóc tách kết quả trang SERP.
3.
Trả kết quả (Update & Fetch): Webhook bắn dữ liệu thứ hạng về lưu vào bảng search_engine_histories. Giao diện Frontend gọi Polling để vẽ Data Grid hoặc người dùng chọn xuất file Excel.

3. Danh sách API Liên kết#

MethodEndpointChức năng
POST/api/search-engine/storeTạo yêu cầu quét từ khóa mới.
GET/api/search-engine/get-resultLấy dữ liệu và phân trang kết quả tìm kiếm đã quét.
POST/api/search-engine/download-fileXuất và tải file Excel báo cáo thứ hạng.
GET/api/search-engine/cancelHủy các phiên check hạng từ khóa đang xử lý.
POST/webhook/update-search-resultWebhook nhận kết quả từ Serverless Crawler.
Ngày cập nhật 2026-03-25 10:09:45
Trước
THỐNG KÊ & NHẬT KÝ
Tiếp theo
TRÍCH XUẤT URL
Built with