1. Home
  2. Docs
  3. Sử dụng Tools
  4. Quản lý Product Crawlers

Quản lý Product Crawlers

Trên MerchBridge chúng tôi hỗ trợ crawl sản phẩm vào hệ thống dưới dạng upload file csv chứa data theo cấu trúc Only URLs hoặc Definded Structure.

1. Tạo Product Crawler thông qua file csv struct

Với option này, bạn cần chuẩn bị file .csv chứa các thông tin cơ bản của product: Title, Images, Product Base, Template, Collections, Tags

Xem file mẫu tại: Defined-structure.csv.

Bước 1: Bạn cần định hình trước rằng sẽ cần tạo product cho Product Base/Template nào trước, sau đó lấy các Product base slug hoặc Template slug tương ứng.

Để lấy được product base slug bạn có thể vào menu Add product/Add campaign, sau đó chọn vào product base xem.

Để lấy được Template slug, bạn xem tại mục All Templats bằng cách truy cập vào menu Products -> Templates.

Bước 2: Dựa theo cấu trúc của file mẫu(Defined-structure.csv) để điền các thông tin tương ứng: Title, Images, Product base…

Bước 3: Truy cập menu Tools -> Product Crawlers, sau đó ấn New Product Crawler.

Mục Title: nhập tiêu đề cho lệnh crawl, mục Type: chọn option Product base struct, mục Crawler file: Upload file mà bạn đã chuẩn bị tại bước 2, sau đó ấn Process now để hệ thống xử lý.

2. Tạo Product Crawler thông qua file csv Only Urls

Với option này, bạn sẽ cần thực hiện 2 thao tác chính:

  • Chuẩn bị file csv chỉ chứa các urls cần crawl.
  • Sau khi các product url được crawl về hệ thống, bạn cần Assign những item này vào các Product base/Template phù hợp.

Bước 1: Tạo file csv theo cấu trúc sau: Only-URLs.csv.

Lưu ý: Chỉ nhập vào các Product url của cùng một domain(hệ thống không hỗ trợ các dạng Collection url, tag url…)

Bước 2: Truy cập menu Tools -> Product Crawlers, sau đó ấn New Product Crawler.

Bước 3: Nhập Title cho lệnh crawl, chọn Type: Only urls, mục Crawler file: Chọn file csv bạn đã chuẩn bị tại bước 1.

Ngay khi bạn upload file csv, hệ thống sẽ cho phép cấu hình Xpath cho các product crawl item tại mục Title XPath/Image XPath.

Để cấu hình mục Title Xpath/Image XPath, hãy ấn vào icon Config.

Lúc này hệ thống sẽ hiển thị một màn hình Preview, bạn cần di chuyển chuột, lúc này các thẻ HTML chứa dữ liệu sẽ được highlight, tiếp tục di chuyển tới thẻ HTML mà bạn cần lấy dữ liệu và click chuột trái để hệ thống nhận diện vị trí của thẻ đó.

Sau khi đã chọn được XPath tới các thẻ HTML, bạn hãy click vào icon Preview để kiểm tra chắc chắn rằng hệ thống có thể lấy dữ liệu từ thẻ HTML đó.

Trong trường hợp hệ thống không thể lấy được dữ liệu từ Xpath bạn đã chọn thì lúc này bạn cần tiếp tục config lại Xpath cho tới khi hệ thống có thể lấy được dữ liệu.

Ngoài ra, nếu bạn muốn tìm và thay thế giá trị trong các thẻ HTML, bạn có thể click vào icon Find sau đó điền vào các mục Find & Replace, hệ thống sẽ xử lý lựa chọn này trong quá trình crawl.

Sau đó hãy ấn Process now để hệ thống xử lý.

3. Các actions khác

Start: Trong trường hợp một lệnh crawl đang bị dừng, bạn có thể cho chạy tiếp lệnh đó bằng cách ấn vào Start.

Stop: Dùng để dừng một lệnh crawl.

Delete: Xóa bỏ lệnh crawl.

Xem thêm:

Was this article helpful to you? Yes No

How can we help?