Tạo Pipeline từ Template

Hiện tại, cách duy nhất để tạo Data Pipeline là cài đặt Report Template có kèm pipeline dựng sẵn. Hướng dẫn này giúp bạn cài đặt template, kết nối nguồn dữ liệu, và chạy pipeline lần đầu tiên.

Trước khi bắt đầu

  • Bạn có quyền Report Author trong workspace.

  • Bạn đã xem qua các template trong Template Marketplace. Xem Sử dụng Template Marketplace.

  • Bạn có sẵn thông tin kết nối database (host, port, tên database, tên đăng nhập, mật khẩu).

Các bước thực hiện

1

Mở template và cấu hình pipeline

  1. Nhấn Template Marketplace trên thanh điều hướng bên trái.

  2. Xem qua các thẻ template và nhấn vào template bạn muốn cài đặt.

  3. Nhấn Create Report. Hộp thoại cài đặt mở ra.

  4. Điền các trường trong hộp thoại:

    Trường
    Mô tả

    Report Name

    Tên cho report sẽ được tạo. Được điền sẵn theo tên template.

    Your ERP/Accounting Software

    Loại hệ thống nguồn (ví dụ: Fast Accounting).

    Data for the Report

    Chọn Use Your Own Data để kết nối với database thực tế của bạn, hoặc Use Sample Data để khám phá trước với dữ liệu mẫu.

    How to provide data

    Phương thức kết nối (ví dụ: On-premise Database).

    Table Prefix

    Tiền tố thêm vào tên các bảng thô tạo ra trong Data Warehouse, giúp phân biệt với các bảng khác.

    Data Refresh (ETL) Schedule

    Tần suất chạy pipeline (ví dụ: Every 12 hours).

  5. Chọn Use Your Own Data, sau đó nhấn Setup Pipeline.

    Data Suite tạo pipeline và chuyển bạn đến trang cài đặt lần đầu.

2

Cài đặt data agent

  1. Trang cài đặt lần đầu có hai vùng:

    Vùng
    Mô tả

    Bảng dữ liệu thô (bên trái)

    Liệt kê các bảng thu thập thô của pipeline. Hiển thị tên bảng, số hàng, và thời điểm cập nhật gần nhất. Dữ liệu sẽ xuất hiện khi agent đang chạy. Nút Run Pipeline & Create Report sẽ kích hoạt khi bảng có dữ liệu.

    Hướng dẫn cài đặt (bên phải)

    Hướng dẫn từng bước để tải và chạy data agent (Logstash). Có nút Download Agent Config & Certs để tải file cấu hình đã được thiết lập sẵn cho pipeline này.

  2. Thực hiện theo Hướng dẫn cài đặt ở vùng bên phải:

    1. Nhấn Download Agent Config & Certs và giải nén file ds-data-agent-config.zip vừa tải về.

    2. Clone repository của agent (hoặc tải source code dạng zip từ đường dẫn được cung cấp).

    3. Sao chép thư mục ./ssl và file vendor-config.env vào thư mục đã clone.

    4. Đổi tên agent.env.example thành agent.env và điền thông tin kết nối database của bạn.

    5. Mở terminal tại thư mục đó và chạy:

      docker compose up -d
    6. Theo dõi danh sách bảng dữ liệu thô bên trái. Khi dữ liệu xuất hiện, agent đang thu thập dữ liệu từ database của bạn.

3

Chạy pipeline và tạo report

  1. Khi các bảng dữ liệu thô đã có dữ liệu, nút Run Pipeline & Create Report sẽ kích hoạt. Nhấn vào đó.

    Data Suite tự động thực hiện ba bước và hiển thị hộp thoại tiến trình:

    Bước
    Nội dung

    Bước 1 — Running Pipeline

    Chạy quy trình ETL: làm sạch và nạp dữ liệu thô vào Data Warehouse.

    Bước 2 — Create Data Model

    Xây dựng Data Model ngữ nghĩa từ dữ liệu đã nạp.

    Bước 3 — Create Report

    Tạo report được liên kết với Data Model mới.

  2. Khi cả ba bước hiển thị Done, nhấn View Report để mở report mới của bạn.

Bước tiếp theo


Phương án thay thế: Dùng dữ liệu mẫu trước

Nếu bạn muốn khám phá report trước khi kết nối database thực, chọn Use Sample Data thay vì Use Your Own Data ở Bước 1, rồi nhấn Setup Pipeline.

Data Suite tạo report ngay lập tức với dữ liệu mẫu đã chuẩn bị sẵn và một pipeline được liên kết. Khi bạn sẵn sàng chuyển sang dữ liệu thực:

1

Mở report và nhập dữ liệu của bạn

  1. Mở report. Một thông báo xuất hiện nhắc bạn nhập dữ liệu của mình.

  2. Nhấn Import Own Data để vào phần cài đặt Pipeline Ingestion và thực hiện tương tự như Bước 2 ở trên.

Last updated