Data Pipeline

Data Pipeline tự động hóa việc đồng bộ dữ liệu định kỳ, giúp báo cáo của bạn luôn phản ánh dữ liệu mới nhất mà không cần can thiệp thủ công.

Cách pipeline hoạt động

Pipeline chạy theo lịch định sẵn (ví dụ: mỗi ngày lúc 6:00 sáng). Mỗi lần chạy sẽ đồng bộ một hoặc nhiều dataset từ nguồn, cập nhật Data Warehouse, và đưa dữ liệu mới vào Data Model và các report.

Kích hoạt theo lịch → Đồng bộ dataset → Cập nhật Data Warehouse → Report hiển thị dữ liệu mới

Trang Data Pipeline

Vào Data Pipeline trên thanh điều hướng bên trái để xem tất cả pipeline trong workspace. Danh sách hiển thị:

Cột
Mô tả

Pipeline Name

Tên của pipeline

Status

Trạng thái hiện tại: Active, Setup Pending, hoặc Inactive

Schedule

Tần suất chạy pipeline

Latest Run

Thời điểm lần chạy gần nhất

Next Run

Thời điểm lần chạy tiếp theo

Created By

Người tạo pipeline

Actions

Các thao tác quản lý pipeline

Chi tiết pipeline

Nhấn vào tên pipeline để mở trang chi tiết. Trang chi tiết có hai tab:

Tab
Mô tả

Pipeline overview

Hiển thị data model mục tiêu, các report liên quan, và phần Pipeline Run History — thời gian bắt đầu, kết thúc, loại chạy, trạng thái, thời lượng. Có nút Run Pipeline để chạy thủ công.

Pipeline Ingestion

Hiển thị các bảng dữ liệu thô đang được thu thập từ nguồn. Dùng tab này để kiểm tra bảng nguồn nào đang cung cấp dữ liệu cho pipeline.

Tài nguyên liên quan

Last updated