> For the complete documentation index, see [llms.txt](https://docs.datasuite.vn/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.datasuite.vn/cac-tinh-nang/data-pipeline/tao-pipeline-tu-template.md).

# Tạo Pipeline từ Template

Hiện tại, cách duy nhất để tạo Data Pipeline là cài đặt Report Template có kèm pipeline dựng sẵn. Hướng dẫn này giúp bạn cài đặt template, kết nối nguồn dữ liệu, và chạy pipeline lần đầu tiên.

## Trước khi bắt đầu

* Bạn có quyền Report Author trong workspace.
* Bạn đã xem qua các template trong Template Marketplace. Xem [Sử dụng Template Marketplace](/cac-tinh-nang/marketplace.md).
* Bạn có sẵn thông tin kết nối database (host, port, tên database, tên đăng nhập, mật khẩu).

## Các bước thực hiện

{% stepper %}
{% step %}

### Mở template và cấu hình pipeline

1. Nhấn **Template Marketplace** trên thanh điều hướng bên trái.
2. Xem qua các thẻ template và nhấn vào template bạn muốn cài đặt.\
   \ <img src="/files/VJ2wjJfzVqO0zRBPD38N" alt="" data-size="original">
3. Nhấn **Create Report**. Hộp thoại cài đặt mở ra.\
   ![](/files/ApeoMqxZZWHN6GIDpIgv)
4. Điền các trường trong hộp thoại:

   | Trường                           | Mô tả                                                                                                                           |
   | -------------------------------- | ------------------------------------------------------------------------------------------------------------------------------- |
   | **Report Name**                  | Tên cho report sẽ được tạo. Được điền sẵn theo tên template.                                                                    |
   | **Your ERP/Accounting Software** | Loại hệ thống nguồn (ví dụ: Fast Accounting).                                                                                   |
   | **Data for the Report**          | Chọn **Use Your Own Data** để kết nối với database thực tế của bạn, hoặc **Use Sample Data** để khám phá trước với dữ liệu mẫu. |
   | **How to provide data**          | Phương thức kết nối (ví dụ: On-premise Database).                                                                               |
   | **Table Prefix**                 | Tiền tố thêm vào tên các bảng thô tạo ra trong Data Warehouse, giúp phân biệt với các bảng khác.                                |
   | **Data Refresh (ETL) Schedule**  | Tần suất chạy pipeline (ví dụ: Every 12 hours).                                                                                 |
5. Chọn **Use Your Own Data**, sau đó nhấn **Setup Pipeline**.

   Data Suite tạo pipeline và chuyển bạn đến trang cài đặt lần đầu.\
   ![](/files/odqNnP0SFt7d7il2g3H0)
   {% endstep %}

{% step %}

### Cài đặt data agent

1. Trang cài đặt lần đầu có hai vùng:

   | Vùng                             | Mô tả                                                                                                                                                                                                                    |
   | -------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ |
   | **Bảng dữ liệu thô (bên trái)**  | Liệt kê các bảng thu thập thô của pipeline. Hiển thị tên bảng, số hàng, và thời điểm cập nhật gần nhất. Dữ liệu sẽ xuất hiện khi agent đang chạy. Nút **Run Pipeline & Create Report** sẽ kích hoạt khi bảng có dữ liệu. |
   | **Hướng dẫn cài đặt (bên phải)** | Hướng dẫn từng bước để tải và chạy data agent (Logstash). Có nút **Download Agent Config & Certs** để tải file cấu hình đã được thiết lập sẵn cho pipeline này.                                                          |
2. Thực hiện theo **Hướng dẫn cài đặt** ở vùng bên phải:
   1. Nhấn **Download Agent Config & Certs** và giải nén file `ds-data-agent-config.zip` vừa tải về.
   2. Clone repository của agent (hoặc tải source code dạng zip từ đường dẫn được cung cấp).
   3. Sao chép thư mục `./ssl` và file `vendor-config.env` vào thư mục đã clone.
   4. Đổi tên `agent.env.example` thành `agent.env` và điền thông tin kết nối database của bạn.
   5. Mở terminal tại thư mục đó và chạy:

      ```bash
      docker compose up -d
      ```
   6. Theo dõi danh sách bảng dữ liệu thô bên trái. Khi dữ liệu xuất hiện, agent đang thu thập dữ liệu từ database của bạn.\
      ![](/files/xWXyXZKhKja5F8cY5wf7)
      {% endstep %}

{% step %}

### Chạy pipeline và tạo report

1. Khi các bảng dữ liệu thô đã có dữ liệu, nút **Run Pipeline & Create Report** sẽ kích hoạt. Nhấn vào đó.

   Data Suite tự động thực hiện ba bước và hiển thị hộp thoại tiến trình:

   | Bước                           | Nội dung                                                            |
   | ------------------------------ | ------------------------------------------------------------------- |
   | **Bước 1 — Running Pipeline**  | Chạy quy trình ETL: làm sạch và nạp dữ liệu thô vào Data Warehouse. |
   | **Bước 2 — Create Data Model** | Xây dựng Data Model ngữ nghĩa từ dữ liệu đã nạp.                    |
   | **Bước 3 — Create Report**     | Tạo report được liên kết với Data Model mới.                        |

   ![](/files/QVuUmVjR4OAWX3jY5XWa)
2. Khi cả ba bước hiển thị **Done**, nhấn **View Report** để mở report mới của bạn.\ <img src="/files/G7DrEo8yCjObzsoxVZyz" alt="" data-size="original">
   {% endstep %}
   {% endstepper %}

## Bước tiếp theo

* [Theo dõi lịch sử chạy pipeline](/cac-tinh-nang/data-pipeline/theo-doi-lich-chay-pipeline.md)
* [Xử lý sự cố Data Pipeline](/cac-tinh-nang/data-pipeline/troubleshooting.md)

***

## Phương án thay thế: Dùng dữ liệu mẫu trước

Nếu bạn muốn khám phá report trước khi kết nối database thực, chọn **Use Sample Data** thay vì **Use Your Own Data** ở Bước 1, rồi nhấn **Setup Pipeline**.

Data Suite tạo report ngay lập tức với dữ liệu mẫu đã chuẩn bị sẵn và một pipeline được liên kết. Khi bạn sẵn sàng chuyển sang dữ liệu thực:

{% stepper %}
{% step %}

### Mở report và nhập dữ liệu của bạn

1. Mở report. Một thông báo xuất hiện nhắc bạn nhập dữ liệu của mình.
2. Nhấn **Import Own Data** để vào phần cài đặt Pipeline Ingestion và thực hiện tương tự như Bước 2 ở trên.
   {% endstep %}
   {% endstepper %}


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.datasuite.vn/cac-tinh-nang/data-pipeline/tao-pipeline-tu-template.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
