Tổng quan về Business Intelligence (BI)

1. Khái niệm về BI

Business Intelligence (gọi tắt là BI) là quy trình/hệ thống công nghệ cho phép phân tích và thể hiện thông tin giúp cho các nhà quản lý và người sử dụng của tổ chức đưa ra các quyết định kinh doanh phù hợp.

BI bao gồm một loạt các công cụ, ứng dụng và phương thức cho phép các tổ chức thu thập thông tin từ các hệ thống nội bộ và nguồn bên ngoài; chuẩn bị sẵn sàng cho việc phân tích; phát triển và chạy các truy vấn đối với dữ liệu; tạo các báo cáo, bảng điều khiển (dashboard) và hình ảnh hóa dữ liệu để cung cấp kết quả phân tích cho những người sử dụng và những người ra quyết định.

2. Lợi ích của BI

Các lợi ích tiềm năng của BI bao gồm tăng tốc và cải thiện việc ra quyết định, tối ưu các quy trình kinh doanh, nâng cao hiệu quả hoạt động, mang lại doanh thu mới và có được nhiều lợi thế cạnh tranh về mặt kinh doanh hơn so với đối thủ. Các hệ thống BI có thể giúp các doanh nghiệp xác định được xu hướng thị trường và chỉ ra các vấn đề của kinh doanh cần quan tâm xử lý.

3. Các thành phần chính của BI

Data Sources

  • Là cơ sở dữ liệu thô (thường là cơ sở dữ liệu quan hệ) đến từ nhiều nguồn khác nhau như các ứng dụng business như Human Resource Management (HRM), Customer relationship management (CRM), phần mềm bán hàng, website thương mại điện tử…
  • Có thể là bất cứ hệ quản trị cơ sở dữ liệu nào như MySQL, Oracle, MSSQL, DB2, …
  • Thường được thiết kế theo mô hình cơ sở dữ liệu quan hệ nhưng cũng có thể là dữ liệu lớn, dữ liệu phi quan hệ (như mạng xã hội, NoSQL)

Data Warehouse

  • Là cơ sở dữ liệu được thiết kế theo mô hình khác với CSDL OLTP thông thường (Online Transaction Processings – OLTP là thiết kế CSDL dành cho việc đọc ghi thường xuyên, lượng dữ liệu cho mỗi lần đọc ghi ít) và là nơi lưu trữ dữ liệu lâu dài của tổ chức.
  • Dữ liệu của DWH chỉ có thể đọc, không được sử dụng để ghi hay update bởi ứng dụng thông thường,  nó chỉ được cập nhật/ghi bởi công cụ ETL (Extract Transform Load), công cụ chuyển đổi dữ liệu từ Data Sources vào Data Warehouse.

Integrating Server

  • Chịu trách nhiệm trung gian vận hành công cụ ETL để chuyển đổi dữ liệu từ Data Sources vào Data Warehouse.

Analysis Server

  • Chịu trách nhiệm thực thi các cube được thiết kế dựa trên các chiều dữ liệu và tri thức nghiệp vụ
  • Cube chịu trách nhiệm nhận dữ liệu đầu vào từ DWH và thực thi theo nghiệp vụ định nghĩa sẵn để trả về kết quả.

Reporting Server

  • Thực thi các report với output nhận được từ Analysis Server.
  • Nơi quản trị tập trung các report trên nền web, các report này có thể được attach vào ứng dụng web, hay application

Data Mining

  • Là quá trình trích xuất thông tin dữ liệu đã qua xử lý (phù hợp với yêu cầu riêng của doanh nghiệp) từ Data Warehouse rồi kết hợp với các thuật toán để đưa ra ( hoặc dự đoán ) các quyết định có lợi cho việc kinh doanh của doanh nghiệp.
  • Đây là một quá trình quan trọng trong BI, thông thường một doanh nghiệp muốn sử dụng giái pháp BI thường kèm theo về Data Mining.

Data Presentation

  • Tạo ra các báo cáo, biểu đồ từ quá trình data mining để phục vụ cho nhu cầu của người dùng cuối.

4. Data Warehouse

Kiến trúc tổng thể của một hệ thống Data Warehouse

  • Data Source Layer (Lớp dữ liệu nguồn)

Dữ liệu đầu vào cho DWH có thể bao gồm nhiều nguồn khác nhau và dưới các định dạng khác nhau như một cơ sở dữ liệu quan hệ, một file text, file XML hay từ lịch sử truy cập dịch vụ của người dùng..

  • ETL Layer

Đảm nhận việc trích xuất dữ liệu, biến đổi dữ liệu từ nguồn và đưa vào hệ thống DWH.

  • Staging Area

Tại đây các trường dữ liệu thừa theo chuẩn của từng nguồn dữ liệu và và chuyển vào DWH hoặc Data mart.

  • Data Storage Layer

Đây là nơi lưu trữ dữ liệu sau khi đã được lược bỏ và chuẩn hóa

  • Data Logic Layer

Các quy luật riêng của doanh nghiệp sẽ đươc lưu vào đây. Chúng không ảnh hưởng tới dữ liệu lưu trong DW nhưng sẽ tác động tới các dạng như báo cáo sau này.

  • Data Presentation Layer

Lớp này đảm nhận việc “xuất” các thông tin hữu ích cho người dùng như bảng hoặc báo cáo đồ họa theo yêu cầu của doanh nghiệp trên web, dạng email báo cáo tự dộng tạo và gửi đi định kỳ, …

  • Metadata Layer

Đây sẽ lưu trữ các thông tin về dữ liệu trong DWH.

  • System Operations Layer

Lưu lại thông tin về quá trình hoạt động của hệ thống DWH như tình trạng của tiến trình ETL, năng suất của hệ thống và lưu lại lịch sử truy xuất của các user.

5. Các công cụ của BI

BI kết hợp một bộ lớn các ứng dụng phân tích bao gồm cả phân tích và truy vấn đặc thù (ad hoc), báo cáo doanh nghiệp, xử lý phân tích trực tuyến (OLAP) và location intelligence (LI).

Công nghệ BI cũng bao gồm phần mềm trực quan hóa dữ liệu phục vụ việc thiết kế các sơ đồ và các đồ họa thông tin, cũng như các công cụ sử dụng cho việc xây dựng các bảng điều khiển (dashboard) và các thẻ điểm hiệu suất hiển thị các dữ liệu được trực quan hóa trên các chiều kinh doanh và các KPI theo cách dễ dàng nắm bắt.

BI có thể cũng kết hợp các hình thức phân tích tiên tiến như khai thác dữ liệu, phân tích dự đoán, khai thác chữ (Text Mining), phân tích thống kê và phân tích dữ liệu lớn.

6. Xu hướng xây dựng BI

Bên cạnh các nhà quản lý BI, nhóm ứng dụng BI nhìn chung bao gồm các kiến trúc sư BI, các nhà phát triển, phân tích nghiệp vụ và các chuyên gia quản lý dữ liệu BI. Những người sử dụng nghiệp vụ cũng tham gia nhóm dự án, họ đại diện cho phía nghiệp vụ và có vai trò đảm bảo các yêu cầu nghiệp vụ cần thiết được đáp ứng trong quá trình phát triển BI.

Để hỗ trợ việc này, ngày càng nhiều tổ chức đang thay thế mô hình phát triển kiểu thác nước thành Agile BI và các cách tiếp cận data warehouse sử dụng kỹ thuật phát triển phần mềm Agile để chia nhỏ dự án BI thành các phần nhỏ và phát hành các chức năng cho phân tích nghiệp vụ trên cơ sở lặp và nâng cấp dần. Làm như vậy cho phép các doanh nghiệp có thể đưa các tính năng của BI vào thực tiễn nhanh hơn và làm mịn hoặc điều chỉnh các kế hoạch phát triển khi có các thay đổi nghiệp vụ cần hoặc xuất hiện các yêu cầu mới và có ưu tiên cao hơn các vấn đề cũ.

7. BI với dữ liệu lớn

Các nền tảng BI càng ngày càng được sử dụng như các giao diện đầu cuối cho các hệ thống dữ liệu lớn. Phần mềm BI hiện đại thường phục vụ các hệ thống phía sau (back end), cho phép chúng có thể kết nối đến một loạt các nguồn dữ liệu khác nhau. Cùng với giao diện người dùng đơn giản, cho phép các công cụ tích hợp tốt với các hệ thống dữ liệu lớn. Người dùng có thể kết nối đến một loạt nguồn dữ liệu, bao gồm các hệ thống Hadoop, các CSDL NoSQL, các nền tảng đám mây và nhiều các data warehouse thông thường khác, và có thể phát triển khung nhìn thống nhất cho các dữ liệu khác nhau.

BI thường được dùng để cung cấp giao diện cuối cùng đơn giản, trực quan nhằm cung cấp thông tin cho những người dùng sử dụng thông thường hơn là cách tiếp cận thường thấy của việc cung cấp cho các chuyên gia dữ liệu hay chuyên gia công nghệ.

8. Yếu tố chi phối sự thành công của một dự án BI

Để triển khai thành công một dự án BI, một trong những điều kiện tiên quyết là đội ngũ dự án phải am hiểu rõ nghiệp vụ và các sản phẩm đầu ra cho dự án. Đội ngũ phát triển phải có kiến thức, kinh nghiệm về phương thức thiết kế, tổ chức dữ liệu cho DWH. Việc làm chủ các nguồn dữ liệu và kiểm soát các công cụ ETL cũng đóng vai trò hết sức quan trọng. Bên cạnh đó, đội ngũ phát triển cũng cần am hiểu các công cụ của BI để có thể thiết kế và xây dựng hệ thống nhanh chóng, dễ dùng và hiệu quả.