Trang chủ Chuyên đề Quản trị số liệu (Tổng kết buổi 3)

Quản trị số liệu (Tổng kết buổi 3)

đăng bởi Nguyễn Danh Tú
408 lượt xem

Tổng kết buổi 3: Quản trị số liệu

Trong bài viết này chúng ta tìm hiểu sâu hơn về quản trị dữ liệu số với các khái niệm Phân tích, Hệ thống dữ liệu và số liệu

1⃣ CÁC MÔ HÌNH THAM KHẢO TRONG QUÁ TRÌNH XÂY DỰNG HỆ THỐNG PHÂN TÍCH DỮ LIỆU
🍀 Luồng nghiệp vụ (Business flow)
Đầu tiên, để xây dựng được hệ thống phân tích dữ liệu hữu ích cho doanh nghiệp của mình thì mình cần hình dung được luồng nghiệp vụ (Business flow) của đơn vị mình.
Luồng nghiệp vụ này có thể lấy khách hàng hay sản phẩm làm đối tượng trong quá trình vẽ.
Dưới đây là một sơ đồ luồng nghiệp vụ tham khảo
Trên mô hình ta có thể phân vùng theo các bộ phận hoặc các hệ thống CNTT.
🍀 Luồng dữ liệu (Data flow)
Sau khi hình dung được tổng thể nghiệp vụ, ta đi đến mô hình cho phép ta nhìn thấy được các hệ thống CNTT và sự trao đổi dữ liệu của các hệ thống đó.
Ta gọi là luồng dữ liệu (Data flow)
Dưới đây là một sơ đồ luồng dữ liệu tham khảo
🍀 Kiến trúc hệ thống phân tích dữ liệu (Data analytics system architecture)
Tiếp theo, đã xây dựng kiến trúc của hệ thống phân tích dữ liệu cho chính đơn vị của mình.
Hệ thống này có nhiều cách thiết kế. Trong trường hợp đơn giản ta chia làm 4 vùng:
👉 Vùng Nguồn dữ liệu (Data sources) ta liệt kê tất cả các hệ thống mà lấy dữ liệu để phân tích vào đây
👉 Vùng đệm (Staging) ta tập hợp các dữ liệu và tiền xử lý ở vùng này. Nó có thể là tập hợp các file excel xuất từ hệ thống hoặc cơ sở dữ liệu
👉 Vùng kho dữ liệu (Data warehouse) là các dữ liệu đã được làm sạch, tiền xử lý và sẵn sàng cho quá trình phân tích.
Ta liệt kê các dimension, fact ở đây hay tổng quát hơn là data model hay tên các kho chủ điểm dữ liệu (Data mart)
👉 Vùng phân tích dữ liệu, ta liệt kê ra các dashboard phân tích hay các ứng dụng đầu ra của hệ thống phân tích
Dưới đây là một mô hình tham khảo
2⃣ CÁC LỚP DỮ LIỆU
Để đi sâu hơn vào dữ liệu của hệ thống cũng như quá trình hình thành dữ liệu ta tách thành các lớp dữ liệu.
🍀 Lớp 1. Chứng từ
Khi thực hiện một công việc cần có chứng cứ để xác định. Chứng cứ này có thể là bản cứng hoặc bản mềm.
🚶‍♂ Ví dụ. Đó là hóa đơn, chấm công, đăng ký đơn hàng, phiếu nhập, xuất,… hay đơn giản là các biên bản xác nhận kế hoạch kinh doanh.
✍ Ở lớp này, ta thường quan tâm tới là có chứng từ từ chưa. Nếu chưa có thì tổ chức lưu trữ.
🍀 Lớp 2. Các loại giao dịch
Trong mỗi chứng từ sẽ gồm nhiều loại giao dịch khác nhau.
🚶‍♂ Ví dụ. Như trên một hóa đơn thì sẽ có:
👉 Loại giao dịch 1: hóa đơn ai ăn, bao nhiêu tiền
👉 Loại giao dịch 2: danh sách món A, số lượng, thành tiền
👉 Loại giao dịch 3: Thuế GTGT
👉 Loại giao dịch 4: Công nợ nếu khách hàng trả một phần
Thực tế, sẽ có những loại giao dịch có sẵn trên chứng từ. Có những loại giao dịch cần phân bổ ra để phân tích.
🚶‍♂ Ví dụ. Trên bảng lương sẽ có một nhân viên A tháng 10 có lương là 25 triệu.
Mình muốn phân tích hiệu quả chi phí của theo dự án mà nhân viên A làm ở hai dự án.
Vậy mình cần tách/phân bổ dữ liệu lương thành 2 dòng như nhân viên A làm dự án X 10 triệu. Nhân viên A làm dự án Y 25 triệu.
✍ Ở lớp này, ta cần phân tách và xác định được các loại giao dịch cần lưu trữ để phục vụ quá trình phân tích sau này.
🍀 Lớp 3. Sổ giao dịch
Các loại giao dịch sẽ lần lượt lưu trữ vào các loại sổ khác nhau.
🚶‍♂ Ví dụ. Như sổ bán hàng, sổ công nợ, sổ thu chi, sổ chấm công, sổ đơn hàng,….
Các loại sổ này có thể sổ giấy, các sheet trong Excel, hay các bảng trong cơ sở dữ liệu.
✍ Ở lớp dữ liệu này, ta có thể sử dụng các công cụ sau để tối đa hóa hiệu năng
👉 Search/Sort, Filter
👉 Phân cấp/Tree
👉 Cảnh báo/ Conditional formatting
👉 Hướng dẫn/ Guideline
👉 Data Validation
🍀 Lớp 4. Tổng hợp
Từ các sổ giao dịch này ta sẽ làm các thống kê/tổng hợp/báo cáo dữ liệu.
Đó chính là các báo cáo đơn giản mà các doanh nghiệp hay sử dụng.
Trong Excel thì ta sử dụng các hàm thống kê như sum, sumif, countif,..
Rồi tiến tới dùng các công cụ như Pivot table
Trong lập trình thì sẽ sử dụng các hàm.
Ở tầng này, ta có thể sử dụng các công cụ mạnh như Pivot Table và cảnh báo màu (Conditional formatting).
✍ Về mặt bản chất trong góc nhìn phân tích dữ liệu ta thấy chia làm hai nhóm dữ liệu. Một nhóm là chiều (dimension) và một nhóm là để tính toán (facts).
Nhóm tính toán hầu hết chỉ có: sum, count, average, min, max là chính.
Gợi ý: khi ta có thể đọc các báo cáo hiện nay của doanh nghiệp để xác định được các dim & fact.
Lớp dữ liệu ở tầng tổng hợp thì chưa hiệu quả cho việc phân tích dữ liệu.
🚶‍♂ Ví dụ. Doanh thu tháng này tổng hợp được là 2 tỷ thì chỉ có số đó thôi thì không có ý nghĩa quản trị.
Doanh thu tháng trước 1 tỷ với tháng trước 3 tỷ thì phân tích sẽ khác
Doanh thu kế hoạch là 3 tỷ và 1 tỷ thì phân tích sẽ khác.
🍀 Lớp 5. Phân tích
Ở tầng phân tích thì chúng ta sẽ có một số hướng dẫn sau:
👉 So sánh với mục tiêu, thường đạt, khác
🚶‍♂ Ví dụ. Trên báo cáo có trục thời gian để so sánh được với thường đạt hoặc thể hiện cả kế hoạch và thực tế.
👉 Phân tích OLAP đa chiều
🚶‍♂ Ví dụ. Khi phân tích doanh thu thì ta thể hiện nhiều báo cáo phân tích doanh thu theo các khía cạnh khác nhau.
👉 Sử dụng nguyên lý 3-4;6-8 để dữ liệu dễ dàng phân tích
🚶‍♂ Ví dụ. Nếu chúng ta có 100 sản phẩm thì thì chúng ta chia làm 3 tầng.
(y) Tầng 1: dòng sản phẩm (5 nhóm).
(y) Tầng 2: Nhóm sản phẩm. Mỗi nhóm tầng 1 có 5-6 nhóm sản phẩm tầng 2.
(y) Tầng 3: Mỗi nhóm sản phẩm tầng 2 sẽ có 5-7 sản phẩm.
Khi phân tích thì ta phân tích từ dòng sản phẩm rồi xuống nhóm sản phẩm từng dòng rồi xuống sản phẩm của từng nhóm.
👉 Kết cấu các dashboard hợp lý, phong thủy
Có nhiều gợi ý để cho dashboard khoa học và dễ dàng phân tích.
Dưới đây là một số gợi ý.
👉 Áp dụng tỷ lệ/tỷ trọng trong hoạt động phân tích
Tỷ lệ là tỷ lệ chuyển đổi giữa các công đoạn hay trạng thái. Ta vẽ quy trình rồi định nghĩa các trạng thái và mã hóa thì sẽ có các báo cáo tỷ lệ.
🚶‍♂ Ví dụ.
(y) Tỷ lệ khách hàng mua hàng/đăng ký.
(y) Tỷ lệ hoàn trả hàng/mua hàng.
Tỷ trọng là tỷ trọng tại một khâu của quy trình.
🚶‍♂ Ví dụ.
(y) Tỷ trọng sản phẩm đến từ các nhà cung cấp nào
(y) Tỷ trọng các đơn vị giao vận
(y) Tỷ trọng các nhóm khách hàng.
🍀 Lớp 6. Hỗ trợ ra quyết định
Căn cứ vào dữ liệu phân tích sẽ ra các phương án, quyết định để triển khai trong thực tế.
3⃣ QUẢN TRỊ DỮ LIỆU SỐ

🍀 Đơn vị tính
Khi làm việc với số liệu ta cần biết số liệu cần có đơn vị tính.
Đó là điều đầu tiên để số liệu có nghĩa thông tin.
Như 1000 có thể là 1000 sản phẩm hay 1000$ hay 1000 VNĐ. Bản thân số 1000 không có ngữ nghia phân tích.
Trong các đơn vị tính thì số liệu còn có một đơn vị tính là thời gian.
Có hai loại đơn vị tính thời gian là từ ngày-đến ngày và tại ngày.
🚶‍♂ Ví dụ.
👉 Từ ngày-đến ngày.
(y) Doanh thu tháng 8
(y) Số lượng khách hàng đăng ký tháng 8
(y) Tổng lượng xuất nhập kho tháng 8
👉 Tại ngày
(y) Số dư tài khoản
(y) Tổng hàng tồn kho
(y) Số lượng nhân sự ở công ty
Các loại tỷ lệ, tỷ trọng thì bản chất cũng là lấy số A/Số B nên A và B cũng có đơn vị tính thời gian.
🚶‍♂ Ví dụ.
Khi ta quan tâm tới hiệu quả của hoạt động bán hàng thì sẽ có một chỉ số gọi là tỷ lệ chuyển đổi khách hàng.
Tỷ lệ chuyển đổi khách hàng = Số khách hàng mua hàng/Số khách hàng đăng ký.
Thông thường ví dụ phân tích tỷ lệ chuyển đổi khách hàng tháng 8 ta sẽ:
Lấy số khách hàng mua hàng trong tháng 8.
Lấy số khách hàng đăng ký trong tháng 8.
Rồi chia cho nhau.
Sau đó ta lấy tỷ lệ này so trong các tháng với nhau.
Tuy nhiên, thực tế có những khách hàng trong tháng 8 đến từ các khách hàng đăng ký tháng 7, 6.
Và ngược lại có những người đến tìm hiểu tháng 8 sẽ mua trong tháng 9.
Thế nên trong trường hợp có những chiến dịch quảng bá vào tháng 8 mà khách hàng đến rải rác vào các tháng thì công thức trên không đúng.
Khi đó ta cần:
tỷ lệ các khách hàng mua hàng đến từ các khách hàng đăng ký tháng 8.
Khi đó số lượng khách hàng mua hàng là dạng số liệu tại ngày vì tại ngày 31/8; 30/9;31/10 là các số khác nhau.
✍ Và sổ nào thì số nấy. Có nghĩa là muốn tính các số tại ngày thì ta cần có một quyển sổ ghi nhận trạng thái từng ngày thì tính toán số liệu mới dễ dàng.
Từ đó, ta có phương pháp để phân tích theo vòng đời gọi là cohort-analysis giúp ta phân tích tỷ lệ của những quy trình mà có vòng đời dài.
🚶‍♂ Ví dụ.
(y) Tỷ lệ sử dụng app. Khách hàng cài app một ngày nhưng sử dụng app nhiều ngày.
(y) Hiệu quả chiến dịch marketing, truyền thông. Chiến dịch trong một khoảng thời gian nhưng hiệu quả đến liên tục sau đó.
(y) Tỷ lệ hoàn trả các lô hàng. Một lô hàng vận chuyển và hoàn trả dần dần theo thời gian.
🍀 Ngoài ra, ta cũng có một số mẫu cấu trúc báo cáo để quản trị số liệu
✍ Đầu – phát – cuối
🚶‍♂ Ví dụ.
(y) Hàng tồn cuối tháng = hàng tồn đầu tháng + phát sinh tăng hàng nhập + phát sinh giảm hàng xuất
(y) Số lượng nhân sự cuối tháng = số lượng nhân sự đầu tháng + số nhân sự đi làm mới trong tháng – số lượng nhân sự nghỉ trong tháng
(y) Số dư budget marketing cuối tháng = số dự budget marketing đầu tháng + cấp mới trong tháng – chi trong tháng.
✍ Có- Dùng- Còn
🚶‍♂ Ví dụ.
(y) Có 5 headcount tuyển dụng, đã dùng tuyển được 3, còn tuyển được 2
(y) Kế hoạch doanh thu cần 2 tỷ, đã có 1.8 tỷ, còn cần 0.2 tỷ.
✍ Đủ – Đỏ – Đẹp (khối lượng – chất lượng – tiến độ)
🚶‍♂ Ví dụ.
(y) Một dây truyền sản xuất thì đầu tiên quan tâm tới.
Đủ (Khối lượng): sản xuất được bao nhiêu đơn hàng
Đỏ (Chất lượng): Tỷ lệ sản phẩm lỗi là bao nhiêu
Đẹp (Tiến độ): Có sản xuất được trong thời gian ngắn hơn không.
(y) Kế hoạch doanh thu thì ta quan tâm tới
Đủ: có đủ doanh thu theo kế hoạch không
Đỏ: có các điểm nóng về doanh thu, khách hàng phản hồi hay trả lại nhiều không
Đẹp: Doanh thu vượt kế hoạch, khách hàng có phản hồi tốt hay giới thiệu không.
✍ Áp dụng 6 tầng dữ liệu ở trên để biết ta đã làm đến tầng nào rồi.
4⃣ ỨNG DỤNG CÁC NGUYÊN LÝ XÂY DỰNG HỆ THỐNG CNTT
🍀 Nguyên lý hộp đen: Input-Ouput
Ta xem xét hệ thống dữ liệu như một hộp đen.
Mình viết input là các nguồn dữ liệu. Output là các yêu cầu phân tích.
Từ đó ta thấy được sự hợp lý giữa đầu vào và đầu ra.
🚶‍♂ Ví dụ.
Ta cần nấu món cần xào bò (output)
Mà intput có rau muống với thịt lợn thì dù ta chưa biết nấu ăn ta đã biết nó chưa hợp lý.
🍀 Nguyên lý hộp đen mở rộng: Input-Output-Process-Parameter-Guideline
Sau khi xác định được input-output hợp lý, ta sẽ đến các bước để xử lý được từ input ra được output.
Nếu việc phức tạp ta chia nhỏ thành các việc con để đơn giản dần rồi xử lý.
Sau đó đến công doạn đóng gói. Ta thêm các nội dung tham số hóa để hệ thống linh hoạt hơn và đóng gói hướng dẫn sử dụng.
🚶‍♂ Ví dụ về tham só hóa.
Một cái quạt thì input là điện và output là gió. Process là quá trình biến đổi từ điện thành gió.
Tham số hóa là:
👉 Nhanh hay chậm các nấc thế nào
👉 Có quay không
👉 Có hẹn giờ không
Rõ ràng một hệ thống khi có tham số hóa sẽ trở nên thông minh hơn. Đây là điều mà ít người để ý.
✍ Ngoài ra việc đóng gói qua màu hóa và hướng dẫn sử dụng làm hệ thống chuyên nghiệp và dễ dàng chuyển giao, đào tạo.
🍀 Nguyên lý mã hóa: Mã hóa màu, mã hóa số
Trong CNTT hay sử dụng mã hóa để giúp giao tiếp nhanh hơn và bớt sử dụng não suy nghĩ nhiều không cần thiết.
🚶‍♂ Ví dụ.
👉 Số lượng đơn hàng đặt hàng
👉 Số lượng đơn hàng đồng ý giao
👉 Số lượng đơn hàng đã thanh toán
👉 Số lượng đơn hàng đã hủy
Thì sẽ rất nhiều loại số lượng và ta mã hóa thành
D1->D2->D3->D4 ứng với đặt hàng->đồng ý giao->thanh toán->hủy.
Rồi khi báo cáo ta hỏi D1 bao nhiêu. Tỷ lệ D4/D1 bao nhiêu sẽ nhanh gọn hơn và không bị nhầm lần.
🚶‍♂ Ví dụ.
👉 Báo cáo tổng hợp doanh số
👉 Báo cáo tổng hợp doanh số theo khu vực
👉 Báo cáo tổng hợp doanh số theo từng dòng sản phẩm
👉 Báo cáo tổng hợp doanh số cả năm
Thì sẽ rất nhiều loại báo cáo doanh số nhau và khó phân loại.
Ta quy ước là doanh số là DS. Rồi 100 là tổng 200 khu vực, 300 dòng sản phẩm, còn 00 là năm, 10 là quý rồi 20 là theo tháng.
Thì khi đọc DS120 là mình biết doanh số tổng theo tháng. DS210 là doanh số theo khu vực từng quý.
Tương tự với đặt mã hóa theo nhóm người sử dụng, bộ phận,…
Ta cũng có thể mã hóa màu để phân vùng đơn giản như trong 1 file excel.
Màu đỏ là input
Màu xanh là output
Màu vàng là hướng dẫn sử dụng
Màu tím là tham số, cấu hình
Khi đó, mới nhìn vào 1 file excel, 1 link google sheet là ta đã phân vùng các sheet để xử lý cho đơn giản rồi.

Bạn có thể đánh giá trình độ phân tích dữ liệu tại đây để có thêm keyword cho lĩnh vực này.

Bạn cần tìm hiểu về khóa học Phân tích dữ liệu thì có thể đăng ký tại đây.

5 2 votes
Article Rating
Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x