top of page
Ảnh của tác giảCherry

Làm Data Visualization có cần phải đẹp và dùng tool xịn nhất?

Đã cập nhật: 2 thg 4

Nhìn biểu đồ (charts) thì lúc nào cũng ấn tượng và dịu hơn là nhìn bảng số (data table). Điều này kèm với sự PR từ nhiều nguồn có lẽ đã thúc đẩy nhiều bạn ưu tiên học và làm Data Visualization đầu tiên. Cherry cũng thế, tuy nhiên, sau nhiều năm làm data ở nhiều doanh nghiệp thì có vài điều khiến Cherry vỡ lẽ so với khi mới bắt đầu mà chị sẽ share trong bài viết này để giúp các bạn (1) phân bố thời gian và công sức học hiệu quả và (2) có cái nhìn thực tế hơn về công việc Data Visualization.



Mục đích của Data Visualization là truyền đạt số liệu một cách (1) tiện sử dụng cho người dùng, và (2) dễ hiểu cho người dùng.

Từ định nghĩa ở trên, Cherry sẽ chỉ ra và phân tích cho các bạn 2 lầm tưởng về Data Visualization mà Cherry thường thấy và tại sao nó lại 'lỗi'.





A. Dùng tools càng 'tân tiến' càng tốt

Với kinh nghiệm của bản thân thì Cherry thấy việc đánh đồng sự 'tân tiến' của một tool với sự 'hữu hiệu' của nó là sai. Rất nhiều bạn có tư tưởng này đã áp dụng các tool/function mới nhất trên thị trường để làm các task visualization từ đơn giản đến phức tạp với mong muốn đổi mới, gây ấn tượng nhưng sau đó lại thấy 'đắng' khi bỏ bao tâm huyết làm nhưng user không ai dùng hoặc ấm ức khi sếp 'bắt' làm lại theo cách/tool mà công ty quen dùng (nhưng bạn thấy nó hơi lỗi thời).


Thực tế là để quyết định dùng tools nào là tốt thì có 3 điểm các bạn cần cân nhắc. Bật mí luôn là 'mới' hay 'hiện đại nhất' thường không nằm trong số đó.

1 - Hệ thống của công ty Ngoài các phần mềm/ứng dụng có khả năng visualize được dùng rộng rãi như Excel và Google Sheets, thì mỗi công ty sẽ có thể mua/dùng thêm phần mềm thương mại (commercial software) chuyên để visualize data như Google Data Studio (aka. Looker Studio), Power BI, hay Tableau. Đối với các công ty công nghệ lớn thì họ có thể phát triển hệ thống dữ liệu của riêng họ (in-house data platform), trong đó có bao gồm data visualization tool. Trong đa số các trường hợp thì sẽ tốt nhất nếu bạn dùng các tool có sẵn trong công ty vì:

  1. Lý do bảo mật. Các tool in-house hoặc các commercial tool đã được mua bản quyền sẽ có đầy đủ chức năng, bao gồm dễ dàng kiểm soát sự chia sẻ thông tin, dashboard.

  2. Sự quen thuộc của user trong công ty với tool sẵn có. Dashboard của bạn chỉ có giá trị nếu nó được nhiều người sử dụng.

2 - Thói quen và cách dùng của user Điểm mà Cherry thấy end users không thích nhất về các data visualization tool chuyên dụng đó là nó ‘giấu’ số liệu phía sau các charts. Users không thể copy và/hoặc tính toán trên các dữ liệu ở một và đặc biệt là nhiều charts một cách nhanh chóng. Họ sẽ phải chỉnh filter này, bỏ filter kia, rồi download data từng chart về, và tự tổng hợp lại. Về mặt kĩ thuật thì đặc điểm này của dashboard sẽ giúp đảm bảo một nguồn thông tin đáng tin cậy (a single source of truth) xuyên suốt trong công ty vì chỉ có các bạn làm data mới có thể điều chỉnh. Tuy nhiên, các users đa số là commercial users, họ không care và họ đơn giản là thấy bất tiện. Do đó, trong một số trường hợp nhất định, nếu thấy có thể đem lại sự tiện lợi hơn cho users và không ảnh hưởng nhiều đến tính chính xác và bảo mật của dữ liệu thì các bạn có thể flexible làm trên các tool mà users prefer, thường là Google Sheets.

3 - Có thể maintain dễ dàng


Cũng chính vì các data visualization tool chuyên dụng ‘giấu’ số liệu và công thức tính phía sau các charts mà việc maintain nó cũng mệt mỏi hơn rất nhiều cho chính các bạn làm data. Cherry lấy ví dụ, để xây dựng 1 dashboard, tùy vào phần mềm/ứng dụng mà các bạn sẽ có vài layers hoặc tất cả các layers sau:


  1. Source data (1 query result hoặc 1 data table)

  2. Data modeling (tạo mối quan hệ giữa các tables)

  3. Custom metrics/measures (tạo metrics đặc biệt). Vd: Nếu customer là Enterprise thì đặt priority_flag là 1 để đánh dấu ưu tiên các khách hàng này: priority_flag = if(segment = ‘Enterprise’, 1,0).

  4. Filters underneath each chart, not visible to end users. Vd: với chart Sales của miền Nam thì đặt filter phía dưới là Region = ‘South’.

  5. Regional/Global filters, visible to end users. Vd: tạo filter priority_flag và đảm bảo các tables/charts liên quan sẽ được filter khi users dùng filter này.


Ở đây Cherry chỉ đưa ví dụ sơ sơ về một dashboard đơn giản nhưng các bạn có thể thấy việc quản lý và đảm bảo tính chính xác của data scope, metrics và filter cũng như là interactions giữa các filters và charts nó nhức đầu như thế nào. Thực tế là mỗi dashboard có thể có nhiều hơn 1 trang/tab, mỗi trang/tab có thể có nhiều charts/tables và các bạn làm data sẽ phải tạo và maintain rất nhiều dashboard phức tạp như này và việc sai sót là rất dễ xảy ra. Dù nhận ra có sai sót thì việc sửa chữa cũng khá mệt vì bạn sẽ phải lần mò qua chừng đó các layers xem cần chỉnh chỗ nào cho đúng.


Do đó, trừ trường hợp cần thiết phải dựng dashboard phức tạp như vậy. Cụ thể là khi dashboard đó là các dashboard nền tảng trong công ty, dùng nguồn dữ liệu lớn hoặc dữ liệu trực tiếp (live or realtime). Ngoài trường hợp đó ra thì Cherry thường chọn các tool đơn giản để việc xây dựng dashboard chỉ có 2 bước only: (1) query data và (2) visualize (chỉ visualize, hạn chế tối đa hoặc tốt nhất là không dùng luôn custom metrics và underneath filters). Khi có sai sót, Cherry sẽ chỉ nhìn vào 1 chỗ là script query data để điều chỉnh mà thôi. Cái nào dễ thì mình làm, đừng làm khó bản thân :)



B. Thiết kế đẹp là tốt


Như đã nhắc đến ở trên, điều khiến nhiều bạn mới vào nghề cực kì ấm ức đó là mình dành bao tâm huyết thiết kế dashboard vừa xinh xẻo vừa logic nhưng users lại bơ hoặc yêu cầu mình làm ra sheets. Để bớt ức chế khi gặp hoàn cảnh như vậy các bạn cần hiểu thói quen và cách dùng của users để thiết kế cho phù hợp nhất chứ không phải là đẹp nhất.


Theo kinh nghiệm của Cherry, users thường dùng số liệu trên dashboard để làm 4 công việc chính sau:

  1. Theo dõi hoạt động hàng ngày trong công ty

  2. Lên kế hoạch hoạt động hoặc xây dựng chiến lược trong công ty

  3. Báo cáo cho cấp trên trong công ty

  4. Báo cáo ra bên ngoài (vd: báo cáo cho investors, external clients)

Mục đích sử dụng (1) là flexible nhất về mặt design vì các bạn có thể trao đổi, tư vấn và trực tiếp thuyết phục end-users theo design của các bạn. Với mục đích thứ (2), thiết kế cần cho phép họ dễ dàng download, copy và/hoặc tự thực hiện tính toán. Còn với mục đích sử dụng thứ (3), các bạn nên đi theo format báo cáo/slide sẵn có vì các sếp lớn sẽ có preference của họ về mặt trình bày. Ngoài ra, các team có thể screenshot và paste vào slide báo cáo nhanh chóng mà không phải double work (i.e., download data từ charts, tổng hợp, reformat rồi mới bỏ vào slide được). Nhiều sếp, đặc biệt là người có kinh nghiệm consulting có thể đọc số còn nhanh hơn các bạn làm data, và họ sẽ thích đọc data table hơn vì họ nhìn thấy số ngay lập tức thay vì phải rơ chuột qua từng data point trên chart. Ở mục đích sử dụng cuối cùng, đây là trường hợp mà các bạn mới nên ưu tiên thiết kế đẹp và đơn giản để truyền đạt thông tin vì users thường ít quen thuộc, hoặc không có nhu cầu nhìn quá chi tiết số liệu.



Vì data visualization khác nhau từ công ty này sang công ty khác, nên có thể kinh nghiệm của Cherry sẽ không cover được tất cả các trường hợp. Các bạn nào có trải nghiệm khác những gì được share trong bài thì hãy comment cho các bạn khác biết thêm nhé. Cheers!

448 lượt xem0 bình luận

Bài đăng gần đây

Xem tất cả

Komentar


Language Studies

STAY IN THE KNOW

Thanks for submitting!

bottom of page