5 kỹ năng khoa học dữ liệu (data science) cần thiết trong thời đại số

Bài viết này được trích từ cuốn sách CHIẾN LƯỢC DỮ LIỆU (DATA STRATEGY) của tác giả Bernard Marr.

Một trong những câu hỏi tôi nhận được nhiều nhất là: “Kỹ năng dữ liệu quan trọng nhất là gì?”. Dựa trên kinh nghiệm của tôi, tôi tin rằng năm kỹ năng sau đây là quan trọng nhất để chuyển dữ liệu thành những hiểu biết sâu sắc:

1 Kỹ năng kinh doanh
Bất kỳ một nhà khoa học dữ liệu xuất sắc nào cũng đều nên có sự hiểu biết tường tận về điều gì sẽ khiến cho doanh nghiệp trì trệ, điều gì sẽ làm cho doanh nghiệp phát triển và liệu nó có đang đi đúng hướng hay không. Việc này bao gồm sự hiểu biết về các quy trình kinh doanh chính, những mục tiêu, và các chỉ số chính được sử dụng để đánh giá hiệu suất của công ty, cũng như những gì giúp công ty trở nên nổi bật hơn so với các đối thủ cạnh tranh (và nếu nó không nổi bật, thì tại sao không và cần phải thay đổi những gì?). Kỹ năng giao tiếp cũng là một thành phần quan trọng trong việc trích xuất số lượng tối đa giá trị từ dữ liệu, từ các kỹ năng truyền đạt giữa các cá nhân một cách hiệu quả cho đến khả năng trình bày các kết quả từ dữ liệu một cách rõ ràng, hấp dẫn.

2 Kỹ năng phân tích
Tất cả những khả năng phát hiện các kiểu mẫu, phân biệt mối liên hệ giữa nguyên nhân và kết quả, và xây dựng các mô hình mô phỏng có thể được gắn kết chặt chẽ với nhau cho đến khi chúng tạo ra kết quả mong muốn đều là những kỹ năng quan trọng. Việc này bao gồm một nền tảng vững chắc trong các gói phân tích tiêu chuẩn ngành (như SAS Analytics, IBM Predictive Analytics và Oracle Data Mining), cũng như hiểu biết sâu sắc về việc diễn giải các báo cáo và hình ảnh để phát hiện ra câu trả lời cho các câu hỏi kinh doanh then chốt.

3 Khoa học máy tính
Máy tính là xương sống của bất kỳ chiến lược dữ liệu nào, vì vậy danh mục mở rộng này bao gồm tất cả mọi thứ từ việc kết nối hệ thống cáp cho đến việc tạo ra các thuật toán học máy phức tạp và xử lý ngôn ngữ tự nhiên. Đặc biệt, việc các ứng cử viên phải nắm vững các công nghệ mã nguồn mở quan trọng như hệ thống Hadoop đang thịnh hành, vì đây là những nền tảng của các kế hoạch dữ liệu ở nhiều tổ chức.

4 Thống kê và toán học
Những kỹ năng của một nhà thống kê chỉ cho biết về mỗi khía cạnh nhất định trong những hoạt động dữ liệu của tổ chức, từ việc xác định các tập hợp có liên quan và kích thước mẫu thích hợp khi bắt đầu mô phỏng để phục vụ cho việc báo cáo kết quả khi kết thúc. Do đó, việc nắm bắt những số liệu thống kê cơ bản là rất cần thiết, nhưng việc thực hiện một sự giáo dục toàn diện hơn trong lĩnh vực này là một điều đáng mong đợi. Toán học cũng vậy, vẫn luôn hữu ích bởi lẽ mặc dù số lượng dữ liệu phi cấu trúc và bán cấu trúc mà chúng ta đang phân tích là rất lớn và còn đang gia tăng, song phần lớn trong đó vẫn được biết đến như là những con số lỗi thời, nhưng vẫn còn có ích.

5 Sự sáng tạo
Điều này rất quan trọng khi làm việc với dữ liệu lớn. Xét cho cùng, đó là một ngành khoa học mới nổi và không có những quy tắc “bất di bất dịch” nào về mục đích mà một công ty nên sử dụng dữ liệu lớn. Sự sáng tạo ở đây có nghĩa là khả năng áp dụng các kỹ năng chuyên môn được đã đề cập ở trên và sử dụng chúng để tạo ra một thứ có giá trị (chẳng hạn như một sự hiểu biết sâu sắc) bằng một cách khác hơn là làm theo một cách thức đã được xác định từ trước. Bất kỳ ai cũng có thể đi theo một công thức — ngày nay, các doanh nghiệp đều muốn một sự đổi mới có thể khiến cho họ trở nên khác biệt so với những doanh nghiệp khác, cả về kết quả kinh doanh lẫn hình ảnh mà họ thể hiện trước người tiêu dùng của mình. Với sự bùng nổ về số lượng các tổ chức tận dụng dữ liệu để có được hiểu biết sâu sắc, thì khả năng tạo ra những cách thức mới đầy sáng tạo để làm việc với dữ liệu cũng là một kỹ năng thực sự rất đáng mong đợi.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store