28 February 2021 / Tiếng Việt

Hỏi Xoáy - Đáp Xoay về Phân Tích Dữ Liệu

1. Career path sau khi học khoá Data Analytics?

Data Analyst DA (Chuyên viên phân tích dữ liệu)

Công việc chính của DA là phân tích dữ liệu, dùng dữ liệu để trả lời các câu hỏi và vấn đề đưa ra từ các phòng ban khác (marketing, tài chính). Thông thường, DA sẽ nhận data từ DE (quản lý hệ thống dữ liệu), phân tích và xây dựng báo cáo chuyển lại cho Business Intelligence hoặc các bên khác. Tuy nhiên, trong nhiều trường hợp DA cũng phải đảm nhận phần công việc của DE (quản lý hệ thống dữ liệu); hoặc phải trực tiếp đứng ra trình bày, liên quan mật thiết hơn về mảng business (BI).


Data Engineer DE (Kỹ sư kiến trúc dữ liệu)


Đây là vị trí chuyên về xây dựng hệ thống dữ liệu. Công việc chính là thu thập dữ liệu từ nhiều nguồn khác nhau, xử lý và chuyển đổi chúng thành dữ liệu có thể dùng được ngay tại kho dữ liệu trung tâm (Data Warehouse). Quản lý, sử dụng, và bảo trì data warehouse.
Công việc sẽ được trả mức lương cao hơn DA nhưng lại khá nặng về phần kỹ thuật và ứng dụng khá nhiều công nghệ.


Data Scientist DS (Chuyên gia về khoa học dữ liệu)

Công việc của DS khá rộng và tùy mỗi công ty sẽ khác nhau. Thông thường để đến được Data Scientist các bạn phải nắm vững kiến thức cả về Data Engineer lẫn Data Analyst. Công việc của DS không dừng lại ở phân tích dữ liệu mà còn mở rộng sang thiết kế những thuật toán dựa trên dữ liệu để phục vụ nhiều mục đích khác nhau. VD như là dự đoán giá, xu hướng thị trường, nhận diện khuôn mặt hay giọng nói, …
Mức lương của DS là cao nhất trong 3 vị trí và có ảnh hưởng rất lớn đối với doanh nghiệp nhưng thường rất ít người có thể làm ở vị trí này. Vì nó đòi hỏi khá nhiều kiến thức khác nhau và bằng cấp thường từ Thạc sĩ trở lên.


Chief Data Officer (CDO)

Họ quản lý toàn bộ các vấn đề liên quan đến dữ liệu của một công ty. Lúc này bạn chỉ đứng dưới tổng giám đốc của công ty CEO.

2. Khóa học này có phù hợp với người không có background coding không?

Khoá học không yêu cầu các bạn phải có background coding. Bên cạnh đó các bạn nên trang bị cho mình tư duy về lập trình, tìm hiểu kiến trúc hệ thống máy tính, mạng Internet.


Học thêm toán học, thống kê và học máy. Nếu các bạn học để áp dụng, thì có thể yêu cầu không cần cao, có thể chỉ cần dừng ở bước hiểu các khái niệm, các mô hình và thuật toán liên quan.

3. Có yêu cầu kiến thức/kỹ năng nền tảng (SQL, Python) gì để học không?

Khoá học không yêu cầu các bạn phải biết trước SQL và Python. Trong những tuần đầu tiên, các bạn sẽ được học từ những cú pháp cơ bản nhất của hai ngôn ngữ này.

4. Outcome của khóa học Data Analytics?

Kỹ năng phân tích (Analytical Skills)

Đây là kỹ năng liên quan đến vấn đề phân tích yêu cầu từ quản lý hay khách hàng. Sau đó là liên kết chúng với dữ liệu và đưa ra hướng giải quyết. Trong khóa học này các bạn sẽ được giới thiệu các bước làm việc với dữ liệu: từ lúc nhận, phân tích câu hỏi, đánh giá dữ liệu, cho tới làm sạch, phân tích, đút kết insight và trình bày báo cáo một cách trực quan hoá.

Kỹ năng lập trình (SQL & Python)

Thị trường ngày càng được mở rộng và đổi mới, các công cụ phân tích dữ liệu, đặt biệt là các công cụ dựa trên nền tảng lập trình đang được ưa chuộng hơn bao giờ hết. Trong khoá học này các bạn sẽ được giới thiệu 2 ngôn ngữ đó là SQL (để quản lý và truy xuất data) và Python ( cùng các thư viện trong Python như Pandas, Matplotlib) để phân tích và trực quan hoá data.

Kỹ năng trình bày, thiết kế báo cáo (Data Visualization)

Data Visualization là kỹ năng về chuyển đổi những số liệu thô thành những hình ảnh hay biểu đồ một cách khoa học. Data Visualization giúp bạn trình bày và trao đổi những insight từ dữ liệu một cách nhanh chóng và ý nghĩa hơn. Trong khoá học này các bạn sẽ được tiếp cận và sử dụng Google Data Studio để thiết kế báo cáo dữ liệu của chính bạn.

5. Sự khác biệt giữa khóa học Data Analytics và khoá Machine Learning?

Data Analytics


Data Analytics là quá trình bao gồm các công việc: thu thập một lượng dữ liệu lớn (Big Data); tổ chức dữ liệu và phân tích để khám phá ra các thông tin có giá trị; như khám phá ra các xu hướng, sở thích của khách hàng,… Đây là những thông tin giúp đưa ra các quyết định phù hợp trong tương lai. Data Analytics là một kỹ thuật của Data Analysis. Kỹ thuật này bao gồm các phương pháp, thuật toán và Data Mining để có được thông tin hữu ích hơn.

Machine Learning

Machine Learning là môn khoa học dựa trên dữ liệu. Mục tiêu của Machine Learning là khám phá ra và giúp máy tính xây dựng model để ghi nhớ được những logic trong tập dữ liệu dựa trên các thuật toán Machine Learning. Từ đó, trong tương lai, có thể dùng các model này để đưa ra dự đoán. Ví dụ như dựa vào giá nhà trong 5 năm qua, bạn có thể xây dựng model để dự đoán giá nhà trong năm tiếp theo.


Do các model được xây dựng từ việc “học" dữ liệu, việc chuẩn bị và tiền phân tích dữ liệu là một bước hết sức quan trọng trong Machine Learning. “Garbage in, garbage out" - Bạn không thể nào xây dựng một model ML tốt với một tệp data không được chuẩn bị kỹ càng. Do đó trước khi đến với Machine Learning, bắt buộc các bạn phải biết làm việc với Data Analytics.

6. Sự khác biệt giữa Data Science & Data Analytics?

Có thể ví Data Sciences là cha, bao hàm luôn cả Data Analytics. Về cơ bản, DS bao trùm cả các thuật toán, mô hình thống kê, Artificial Intelligence (AI), Machine Learning (ML), Deep Learning, Neural Networks.

Bạn đã sẵn sàng? Đăng ký và giữ chỗ ngay hôm nay!