X

Khác nhau giữa Data Analytics, Machine Learning, Big Data?

Để hiểu sự khác nhau giữa Data Analytics, Machine Learning, Big Data, Data Analysis, Data Mining, Data Science. Chúng ta sẽ đi cụ thể vào từng khái niệm nhé. Khi bạn hiểu từng khái niệm rồi, bạn có thể xác định được sự khác nhau giữa chúng.

Data Analytics

Data Analitics là quá trình bao gồm các công việc: thu thập một lượng dữ liệu lớn (Big Data); tổ chức dữ liệu và phân tích để khám phá ra các thông tin có giá trị; như khám phá ra các xu hướng, sở thích của khách hàng,… Đây là những thông tin giúp đưa ra các quyết định phù hợp trong tương lai. Data Analitics là một kỹ thuật của Data Analysis. Kỹ thuật này bao gồm các phương pháp, thuật toán và Data Mining để có được thông tin hữu ích hơn.

Data Analysis

Data analysis là quá trình hiểu dữ liệu, làm sạch dữ liệu, thực hiện các biến đổi trên dữ liệu thô để trích xuất ra các thông tin giá trị bằng cách sử dụng các kỹ thuật phân tích và lý luận logic. Có rất nhiều phương pháp để phân tích dữ liệu. Những phương pháp này bao gồm data mining, phân tích văn bản, phân đoạn,…

Data mining

Data mining là một quá trình xử lý để trích xuất thông tin hữu ích từ dữ liệu thô; Dữ liệu đó có thể có cấu trúc, phi cấu trúc hoặc cả hai. Bằng cách sử dụng các công cụ, phần mềm; Từ một tập dữ liệu lớn, các quy luật được phát hiện giúp chúng ta hiểu hơn về hành vi khách hàng, có chiến lược tiếp thị tốt hơn,… Hơn nữa, data mining giúp chúng ta tổ chức và lưu trữ lại những dữ liệu giá trị thay vì lưu kho dữ liệu thô. Một cái tên khác của data mining là KDD (Knowledge Discovery in Data).

Data Science

Data Science là công việc hiểu dữ liệu và lấy được thông tin trong đó. Là các phương pháp tự động để phân tích dữ liệu lớn. Có thể hiểu Data Science là cha của những thằng ở trên (data analytics, data analysis and data mining). Data science bao gồm những phạm trù toán học phức tạp. Nó bao gồm các công cụ, phương pháp, các tiến trình, thuật toán và các hệ thông thông tin về dữ liệu.

Machine learning

Thực tế, không có sự liên quan giữa data science và machine learning; Machine learning được sử dụng để làm cho máy có khả năng học (tối ưu hiệu quả cho 1 việc nào đó) từ dữ liệu. ML là một nhánh con của Computer science; Nó cho phép máy có thể học theo một số kỹ thuật học khác nhau. Từ dữ liệu lớn, Machine learning có thể học và xử lý rất nhiều bài toán như nhận diện khuôn mặt, phát hiện thư rác,… Machine learning giúp cho các hệ thống có khả năng phát hiện các mẫu và đưa ra các dự đoán.

Big data

Thuật ngữ này thể hiện cho một số lượng dữ liệu khổng lồ được tạo ra từ những dịch vụ lớn như các ngân hàng, dịch vụ vận tải, mạng xã hội,… Dữ liệu này có thể có cấu trúc hoặc phi cấu trúc. Để có thể vận hành những hệ thống dữ liệu khổng lồ này, bạn cần những cơ chế riêng. Thực tế thì khối lượng của dữ liệu không phải là vấn đề; Vấn đề là bạn sẽ có được gì từ đống dữ liệu khổng lồ đó. Chúng là dữ liệu thô, và bạn cần những phương pháp phân tích dữ liệu để lấy được thông tin hữu ích từ đó. Đó là cách để giảm chi phí lưu trữ, quản lý; đồng thời có được những quyết định dựa trên kết quả phân tích dữ liệu.

Tài liệu tham khảo
[1]. https://www.quora.com/topic/Difference-Between-Data-Science-and-X

~ Nguyễn Văn Hiếu

Thang Pham Minh: