Khoa học dữ liệu là khoa học về việc quản trị và phân tích dữ liệu, trích xuất các giá trị từ dữ liệu để tìm ra các hiểu biết, các tri thức hành động, các quyết định dẫn dắt hành động.
Khoa học dữ liệu gồm ba phần chính: Tạo ra và quản trị dữ liệu, phân tích dữ liệu, và chuyển kết quả phân tích thành giá trị của hành động. Việc phân tích và dùng dữ liệu lại dựa vào ba nguồn tri thức: toán học (thống kê toán học), công nghệ thông tin (máy học) và tri thức của lĩnh vực ứng dụng cụ thể.
Khoa học dữ liệu gồm ba phần chính: Tạo ra và quản trị dữ liệu, phân tích dữ liệu, và chuyển kết quả phân tích thành giá trị của hành động.
Cũng như các hình thức thí nghiệm khác, khoa học dữ liệu sẽ yêu cầu bạn thực hiện các quan sát, đặt câu hỏi, hình thành các giả thuyết, tạo các bài kiểm tra, phân tích kết quả và đưa ra một khuyến nghị thực tế. Chính vì vậy mà mục đích chính của Khoa học Dữ liệu là biến đổi một lượng lớn dữ liệu chưa qua xử lý, làm thế nào để định vị được thành mô hình kinh doanh, từ đó giúp đỡ các tổ chức tiết giảm chi phí, gia tăng hiệu quả làm việc, nhìn nhận cơ hội, rủi ro trên thị trường và làm gia tăng lợi thế cạnh tranh của doanh nghiệp.
Các lĩnh vực của khoa học dữ liệu: Khai thác dữ liệu (Data mining), Thống kê (Statistic), Học máy (Machine learning), Phân tích (Analyze) và Lập trình (Programming).
Nhà phân tích dữ liệu, Nhà khoa học dữ liệu, Nhà phân tích kinh doanh, Kỹ sư dữ liệu và Kỹ sư máy học là một vài trong số các vị trí nổi bật trong khoa học dữ liệu. Những người làm việc trong khoa học dữ liệu có thể dễ dàng di chuyển từ một loại khoa học dữ liệu sang loại khác nếu họ có thể xây dựng các kỹ năng mới.
Ngành Khoa học Dữ liệu được chia thành nhiều lĩnh vực