Big data
Dữ liệu lớn là một thuật ngữ rộng cho việc xử lý một tập hợp dữ liệu rất lớn và phức tạp mà các ứng dụng xử lý dữ liệu truyền thống không xử lý được. Bao gồm các thách thức phân tích, thu thập, giám sát dữ liệu, tìm kiếm, chia sẻ, lưu trữ, truyền nhận, trực quan hóa, truy vấn và tính riêng tư. Thuật ngữ này thường đơn giản là sử dụng để phân tích dự đoán hoặc là một số phương pháp tiên tiến khác rõ ràng để trích xuất giá trị từ dữ liệu mà ít khi đề cập đến kích thước của bộ dữ liệu. Độ chính xác trong dữ liệu lớn có thể dẫn tới ra quyết định tự tin hơn, và những quyết định tốt hơn có thể đưa đến kết quả hoạt động tốt hơn như giảm chi phí và rủi ro.
Thế giới đang chứng kiến sự bùng nổ của kỷ nguyên Big Data - Dữ liệu lớn. 90% dữ liệu của thế giới đã được tạo ra trong hai năm qua nhờ vào sự tăng trưởng nhanh chóng của IoT - Internet Vạn vật (Internet of things) và các thiết bị di động.
IoT đã làm cho lượng dữ liệu cần phân tích tăng lên rất nhiều. Các công ty cần phải thu thập tất cả dữ liệu có liên quan đến hoạt động kinh doanh đồng thời phải sàng lọc dữ liệu dư thừa và bảo vệ dữ liệu. Điều này đòi hỏi một cơ chế thật hiệu quả bao gồm phần mềm và các giao thức.
Có thể thấy trong mọi lĩnh vực, từ y tế, điện tử, sản xuất, công nghiệp, viễn thông, giải trí, bán lẻ, hàng không, ngân hàng, tài chính... từ khu vực công đến khu vực tư, dữ liệu là vũ khí tối thượng hết sức quan trọng. Ai nắm được thông tin, người đó rất dễ vượt lên dẫn đầu và bỏ xa những đối thủ còn lại. Ở Mỹ, chỉ riêng nhu cầu về các dịch vụ thông tin trong năm 2015, ước tính con số đã vượt 600 tỉ USD.
Tuy nhiên, làm chủ Big Data phụ thuộc rất nhiều vào năng lực của nguồn nhân sự trong doanh nghiệp, cơ sở hạ tầng của lưu trữ - xử lý - phân tích và các kỹ năng phân tích dữ liệu.
Tại DTT, chúng tôi có đội ngũ chuyên gia có nhiều kinh nghiệm đối với các công cụ (mã nguồn mở, như Hadoop, Casandra, Apache Spark, Kafka, ...) lưu trữ, xử lý, và phân tích dữ liệu lớn. Các chuyên gia của DTT đã sẵn sàng cung cấp các dịch vụ liên quan đến dữ liệu lớn như tư vấn, triển khai, bảo trì, … DTT hiện là đối tác của Cloudra - nhà cung cấp công cụ và dịch vụ dữ liệu lớn hàng đầu trên thế giới.