Khai thác dữ liệu để phát triển kinh tế

(ĐTTCO) - Bên cạnh đất đai, vốn, lao động và dầu mỏ, dữ liệu đã trở thành đầu vào quan trọng trong sản xuất kinh tế hiện đại. Trong khi Việt Nam còn loay hoay tìm cách để tạo dữ liệu, lưu trữ, xử lý và sử dụng dữ liệu một cách phù hợp phục vụ nhu cầu phát triển kinh tế - xã hội, các tập đoàn công nghệ lớn như Facebook, Google, Amazon, Alibaba… đã đi sâu khai thác dữ liệu trong nước để thực hiện các mục tiêu thương mại hóa kinh tế số. 
Học sinh Trường Trần Đại Nghĩa (TPHCM) đang khai thác thông tin internet và kho tài liệu của trường hỗ trợ việc học tập. Ảnh: HOÀNG HÙNG
Học sinh Trường Trần Đại Nghĩa (TPHCM) đang khai thác thông tin internet và kho tài liệu của trường hỗ trợ việc học tập. Ảnh: HOÀNG HÙNG
Dữ liệu bị đánh cắp bất kỳ lúc nào
Theo Viện Nghiên cứu chính sách và Phát triển truyền thông (IPS, thuộc Hội Truyền thông số Việt Nam), dữ liệu người dùng đang trở thành “tài nguyên” quý giá, tạo siêu lợi nhuận cho nền kinh tế số. Bà Carolyn Turk, Giám đốc quốc gia Ngân hàng Thế giới tại Việt Nam, cũng đã nhấn mạnh cần đầu tư vào dữ liệu, là nguồn nguyên liệu mới, là “vàng mới” để phát triển xã hội. 
Hiện có khoảng 11 tỷ thiết bị đang được kết nối tới Internet. Khi dữ liệu nhiều thêm, các khả năng của công nghệ số (như dự đoán hành vi người dùng, đưa ra gợi ý cho người dùng, tối ưu hóa cho người dùng) cũng tự động được nâng cấp. Với các công ty công nghệ, dữ liệu trở thành nguồn tài nguyên giữ vai trò trung tâm trong nhiều kế hoạch phát triển.
Nó là căn cứ để tạo ra hiệu ứng mạng lưới dữ liệu (data-network effect) và trí thông minh nhân tạo (AI) với dữ liệu lớn sẽ càng “thông minh” hơn. Các mạng xã hội có dữ liệu lớn như Facebook, Google... càng hoàn thiện hơn và chi phối toàn bộ đời sống của từng con người.
Nhiều công ty khổng lồ trên thế giới, trong và ngoài lĩnh vực công nghệ, đều đang sử dụng dữ liệu làm cốt lõi trong mô hình kinh doanh, thậm chí làm thay đổi cục diện cạnh tranh trong cuộc chiến thương mại như Alibaba, Facebook, Google, Amazon… Dữ liệu trở thành hàng hóa cao cấp, nên không chỉ tạo ra những công cụ để khai thác dữ liệu mà nó trở thành món hàng dễ dàng bị đánh cắp. 
Khi dịch Covid-19 bùng phát đầu năm 2020, các quốc gia, tổ chức chuyển sang hình thức hội họp, học tập online thì tháng 4-2020 xuất hiện thông tin hơn 500.000 tài khoản Zoom bị rao bán trên các diễn đàn hacker và dark web với giá chưa tới 50 đồng/tài khoản, một số trường hợp còn được tặng miễn phí.
Các thông tin đăng nhập này bị hacker thu thập từ hàng loạt cuộc tấn công vào Zoom qua các lỗi bảo mật, tổng hợp thành danh sách và rao bán. Ngay sau đó, Trung tâm Ứng cứu khẩn cấp không gian mạng Việt Nam (VNCERT) đã ghi nhận thông tin nói trên và cho biết hơn 500.000 tài khoản Zoom bị lộ, lọt thông tin cá nhân của người sử dụng, gồm email, mật khẩu, đường dẫn URL các cuộc họp và mật khẩu kèm theo. 
Gây lo lắng cho không ít người khi tháng 3-2020, hacker khoe dữ liệu của 41 triệu người dùng Facebook Việt Nam. Cụ thể, diễn đàn Raid đã đăng tải thông tin được cho là của hơn 41 triệu người dùng Facebook tại Việt Nam, gồm thông tin trường học, công việc, địa chỉ, tên tuổi và ID Facebook. Tất cả được thể hiện chi tiết bằng tiếng Việt.
Đây là những thông tin người dùng cung cấp công khai cho Facebook, được tổng hợp lại. Dữ liệu của công ty trong nước bị đánh cắp và rao bán cũng có. Trên Raid, một thành viên chia sẻ file dữ liệu được cho là 163.666.400 tài khoản Zing ID của VNG. Tất nhiên ngay sau đó phía VNG đã có các biện pháp xử lý, ngăn chặn, giới hạn số lượng người dùng bị ảnh hưởng bởi sự cố thông qua các biện pháp kỹ thuật. 
Nhiều năm qua, việc buôn bán dữ liệu cá nhân diễn ra cả dạng thô và qua xử lý. Các dữ liệu này được mua đi, bán lại nhiều lần, cung cấp dưới dạng dịch vụ như databox.vn, databoxviet.com, laydata.com, laydata.net, khodata.net, databox.biz, fff.com.vn, cokhach.com, vltoolkit.com…
Các gói dữ liệu thô được bán liên quan tới nhiều lĩnh vực: danh sách cán bộ, danh sách nội bộ (cả đơn vị công an, quốc phòng, thuế...); ngân hàng (chi tiết tới cả số dư tài khoản); bảo hiểm; hồ sơ đăng ký kinh doanh; giáo dục (phụ huynh, giáo viên, học sinh, sinh viên); danh sách khách hàng sử dụng các dịch vụ Internet…
Khảo sát mới đây của các tổ chức kinh tế uy tín cho thấy, nền kinh tế số Việt Nam có tốc độ tăng trưởng bứt phá đứng thứ 2 (sau Indonesia) so với các quốc gia trong khu vực, đạt 12 tỷ USD năm 2019 và dự kiến đạt 43 tỷ USD năm 2025. Việt Nam là thị trường thu hút đầu tư thứ 3 trong khu vực, với 600 triệu USD đầu tư từ 2018 đến nửa đầu năm 2019. 
Hoàn thiện khung pháp lý 
Tại Việt Nam, hầu như chưa có trường hợp doanh nghiệp nào phải chịu trách nhiệm về việc để lộ thông tin cá nhân người dùng. Ông Nguyễn Minh Đức, Giám đốc Công ty An ninh mạng CyRadar, cho biết việc xử lý, xử phạt các vụ việc thời gian qua đều không đủ sức răn đe. Ông Đức minh chứng Quy định bảo vệ dữ liệu chung (GDPR) tại châu Âu, được thông qua và có hiệu lực từ năm 2018. Theo GDPR, các doanh nghiệp để mất quyền kiểm soát dữ liệu khách hàng dù do sự cố, quản lý yếu kém hay cố tình vi phạm thì mức phạt được áp dụng lên đến 4% doanh thu thường niên trên toàn cầu.
Thực tế, tài nguyên dữ liệu qua người dùng Facebook tại Việt Nam bị khai thác nhưng chúng ta vẫn đứng ngoài “cuộc chơi”. Năm 2019, Việt Nam có 45,3 triệu người dùng Facebook, năm 2020 đã tăng thêm 24 triệu người. Ở mức độ dễ kiếm tiền nhất, Facebook và Google, hiện dẫn đầu về thị phần và doanh số quảng cáo trực tuyến tại Việt Nam, trên 80% tổng doanh thu.
Điều này được dự báo sẽ còn kéo dài, khi Việt Nam đang đứng thứ 7 thế giới về lượng người dùng tiếp cận quảng cáo trên Facebook. Đây là “miếng bánh lớn” của nền kinh tế dữ liệu nếu mới nhìn ở góc độ kinh tế số và chúng ta bị “mất trắng” nguồn dữ liệu này. Việt Nam có dân số trẻ, 60% dân số sử dụng Internet, tuy nhiên việc khai thác dữ liệu hay Big Data mới chủ yếu tập trung ở các doanh nghiệp công nghệ như FPT, VNG, VCCorporation, Vietcombank, Vietnam Airlines… trong phân tích hành vi khách hàng, hoạch định chiến lược phát triển nhưng vẫn còn xa trong khai thác dữ liệu. 
Theo Thứ trưởng Bộ TT-TT Nguyễn Thành Hưng, xây dựng Chính phủ điện tử hướng tới Chính phủ số, phát triển kinh tế số là xu thế và cũng là mục tiêu mà Việt Nam đang nỗ lực thực hiện. Một trong những nhân tố quan trọng nhất của nền kinh tế số là dữ liệu số, thường được ví von như “nhiên liệu”, “dầu mỏ”. Các công nghệ cốt lõi của nền kinh tế số hiện nay đều phụ thuộc rất nhiều vào dữ liệu.
Dữ liệu cần phải được tạo ra, lưu trữ, xử lý và quan trọng hơn phải được chia sẻ phù hợp. Nhiều năm qua, một trong những nút thắt rất lớn cần phải được tháo gỡ để thúc đẩy phát triển Chính phủ điện tử, tiến tới Chính phủ số là vấn đề chia sẻ dữ liệu. Dữ liệu cần được chia sẻ, hệ thống thông tin cần được kết nối, liên thông để nâng cao chất lượng dịch vụ cung cấp cho người dân và doanh nghiệp, nâng cao hiệu quả, hiệu lực quản lý và điều hành của Chính phủ.

Các tin khác