Nội dung đăng tải như sau: "Cần danh sách học sinh lớp 10 vừa nhập học tại TP.HCM, tập trung vào các quận 7, quận 8, huyện Nhà Bè, huyện Bình Chánh". Ngay lập tức đã có ba người liên lạc chào hàng.
Kiểu gì cũng có
Người đầu tiên tên Đăng cho biết đang sống tại Hà Nội nhưng khẳng định có đầy đủ thông tin học sinh học tại TP.HCM. Qua Telegram, Đăng cung cấp 30 số điện thoại kèm tên của các học sinh hoặc phụ huynh để khách hàng gọi thử. Hầu hết số điện thoại Đăng cung cấp khớp thực tế. "Nếu không lọc dữ liệu theo quận huyện, mỗi số giá 7 đồng. Nếu lọc, giá là 10 đồng một số" - Đăng báo giá.
Người thứ hai tên Hiếu cho biết có thể cung cấp ngay khoảng 3.000 thông tin học sinh theo địa bàn được yêu cầu. Mỗi học sinh trong kho dữ liệu được phân theo từng lớp và trường. Tuy nhiên, Hiếu chia sẻ do học sinh lớp 10 mới vào trường nên hiện dữ liệu sẽ có một số sai sót và cần hiệu chỉnh. Sau khoảng 2 tiếng tính toán, Hiếu chốt lại có thể cấp tổng cộng 2.666 thông tin học sinh lớp 10 mới, chủ yếu ở các quận 7, 8, huyện Nhà Bè.
Hiếu gửi chúng tôi một danh sách kiểm tra dữ liệu, là một phần của danh sách học sinh lớp 9 năm học 2022 - 2023, tức những bạn sẽ lên lớp 10 năm học 2023 - 2024 này. Phía trên danh sách ghi lớp 9A1 của Trường THCS H.T.P. thuộc Q.7, TP.HCM. Ở mỗi hàng, ngoài họ tên, giới tính, ngày sinh và số điện thoại thì còn có cả mã định danh học sinh.
"Giá lẻ tôi thường lấy là 1.000 đồng cho mỗi thông tin học sinh. Nếu anh lấy hết chỗ này, tôi tính 2,4 triệu đồng" - Hiếu nói.
Nghe chúng tôi than mắc và kể có người chào giá chỉ 7 đồng cho một dữ liệu học sinh, Hiếu khẳng định: "Chỗ báo giá đó chắc chắn lừa đảo. Nếu với giá 7 đồng, anh mua 3.000 dữ liệu thì chỉ tốn 21.000 đồng. Không thể rẻ như vậy được. Họ có thể cho anh một vài số thử đúng, nhưng sau khi anh chuyển tiền, họ sẽ đưa danh sách sai. Có khi họ cắt liên lạc luôn".
Người thứ ba tên Long ưu tiên bán dữ liệu số lượng lớn. Long tư vấn nên mua gói có số điện thoại của học sinh và số của cha mẹ. Bởi theo Long, cha mẹ mới là người bỏ tiền cho con cái đi học, do đó nếu cần gọi điện thoại để tư vấn chương trình học thì nên gọi cho phụ huynh trước. Ngoài ra, càng mua nhiều thì đơn giá sẽ càng rẻ.
"Dữ liệu của mình lấy từ ngay các trường học nên bạn yên tâm. Mỗi dữ liệu sẽ có năm sinh, tên tuổi, địa chỉ, tên cha mẹ, số điện thoại. Nếu bạn mua 5.000 số điện thoại, mình lấy 300 đồng mỗi số. Còn bạn mua 10.000 số thì mình lấy giá 200 đồng mỗi số. Bên mình, các trung tâm tiếng Anh và trại hè khi vô mùa họ lấy ít nhất là 10.000 số, thường thì trên 20.000 số" - Long nói.
Khai thác trực tiếp từ trường học
Mạng xã hội hiện có hàng chục nhóm mua bán thông tin, dữ liệu khách hàng, trong đó có dữ liệu phụ huynh và học sinh. Các nhóm có từ vài ngàn đến vài chục ngàn thành viên, hoạt động ở cả chế độ kín, riêng tư lẫn công khai. Bên cạnh Facebook, các nhóm mua bán dữ liệu còn đang hoạt động sôi nổi trên nền tảng Telegram.
"Thông tin bao test, "bảo hành" 1-1, bất cứ số điện thoại nào sai sẽ được bù ngay số khác" - một quảng cáo viết.
M.Q. - công tác tại phòng marketing ở một cơ sở giáo dục nghề nghiệp trên địa bàn TP.HCM - cho biết mỗi năm đơn vị thường mua khoảng 100.000 số điện thoại học sinh ở TP.HCM, tập trung vào hai khối lớp 9 và lớp 12. Từ số điện thoại, bộ phận marketing sẽ quét Zalo và chạy quảng cáo các khóa học. Những học sinh thu hút bởi các quảng cáo này sẽ được bộ phận marketing tiếp tục nhắn tin tư vấn chương trình.
Ở những địa bàn "chiến lược" (những quận huyện có vị trí gần các cơ sở của trường), bộ phận marketing sẽ "chăm sóc" kỹ hơn, có thể nhắn tin hoặc gọi điện thoại. Thời gian gọi và nhắn tin rơi vào cao điểm trước và sau các đợt thi tuyển.
"Xác suất học sinh quan tâm thường không cao, nhưng dù sao đây cũng là một kênh tìm kiếm người học" - M.Q. nói.
Trong khi đó, T.L. - công tác ở một trung tâm kỹ năng sống tại TP.HCM - cho biết đơn vị có kế hoạch tự thu thập thông tin. Các thông tin này được lấy trực tiếp từ các trường theo nguyên tắc "win-win". L. giải thích trong năm trung tâm sẽ đến trường phổ thông để tổ chức sự kiện, cuộc thi hoặc tặng quà, học bổng. Các hoạt động thường miễn phí.
Đổi lại, trung tâm sẽ "xin" trường học danh sách học sinh của trường. Thông tin từ nhiều trường sẽ được tập hợp và được sử dụng để gọi điện quảng cáo các khóa học khi đến thời điểm thích hợp. Theo L., cách làm này vừa đảm bảo có được thông tin vừa giúp phụ huynh, học sinh trong trường nhớ đến thương hiệu trung tâm, thuận tiện hơn khi nghe quảng cáo.
30 triệu đồng "bao lô"
Đầu tháng 7-2023, trên một nhóm mua bán thông tin học sinh, tài khoản H.H. đăng tải thông tin sẽ "nhượng" lại dữ liệu của tất cả học sinh khóa 2005 trên địa bàn TP.HCM. Đây là lứa học sinh vừa tốt nghiệp THPT. Liên hệ với H., chúng tôi được giới thiệu file dữ liệu sẽ bao gồm họ và tên, giới tính, ngày sinh, số điện thoại, email và địa chỉ liên hệ của học sinh. Địa chỉ liên hệ ghi đến số nhà, đường, phường xã.
"Tổng cộng tôi có 85.000 số. Giá toàn file là 30 triệu đồng. File này tôi lấy từ nguồn rất uy tín nên đảm bảo chính xác. Nếu lấy lẻ, mỗi số tôi lấy 400 đồng" - H. nói. Thấy khách hàng có vẻ chần chừ, H. gửi một file Excel các thông tin học sinh sinh năm 2005 cho kiểm tra thử.
Điều bất ngờ, dù chỉ là file thử, dữ liệu bên trong có đến 10.000 thông tin học sinh với đầy đủ số điện thoại và địa chỉ. Dữ liệu thử này không có tên trường lớp cũng như không được sắp xếp theo một thứ tự nhất định. Nhiều dòng thông tin của học sinh còn được "tặng" thêm số điện thoại của phụ huynh.
Bán luôn tài khoản Facebook
Ngoài thống kê số điện thoại, một số chủ hàng rao bán thông tin Facebook. Với "mặt hàng" này, đối tượng bị bán thường là thông tin của sinh viên. Từ danh sách Facebook thu về, những đơn vị kinh doanh có thể dễ tiếp cận và chạy quảng cáo các sản phẩm, dịch vụ của mình.
Điển hình trong một bài đăng, tài khoản B. rao bán dữ liệu của khoảng 40.000 sinh viên tại Hà Nội và TP.HCM bao gồm Facebook, email. Các sinh viên này còn được thống kê cụ thể về ngành học, trường đại học. Giá bán bộ dữ liệu 40.000 sinh viên chỉ... 500.000 đồng.
3 nguồn rò rỉ thông tin
Theo ông Võ Đỗ Thắng, giám đốc Trung tâm an ninh mạng Athena, có ba nguồn chủ yếu làm lộ thông tin của học sinh. Nguồn thứ nhất là lỗ hổng về mặt kỹ thuật. Máy móc nhập liệu của các trường có thể bị kẻ xấu hack, xâm nhập rồi từ đó lấy đi dữ liệu.
Nguồn thứ hai dễ dàng hơn là từ tổ nhập liệu của các trường học. Việc copy hay gửi email các file thông tin của học sinh quá dễ dàng, chỉ bằng một hai thao tác trên bàn phím. Vì vậy, rất có thể một số người trong các tổ nhập liệu của trường đã sao lưu và đưa thông tin ra ngoài.
Cuối cùng là từ những nhóm chuyên đi thu thập dữ liệu. Ông Thắng cho rằng các nhóm này có thể thu thập dữ liệu từ rất nhiều nơi, không nhất thiết phải từ các trường học. Việc thu thập có thể được tiến hành và lưu trữ qua rất nhiều năm, do những thông tin cơ bản của học sinh như tên tuổi, cha mẹ và thậm chí cả số điện thoại của phụ huynh thường sẽ không thay đổi qua các cấp học.
Ông Thắng lấy ví dụ một nhóm thu thập thông tin có thể khai thác từ các phòng... khám thai. Từ đó, nhóm sẽ có dữ liệu về một nhóm trẻ em sinh cùng năm kèm theo liên hệ của cha mẹ. Chỉ 2-3 năm sau, các em này sẽ vào nhà trẻ, mẫu giáo, rồi đến tuổi vào tiểu học, tuổi phải học tiếng Anh... Như vậy, chỉ cần thu thập từ nguồn này, các đối tượng có thể sử dụng dữ liệu xuyên suốt cho 10 - 15 năm sau.
Phòng An ninh mạng và Phòng chống tội phạm sử dụng công nghệ cao (PA05, Công an Đà Nẵng) vừa phá một đường dây thu thập, mua bán trái phép thông tin tài khoản ngân hàng với sự tiếp tay của chính nhân viên ngân hàng.