Bing. Nhóm của Google đã phát hiện ra rằng Microsoft sử dụng thanh công
cụ của mình để sao chép công cụ tìm kiếm của Google.
12
Ở thời điểm đó, đã có rất nhiều cuộc thảo luận về liệu Microsoft làm như
vậy có chấp nhận được hay không.
13
Microsoft sử dụng thanh công cụ của
Google để học và phát triển những thuật toán tốt hơn cho công cụ tìm kiếm
Bing của họ. Đa phần những gì người dùng đã làm là tìm kiếm trên Google
và rồi nhấp vào các kết quả đó. Vậy nên khi một cụm từ tìm kiếm hiếm có
và chỉ được tìm thấy trên Google (như “hiybbprqag”) và nếu nó được sử
dụng đủ (chính xác là điều mà những gì kỹ sư Google đang làm), máy của
Microsoft sẽ học. Thật thú vị, những gì mà Microsoft đã không làm – điều
mà rõ ràng có thể làm – là học cách bắt chước công cụ tìm kiếm của
Google biến đổi những cụm từ vô nghĩa thành có nghĩa.
14
Vấn đề chiến lược là khi bạn có AI (như công cụ tìm kiếm của Google), thì
nếu đối thủ cạnh tranh có thể quan sát dữ liệu được nhập vào (ví dụ một
truy vấn tìm kiếm) và dữ liệu đầu ra được báo cáo (ví dụ như danh sách các
trang web), thì nó có nguồn thông tin thô để AI học dưới sự giám sát và xây
dựng lại thuật toán. Công cụ tìm kiếm của Google có thể rất khó thực hiện,
nhưng trên lý thuyết, hoàn toàn có thể.
Năm 2016, các nhà nghiên cứu khoa học máy tính đã chỉ ra rằng những
thuật toán học sâu cụ thể đều dễ bị bắt chước.
15
Họ đã thử nghiệm khả năng
này trên một số nền tảng máy tự học quan trọng (bao gồm máy tự học
Amazon) và chứng minh rằng với số lượng truy vấn nhỏ (650 – 4.000), họ
có thể đảo ngược những mô hình đó tới mức xấp xỉ gần đúng, đôi khi là
hoàn hảo. Việc khai thác nhiều thuật toán máy tự học dẫn đến lỗ hổng này.
Sự bắt chước có thể dễ. Sau khi bạn đã thực hiện tất cả các công việc đào
tạo AI, cả thế giới sẽ biết cách vận hành của nó và nó có thể sẽ bị sao chép.
Nhưng đáng lo ngại hơn là sự chiếm đoạt kiến thức này có thể dẫn đến tình
huống những yếu tố xấu thao túng sự dự đoán và quá trình học một cách dễ
dàng. Một khi kẻ tấn công hiểu máy, máy trở nên dễ bị tổn thương hơn.