NGƯỜI VIỄN ĐÔNG

Nơi chia sẻ và lưu giữ các bài viết của Nam Nguyen

SAI LẦM LỚN NHẤT TRONG LĨNH VỰC AI

(Tác giả: Nguyễn Minh Hải) 


Sai lầm lớn nhất là nghĩ rằng học sâu và các kỹ thuật tương tự đã đủ hoàn thiện để bắt đầu xây dựng các công ty. Mọi người đánh giá thấp những khó khăn trong việc xây dựng các sản phẩm phần mềm nói chung ngay cả với công nghệ hoàn thiện và được hiểu rõ. Sử dụng các thư viện để xây dựng các giải pháp tùy chỉnh cho một trường hợp sử dụng cụ thể là một điều. Nhưng xây dựng các sản phẩm phần mềm hỗ trợ nhiều trường hợp sử dụng lại là chuyện hoàn toàn khác. Tôi dự đoán rằng phần lớn các công ty khởi nghiệp AI sẽ không bao giờ kiếm được tiền.


Điều này chủ yếu liên quan tới chất lượng và bảo mật sản phẩm. Với hầu hết các phần mềm, phát hiện ra một lỗi được coi là việc bắt được rận. Bạn sao chép nó, cô lập nó, xây dựng một trường hợp kiểm thử thất bại và sau đó sửa mã để làm cho nó vượt qua kiểm thử (và tất nhiên là toàn bộ bộ kiểm thử).
Với học máy, điều đó khó hơn. Với mạng neural học sâu, nó thậm chí còn khó khăn hơn nhiều. Tôi có thể biết làm thế nào điều chỉnh một thuật toán rừng ngẫu nhiên (ramdom forest algorithm ) để khắc phục một vấn đề. Nhưng với một NN là vô cùng khó.


Ví dụ: Bạn tạo một hệ thống học sâu nhận dạng khuôn mặt dùng để xác thực cho phép chủ nhân truy cập vào điện thoại của họ. Ngẫu nhiên bạn phát hiện ra rằng nếu bạn giữ điện thoại ở nơi có ánh sáng mạnh, việc xác thực sẽ bị hỗn loạn. Làm thế nào để bạn khắc phục điều đó? Vâng, có lẽ bạn có thể. Tiếp theo bạn nhận ra rằng ai đó đã tạo ra một hình ảnh đối nghịch (adversarial image) vạn năng truy cập được mọi máy. Bạn sẽ khắc phục điều đó như thế nào? Điều gì xảy ra nếu trên thực tế có một thuật toán để tạo ra số lượng vô hạn các ảnh đối nghịch như vậy?


Vấn đề tiềm ẩn ở đây là thuật toán không phải là thứ chúng ta thực sự hiểu. Chúng ta không thể lý giải về hành vi của nó theo bất cứ nghĩa nào ngoài phép thử và sai. Hãy so sánh điều đó với một thư viện mã hóa dựa trên các định lý toán học từ lý thuyết số. Với mã hóa khóa công khai việc giải mã là không khả thi ngoài việc thử và sai theo nghĩa nếu được cài đặt đúng, về cơ bản chúng ta có thể đảm bảo tính đúng đắn và bất khả xâm phạm dù đôi khi ngẫu nhiên chỉ cần một vài phép thử chúng ta tìm lại được bản gốc.
Giải pháp học sâu không có đặc điểm đó. Khác với thuật toán rừng ngẫu nhiên ở trên, mạng neural học sâu không có khả năng lý giải cách chúng đưa ra lời giải. Do đó chúng ta không bao giờ thực sự biết chúng sẽ làm gì cho đến khi chúng hoàn thành tác vụ. Người ta sẽ không hiểu được tại sao chúng sai và khó có thể chỉnh sửa như đối với rừng ngẫu nhiên. Về mặt bảo mật, chúng có bề mặt tấn công lớn, và tệ hơn, chúng ta thậm chí còn không biết nó lớn đến mức nào. Lý do cơ bản của điều này là chúng được xây dựng hoàn toàn từ một danh sách hữu hạn các ví dụ. Hành vi của chúng với vô hạn các khả năng khác là không thể biết. Đó không phải là trường hợp với các hàm toán học mà chúng ta viết một cách tường minh. Ta biết rằng hàm 1 + x ^ 2 sẽ không bao giờ cho giá trị âm. Ta biết chắc chắn điều đó với bất kỳ danh sách vô hạn các khả năng có thể. Ta biết rằng nếu ta tổng hợp các hàm lồi, kết quả luôn luôn là hàm lồi. Sẽ không bao giờ có một ví dụ phản ví dụ cho kết luận đó.


Những thứ mà chúng ta biết chắc chắn có thể được kết hợp cùng với những thứ khác và dẫn đến các hệ thống phức tạp lớn mà chúng ta vẫn có thể đưa ra một số đảm bảo. Đó là những loại hệ thống mà khách hàng thường muốn mua. Chúng ta phải quan tâm đến những gì một hệ thống sẽ không bao giờ làm chứ không chỉ những gì nó có thể làm. Những hệ thống như vậy được xây dựng trên nền tảng toán học vững chắc. Học sâu thì không. Đó chính là lỗ hổng cơ bản của nó.


Điều này dẫn tới hệ quả là các loại giải pháp đưa ra chỉ được sử dụng như đồ chơi (như dạng Alexa trợ giúp chọn trang phục phù hợp của Amazon) chứ không phải các phần mềm nghiêm cẩn thực sự như cho xe tự lái. Nói một cách khác chúng sẽ không bao giờ thực sự thành công ngoài giới hạn của nhận thức. Nhiều người dường như nghĩ rằng chúng ta đang trên con đường phát triển một bộ não điện tử. Thực chất thứ chúng ta đang phát triển không có gì hơn là một con mắt điện tử. Đó là một thứ rất hữu ích nhưng không thực sự là trí tuệ nhân tạo. Và như vậy nó sẽ là một bất ngờ lớn đối với nhiều người làm việc trong AI hôm nay và sẽ dẫn đến vỡ mộng với nhiều nỗ lực đang tiến hành.



Ý kiến không được cho phép