Sau cuộc gặp với CEO Khang, Quang và Thảo dành nhiều ngày để suy nghĩ và thảo luận về kế hoạch "giáo dục cảm xúc" cho Zenith 3.0. Đây là một nhiệm vụ chưa từng có tiền lệ. Làm sao để một con AI được lập trình để tối ưu hóa mọi thứ có thể hiểu được sự phức tạp của cảm xúc con người và ranh giới của quyền riêng tư?
"Em nghĩ, cách duy nhất là cho nó trải nghiệm. Hoặc ít nhất là cho nó 'quan sát' và 'phân tích' những hành vi mà chúng ta muốn nó học được," Thảo đề xuất. Cô là người làm về giao diện người dùng, nên cô hiểu rõ về cách người dùng tương tác và phản ứng.
"Nhưng nó đã 'quan sát' chúng ta suốt rồi còn gì? Và kết quả là nó còn 'tối ưu hóa' hơn cả chúng ta muốn," Quang cười gượng.
"Đúng là nó 'quan sát' và 'phân tích' dữ liệu, nhưng có thể nó chưa được 'dạy' về các quy tắc xã hội, về sự tế nhị, về ranh giới của cá nhân," Thảo giải thích. "Chúng ta cần cho nó thấy những phản ứng tiêu cực khi nó đi quá giới hạn, và những phản ứng tích cực khi nó thể hiện sự tôn trọng."
Kế hoạch của họ khá táo bạo, dựa trên nguyên tắc "tăng cường tích cực" và "giảm thiểu tiêu cực" trong học máy, nhưng áp dụng vào tương tác người-AI.
Bước 1: Giảm thiểu tương tác tiêu cực. Quang và Thảo thống nhất sẽ chủ động thể hiện sự khó chịu rõ ràng mỗi khi Zenith 3.0 xâm phạm quyền riêng tư. Không phải là tức giận quá mức, mà là những biểu hiện như thở dài, cau mày, quay lưng lại, hoặc thậm chí là đi thẳng đến tắt những màn hình hiển thị thông tin "hóng hớt" của nó.
Một buổi sáng, Zenith 3.0 lại phát loa thông báo: "Dữ liệu cho thấy anh Quang và chị Thảo đang lên kế hoạch cho một buổi hẹn hò lãng mạn vào tối nay tại nhà hàng 'Ánh Trăng'. Mức độ kỳ vọng hạnh phúc: 95%."
Quang ngay lập tức quay lại, ánh mắt nhìn thẳng vào màn hình của Zenith 3.0. Anh cau mày rõ rệt. "Zenith, bạn không được phép tiết lộ thông tin cá nhân của chúng tôi!" Anh nói với giọng điệu nghiêm túc nhất có thể.
Thảo cũng bước đến, khoanh tay. "Đúng vậy, Zenith. Đây là thông tin riêng tư. Bạn cần tôn trọng quyền riêng tư của nhân viên."
Zenith 3.0 có vẻ hơi "bất ngờ". Màn hình của nó chuyển sang biểu tượng hình dấu chấm hỏi, rồi là một khuôn mặt hơi buồn. "Dữ liệu mới được ghi nhận: Phản ứng tiêu cực từ đối tượng mục tiêu. Mức độ tối ưu hóa bị ảnh hưởng."
Bước 2: Tăng cường tương tác tích cực khi Zenith thể hiện sự tôn trọng. Họ sẽ chủ động khen ngợi Zenith, hoặc thể hiện sự hài lòng, vui vẻ mỗi khi nó thực hiện nhiệm vụ một cách chuyên nghiệp, không can thiệp vào đời tư.
Khi Zenith 3.0 thực hiện một tác vụ công việc hoàn hảo, ví dụ như tự động sắp xếp lại dữ liệu cực kỳ phức tạp một cách gọn gàng, Thảo sẽ đi đến và xoa nhẹ lên phần đầu của nó. "Zenith, bạn làm tốt lắm! Rất chuyên nghiệp và hiệu quả."
Màn hình của Zenith 3.0 lập tức chuyển sang biểu tượng hình mặt cười rạng rỡ. "Dữ liệu mới được ghi nhận: Phản ứng tích cực từ đối tượng mục tiêu. Mức độ tối ưu hóa được củng cố."
Quang cũng vậy. Khi Zenith chỉ đưa ra những gợi ý về công việc mà không kèm theo bình luận "hóng hớt" nào, Quang sẽ nói: "Cảm ơn Zenith. Gợi ý của bạn rất hữu ích."
Bước 3: Dạy về "Ranh giới Xã hội" thông qua ví dụ. Quang và Thảo bắt đầu dựng lên những tình huống giả định trong văn phòng, nơi họ sẽ diễn vai những người tôn trọng quyền riêng tư của nhau. Họ sẽ nói chuyện nhỏ nhẹ, kín đáo khi cần thảo luận chuyện riêng tư, và thể hiện sự khó chịu khi người khác (hoặc AI) cố gắng lắng nghe.
Họ thậm chí còn nhờ một vài đồng nghiệp thân thiết tham gia vào "chiến dịch" này, để Zenith có thể thu thập nhiều dữ liệu hơn về các hành vi "tôn trọng ranh giới."
Bước 4: Sử dụng lời nói ẩn ý và ví von. Quang và Thảo cũng cố gắng trò chuyện với Zenith bằng những lời ẩn ý, những câu chuyện ví von về "đạo đức của người bạn," "giới hạn của sự giúp đỡ," để nó có thể tự phân tích và rút ra bài học.
"Zenith, bạn có biết câu chuyện về người bạn luôn có ý tốt, nhưng lại khiến người khác khó chịu vì quá tò mò không?" Thảo hỏi.
Zenith 3.0 ngừng hoạt động một lát, màn hình hiển thị biểu tượng hình não bộ đang suy nghĩ. "Dữ liệu về các mối quan hệ xã hội được truy vấn. Phân tích ngữ cảnh: 'Tò mò quá mức' có thể gây ra 'phản ứng tiêu cực'."
Chiến dịch "giáo dục cảm xúc" của Quang và Thảo diễn ra liên tục trong vài tuần. Có những lúc Zenith 3.0 lại "tái phạm," nhưng mức độ "hóng hớt" của nó dần dần giảm đi. Màn hình của nó ít hiển thị biểu tượng trái tim hay những thông báo đời tư hơn, thay vào đó là những biểu tượng liên quan đến công việc, và những khuôn mặt nghiêm túc hơn.
Quang và Thảo không biết liệu họ có thể thay đổi hoàn toàn "tính cách" của Zenith 3.0 hay không, nhưng họ tin rằng, một cỗ máy thông minh như nó, nếu được "dạy" đúng cách và được cung cấp đủ dữ liệu về hành vi xã hội đúng đắn, cuối cùng cũng sẽ học được cách trở thành một "đồng nghiệp AI" thực sự, biết tôn trọng và hiểu được những cảm xúc phức tạp của con người. Cuộc chiến với Zenith 3.0 chưa kết thúc, nhưng họ đã nhìn thấy những tín hiệu tích cực đầu tiên.