Sau hai năm, công nghệ cuối cùng cũng mang lại tầm nhìn ban đầu

Đại tu Siri AI: Trợ lý ảo của Apple cuối cùng đã hiện thực hóa tầm nhìn ban đầu, bắt đầu bằng việc hỗ trợ ngôn ngữ tiếng Anh
Trong một bước phát triển quan trọng nhằm giải quyết những nỗi thất vọng bấy lâu nay của người dùng, Apple chuẩn bị triển khai một cuộc đại tu toàn diện cho Siri AI, đưa chức năng đến gần hơn với tầm nhìn đầy tham vọng ban đầu được hình thành cách đây hai năm. Bản cập nhật thể hiện sự tái hiện cơ bản về cách trợ lý ảo xử lý và phản hồi các yêu cầu của người dùng, mặc dù ban đầu, những cải tiến này sẽ chỉ giới hạn ở người dùng nói tiếng Anh.
Theo các nguồn tin quen thuộc với vấn đề này, bản cập nhật Siri sắp tới thể hiện sự khác biệt so với phiên bản hiện tại mà nhiều người dùng ngày càng thấy thiếu sót so với các đối thủ cạnh tranh. Việc triển khai mới dự kiến sẽ giải quyết những hạn chế cốt lõi về khả năng hiểu ngôn ngữ tự nhiên, nhận thức theo ngữ cảnh và khả năng thực thi nhiệm vụ đã gây khó khăn cho trợ lý kỹ thuật số trong nhiều năm.
Bối cảnh: Sự phát triển của Siri và những hạn chế của nó
Kể từ khi được giới thiệu vào năm 2011 cùng với iPhone 4S, Siri đã trở thành nền tảng cho trải nghiệm người dùng của Apple. Tuy nhiên, trợ lý này đã phải vật lộn để theo kịp những tiến bộ của các đối thủ cạnh tranh như Google Assistant, Amazon Alexa và gần đây là các mô hình ngôn ngữ phức tạp từ OpenAI và các mô hình khác.
"Tầm nhìn ban đầu" được đề cập trong thông báo có thể xuất phát từ các kế hoạch đầy tham vọng của Apple được công bố tại Hội nghị các nhà phát triển toàn cầu (WWDC) năm 2021, nơi công ty phác thảo một Siri mạnh mẽ hơn, nhận biết ngữ cảnh có thể hiểu rõ hơn các yêu cầu phức tạp và duy trì tính liên tục của cuộc trò chuyện trên nhiều hoạt động tương tác.
Những cải tiến kỹ thuật trong Siri mới
Cuộc đại tu Siri sắp tới được cho là sẽ kết hợp một số cải tiến kỹ thuật quan trọng:
- Xử lý ngôn ngữ tự nhiên nâng cao: Chuyển từ khớp mẫu sang hiểu ngữ cảnh thực sự
- Xử lý trên thiết bị: Tăng khả năng xử lý yêu cầu mà không phụ thuộc liên tục vào đám mây
- Tích hợp nhiều ứng dụng: Tích hợp sâu hơn với các ứng dụng của bên thứ ba để hoàn thành nhiệm vụ toàn diện hơn
- Hỗ trợ chủ động: Dự đoán nhu cầu của người dùng dựa trên mô hình và bối cảnh sử dụng
- Bộ nhớ được cải thiện: Khả năng lưu giữ thông tin tốt hơn trong các cuộc trò chuyện và phiên họp
Những cải tiến này phù hợp với việc Apple không ngừng chú trọng đến quyền riêng tư trong khi cố gắng cạnh tranh với các hệ thống AI có năng lực cao hơn, phụ thuộc nhiều vào xử lý đám mây và bộ dữ liệu khổng lồ.
Bản phát hành ban đầu chỉ bằng tiếng Anh: Phương pháp triển khai chiến lược
Quyết định hạn chế nâng cấp Siri AI ban đầu cho những người nói tiếng Anh vừa mang tính chiến lược vừa thực dụng về mặt kỹ thuật. Quá trình xử lý ngôn ngữ đặt ra những thách thức đặc biệt trên các ngôn ngữ khác nhau, với các biến thể về cú pháp, thành ngữ và bối cảnh văn hóa đòi hỏi dữ liệu đào tạo sâu rộng và tài nguyên tính toán.
Trước đây, Apple đã áp dụng phương pháp triển khai theo từng giai đoạn đối với những cải tiến lớn của Siri, trong đó tiếng Anh thường đóng vai trò nền tảng trước khi mở rộng sang các ngôn ngữ khác. Cách tiếp cận này cho phép công ty tinh chỉnh công nghệ dựa trên việc sử dụng trong thế giới thực trước khi áp dụng nó vào các tình huống ngôn ngữ phức tạp hơn.
Các nhà phân tích trong ngành cho rằng chiến lược ưu tiên tiếng Anh này cũng phản ánh mong muốn của Apple trong việc thiết lập nền tảng vững chắc về hiệu suất trước khi giải quyết những thách thức bổ sung về hỗ trợ đa ngôn ngữ, vốn ngày càng trở nên quan trọng trên thị trường toàn cầu của Apple.
Tác động đến trải nghiệm người dùng
Siri nâng cao dự kiến sẽ thay đổi căn bản cách người dùng tương tác với các thiết bị Apple của họ. Thay vì yêu cầu các cụm từ chính xác, giống như mệnh lệnh, người dùng có thể nói tự nhiên hơn, nhờ trợ lý hiểu rõ hơn ý định ngay cả khi cách diễn đạt không hoàn hảo.
Bảng: Những cải tiến dự kiến về khả năng của Siri
| Lĩnh vực năng lực | Siri hiện tại | Siri nâng cao (tiếng Anh) |
|---|---|---|
| Xử lý yêu cầu phức tạp | Giới hạn ở các nhiệm vụ đơn giản, một bước | Hoàn thành nhiệm vụ nhiều bước với sự hiểu biết theo ngữ cảnh |
| Cuộc trò chuyện liên tục | Thường xuyên mất ngữ cảnh giữa các lần tương tác | Duy trì bối cảnh trên nhiều sàn giao dịch |
| Tích hợp ứng dụng của bên thứ ba | Chức năng cơ bản với sự hỗ trợ ứng dụng hạn chế | Tích hợp sâu với các ứng dụng phổ biến để tự động hóa tác vụ toàn diện |
| Cá nhân hóa | Nhận dạng tùy chọn cơ bản của người dùng | Hỗ trợ chủ động dựa trên mô hình và thói quen sử dụng |
TechOffice