Skip to content
··6 phút đọc

Sẵn sàng cho trải nghiệm tìm kiếm tốt hơn với tích hợp ChatGPT của Microsoft?

Tích hợp ChatGPT-Bing của Microsoft giải quyết vấn đề dữ liệu, nhưng thách thức thực sự là thiết kế giao diện biết khi nào cần đưa một câu trả lời và khi nào cần nhiều.

Bài viết này được viết năm 2023. Một số chi tiết có thể đã thay đổi.

Tuần này, một số hãng tin đưa tin rằng Microsoft đang làm việc để tích hợp các tính năng ChatGPT vào Bing Search. Vì tôi đã viết về "ChatGPT có thay thế Google không?" trước đây, tôi muốn bổ sung thêm suy nghĩ ở đây.

Lập chỉ mục nội dung web không còn là rào cản

Microsoft được cho là đã đầu tư $1 tỷ vào OpenAI từ năm 2019. Điều này có nghĩa quan hệ đối tác giữa hai công ty đã diễn ra ít nhất ba năm. Bing Search rõ ràng có thể lập chỉ mục web, vậy nên chúng ta phải giả định rằng việc lập chỉ mục nội dung web không phải vấn đề nếu OpenAI muốn mở rộng dataset của ChatGPT ra ngoài năm 2021. Với quy mô của Microsoft, chúng ta có thể giả định khả năng lập chỉ mục/crawl realtime của họ khá tốt so với Google.

Bing đã có hình ảnh, video, v.v. trong dataset nên điều này cũng không phải rào cản cho ChatGPT của OpenAI.

Bing Search có thể xếp hạng độ tin cậy nội dung tương đối tốt

Dù tôi chưa xem so sánh gần nhất giữa kết quả Google Search và Bing Search, có thể nói rằng khoảng cách giữa khả năng xác định độ tin cậy nội dung của hai công ty không quá lớn. Vậy nên, với sự hỗ trợ của Microsoft, việc tìm câu trả lời chính xác nhất có thể không phải rào cản lớn cho OpenAI/ChatGPT.

Một ví dụ cụ thể là ChatGPT không có dữ liệu đánh giá dịch vụ cập nhật, nên không thể trả lời câu hỏi về dịch vụ địa phương như "thợ sửa ống nước tốt nhất gần đây" hay "nhà hàng Trung Quốc tốt nhất gần đây." Đây là nơi dataset của Microsoft hỗ trợ.

Vấn đề giao diện người dùng

Dù có lập luận hợp lý về trải nghiệm ChatGPT thân thiện thế nào, nó không phải trải nghiệm phù hợp cho mọi câu hỏi/truy vấn. Trong nhiều trường hợp, người dùng muốn có nhiều câu trả lời. Ví dụ, với dịch vụ địa phương ở trên, người dùng thường muốn thấy danh sách các lựa chọn phù hợp. Có thể lập luận rằng trong những trường hợp đó, người dùng cần chỉnh prompt cho ChatGPT thành "cho tôi 5 lựa chọn dịch vụ xyz tốt nhất gần tôi" thay vì "dịch vụ xyz tốt nhất gần tôi."

Tuy nhiên, tôi cho rằng làm vậy chưa đủ. Công cụ tìm kiếm cần đủ thông minh để biết rằng trong nhiều trường hợp, không có một câu trả lời tốt nhất duy nhất hay một danh sách ngắn câu trả lời tốt nhất. Câu trả lời tốt nhất phụ thuộc vào tình huống/bối cảnh.

Ngoài ra, chúng ta có sự thật và chúng ta có ý kiến. Chúng hoàn toàn khác nhau.

Vậy nên cách thiết kế giao diện người dùng tốt nhất cho nhiều kịch bản là chìa khóa. Ví dụ, ngay cả với điều đơn giản như "công thức bánh mì Việt Nam" :D, đây là kết quả tôi nhận được từ Google, Bing và ChatGPT tính đến tháng 1/2023. Không rõ ràng cái nào tốt hơn hay câu trả lời của ChatGPT tốt hơn.

bing search engine result for "recipe for vietnamese baguette"

ChatGPT result for "recipe for vietnamese baguette"

Google search engine result for "recipe for vietnamese baguette"

Chìa khóa là thay đổi động giao diện kết quả tìm kiếm dựa trên ý định người dùng, sử dụng machine learning. Tôi không chắc việc này dễ hay khó. Nhưng có vẻ là bước hợp lý để kết hợp điểm mạnh của phong cách một câu trả lời từ ChatGPT và công cụ tìm kiếm.

Trợ lý ngôn ngữ

Tôi cho rằng việc cung cấp câu trả lời từ góc độ tìm kiếm thông tin thuần túy không phải lý do mọi người thích ChatGPT, mà là khả năng cho ChatGPT ngữ cảnh và yêu cầu hoàn thành tác vụ liên quan đến ngôn ngữ như viết thơ, lời giới thiệu, bài luận, v.v.

Use case này rất khác với công cụ tìm kiếm và gần hơn với khả năng tạo nội dung PowerPoint hay viết trong Microsoft Word. Vậy nên tôi thực sự nghĩ tin tức về Microsoft tích hợp các khả năng OpenAI khác nhau vào bộ Office 365 là tin tốt hơn.

Giới hạn của ngôn ngữ

Jacob Browning và Yann Lecun đã viết một bài tuyệt vời về AI và giới hạn của ngôn ngữ vào tháng 8/2022, trước khi ChatGPT được mở cho công chúng. Dù bài viết đề cập đến LaMDA, nội dung về cơ bản áp dụng được cho ChatGPT hay bất kỳ Large Language Model nào khác. Bài viết dài nên nếu bạn muốn những điểm chính, đây là:

Một kỹ sư Google gần đây tuyên bố chatbot AI của Google, LaMDA, là một con người, dẫn đến nhiều phản ứng khác nhau. Chatbot LaMDA là một large language model (LLM) được thiết kế để dự đoán các từ tiếp theo có khả năng nhất cho bất kỳ đoạn văn bản nào.

Một số người chế giễu ý tưởng này, trong khi những người khác gợi ý rằng AI tiếp theo có thể là một con người. Sự đa dạng trong phản ứng làm nổi bật vấn đề sâu hơn: khi các LLM trở nên phổ biến và mạnh mẽ hơn, có ít sự đồng thuận hơn về cách hiểu chúng. Vấn đề cơ bản là bản chất giới hạn của ngôn ngữ. Rõ ràng rằng các hệ thống này bị giới hạn ở mức hiểu nông cạn sẽ không bao giờ xấp xỉ được tư duy toàn diện ở con người. Điều này là vì ngôn ngữ chỉ là một loại biểu diễn tri thức cụ thể, hạn chế. Nó giỏi trong việc diễn đạt các đối tượng và thuộc tính rời rạc cùng mối quan hệ giữa chúng, nhưng khó biểu diễn thông tin cụ thể hơn, như mô tả hình dạng bất quy tắc hay chuyển động của vật thể. Có những sơ đồ biểu diễn khác, như kiến thức biểu tượng và kiến thức phân tán, có thể diễn đạt thông tin này theo cách dễ tiếp cận.

Ngôn ngữ là phương pháp truyền thông tin băng thông thấp, và thường mơ hồ do từ đồng âm và đại từ. Con người không cần phương tiện hoàn hảo cho giao tiếp vì chúng ta chia sẻ hiểu biết phi ngôn ngữ. Large Language Model (LLM) được đào tạo để nắm bắt kiến thức nền cho mỗi câu, tìm kiếm từ ngữ và câu xung quanh để ghép lại điều gì đang xảy ra. LLM đã có được hiểu biết nông về ngôn ngữ, nhưng hiểu biết này giới hạn và không bao gồm know-how cho các cuộc trò chuyện phức tạp hơn. Kết quả là, dễ dàng đánh lừa chúng bằng cách không nhất quán hoặc chuyển ngôn ngữ. LLM thiếu hiểu biết cần thiết để phát triển cái nhìn mạch lạc về thế giới.

Dù ngôn ngữ có thể truyền tải nhiều thông tin trong định dạng nhỏ, phần lớn kiến thức con người là phi ngôn ngữ và có thể được truyền qua các phương tiện khác như sơ đồ, bản đồ, hiện vật và phong tục xã hội. Điều này gợi ý rằng một cỗ máy chỉ được đào tạo trên ngôn ngữ sẽ không thể xấp xỉ đầy đủ trí thông minh con người vì nó chỉ tiếp cận được một phần nhỏ kiến thức con người qua một nút thắt hẹp, và rằng hiểu biết sâu phi ngôn ngữ về thế giới là cần thiết để ngôn ngữ hữu ích. Điều này cũng ngụ ý rằng có giới hạn cho mức thông minh của máy nếu chỉ được đào tạo trên ngôn ngữ.

Đó là từ tôi. Bạn nghĩ sao? Bạn có thấy mình chuyển từ Google sang Bing tích hợp ChatGPT, hay thói quen giữ bạn ở Google? :)

Thân mến,

Chandler

Đọc tiếp

Hành trình
Kết nối
Ngôn ngữ
Tùy chọn