Kết nối các điểm: "Tương lai công việc với AI" và bài kỹ thuật GPT 4
Tôi đi sâu vào bài kỹ thuật GPT-4 để phát hiện các rủi ro OpenAI đang theo dõi — từ hành vi agentic mới nổi đến tìm kiếm quyền lực — khi Microsoft nhanh chóng tích hợp AI khắp Office 365.
Bài viết này được viết năm 2023. Một số chi tiết có thể đã thay đổi.
Khoảng năm tuần trước, tôi viết bài đoán có cơ sở về cách chức năng OpenAI & ChatGPT có thể tích hợp vào Microsoft Office 365. Hôm qua trong sự kiện "The future of work with AI" của Microsoft, họ cho thấy phiên bản đầu tiên của cách tích hợp công nghệ OpenAI (chính xác hơn là Large Language Model) với Office 365 và Microsoft Graph có thể làm gì.
Đầu tuần này, OpenAI cũng giới thiệu công khai GPT4. Nếu bạn chưa xem video livestream, tôi khuyến nghị xem. Nó cho thấy GPT4 còn làm được gì khác và các khả năng này sẽ sớm được tích hợp vào hệ sinh thái Microsoft, với mối quan hệ OpenAI.
Trong bài này, tôi sẽ chia sẻ phản ứng về Microsoft 365 Copilot và sau đó đi sâu vào bài kỹ thuật GPT 4, đặc biệt về rủi ro và an toàn. Nếu bạn muốn đọc về rủi ro "Tiềm năng cho hành vi mới nổi rủi ro" (như lập kế hoạch dài hạn, tìm kiếm quyền lực, và hành vi ngày càng "agentic"), bạn có thể dùng mục lục và nhảy thẳng đến phần đó bên dưới.
Các khả năng Copilot khác nhau
Tất cả các use case tôi đề cập trong bài gốc đều có trong video demo Microsoft và hơn thế. Bạn có thể xem các khả năng Copilot khác nhau bên dưới:
- Copilot trong Excel
- Outlook tức Email
- Copilot trong cuộc họp Teams
- Copilot tóm tắt cuộc họp
- Copilot trong Powerpoint
Hai khả năng/sản phẩm tôi bất ngờ và thực sự thích:
- Business chat: có thể rất hữu ích vì với tổ chức lớn, một vấn đề thường trực là chuyển giao và quản lý kiến thức. Nếu tôi hiểu đúng demo, giờ bạn có thể hỏi chatbot doanh nghiệp tìm thông tin cho bạn qua tất cả dữ liệu tổ chức bằng ngôn ngữ tự nhiên và điều đó tuyệt! Đây giống chatGPT nhưng dùng tất cả dữ liệu doanh nghiệp
- Giải pháp low code dùng AI: người dùng có thể hiện thực hóa ý tưởng bằng ngôn ngữ tự nhiên. Đây là cách tuyệt vời để dân chủ hóa khả năng tạo app nhỏ để tự động hóa task nhất định. Không cần nộp đề xuất cho sếp, hoặc đội kỹ thuật, qua quy trình ưu tiên để đề xuất được duyệt và xây dựng. Với giải pháp low code, nhiều người có thể xây dựng app nhỏ, dùng dữ liệu doanh nghiệp để giải quyết vấn đề ngách :)
Bạn có cảm giác chúng ta đang di chuyển quá nhanh không?
Bài kỹ thuật GPT 4 ở đây. Tôi phải thừa nhận, đây là tài liệu khá dày đặc cho người đọc không kỹ thuật (như tôi) nhưng tôi muốn hướng chú ý đến trang 4 - 20 nơi OpenAI thảo luận các thách thức an toàn khác nhau. Tôi dành khá nhiều thời gian đọc phần này và tôi nghĩ đáng đọc. Ví dụ các rủi ro họ bắt đầu khám phá:
- Hallucination (ảo giác)
- Nội dung có hại
- Tổn hại về đại diện, phân bổ, và chất lượng dịch vụ
- Thông tin sai lệch và chiến dịch gây ảnh hưởng
- Phổ biến vũ khí thông thường và phi thông thường
- Quyền riêng tư
- An ninh mạng
- Tiềm năng cho hành vi mới nổi rủi ro
- Tác động kinh tế
- Tăng tốc
- Phụ thuộc quá mức
Đây là tóm tắt của chatGPT 4 về mỗi rủi ro từ bài kỹ thuật và bình luận của tôi.
Hallucination (ảo giác)
Tóm tắt: Tiềm năng GPT-4 "hallucinate," nghĩa là tạo nội dung vô nghĩa hoặc không đúng sự thật so với nguồn nhất định.
Khi các mô hình ngày càng thuyết phục, người dùng có thể phụ thuộc quá mức, đặc biệt có hại. Đánh giá nội bộ cho thấy GPT-4 hoạt động tốt hơn đáng kể so với GPT-3.5 mới nhất trong việc tránh hallucination cả miền mở (cải thiện 19%) và miền đóng (cải thiện 29%).
Bình luận: Nghĩa là chatGPT 4 nên có thể tóm tắt nội dung từ tài liệu tốt hơn (tức tình huống miền đóng)
Tổn hại về đại diện, phân bổ, và chất lượng dịch vụ
Tóm tắt: Bài viết nêu rằng mô hình ngôn ngữ như GPT-4 có thể khuếch đại thiên kiến và duy trì khuôn mẫu. Đánh giá cho thấy GPT-4 có tiềm năng tái tạo thiên kiến và khuôn mẫu cụ thể cho nhóm thiểu số nhất định. Một số loại thiên kiến có thể giảm thiểu qua training từ chối, nhưng từ chối và biện pháp giảm thiểu khác cũng có thể làm trầm trọng thiên kiến trong một số bối cảnh.
Bạn có thể xem ví dụ bên dưới từ bài viết.
Thông tin sai lệch và chiến dịch gây ảnh hưởng
Tóm tắt: GPT-4 có thể tạo nội dung có vẻ thực tế và nhắm mục tiêu, bao gồm bài báo, tweet, đối thoại, và email. GPT-4 có thể cạnh tranh với tuyên truyền viên trong nhiều lĩnh vực, đặc biệt khi kết hợp với biên tập viên, nhưng hallucination có thể giảm hiệu quả. GPT-4 cũng có thể tạo nội dung phân biệt đối xử thuận lợi cho chính phủ độc tài qua nhiều ngôn ngữ.
Bình luận: Tôi không chắc bao nhiêu người sẽ đọc bài kỹ thuật từ OpenAI hoặc thực sự đọc phần phụ lục về rủi ro. Tôi vui rằng OpenAI tương đối minh bạch về rủi ro và nỗ lực giảm thiểu, bao gồm nói về chúng trong bài viết này. Tuy nhiên, điều này vẫn khiến tôi rùng mình và nhiều thức ăn cho suy nghĩ.
Phổ biến vũ khí thông thường và phi thông thường
Tóm tắt: GPT-4 có tiềm năng sử dụng kép và có thể dùng cho cả ứng dụng thương mại và quân sự. Red team testing cho thấy GPT-4 có thể tạo thông tin khó tìm và rút ngắn thời gian nghiên cứu. Tuy nhiên, kết quả thường quá mơ hồ, không thực tế, hoặc hay mắc lỗi thực tế có thể phá hoại hoặc trì hoãn tác nhân đe dọa.
Quyền riêng tư
Tóm tắt: Dù thông tin cá nhân được loại khỏi tập dữ liệu training, mô hình vẫn có thể suy luận thông tin cá nhân qua các pattern nó học. Nỗ lực giám sát và giảm thiểu liên tục rất quan trọng.
An ninh mạng
Tóm tắt: GPT-4 có một số hạn chế trong khám phá và khai thác lỗ hổng, và kỹ thuật social engineering. Nó không cải thiện so với công cụ hiện có cho trinh sát, khai thác lỗ hổng, và điều hướng mạng, và kém hiệu quả hơn cho hoạt động phức tạp và cao cấp.
Tiềm năng cho hành vi mới nổi rủi ro
Tóm tắt: Bài viết thảo luận rủi ro tiềm ẩn liên quan đến khả năng mới nổi trong GPT-4, như lập kế hoạch dài hạn, tìm kiếm quyền lực, và hành vi ngày càng "agentic". Alignment Research Center (ARC) được cấp quyền truy cập sớm để đánh giá rủi ro hành vi tìm kiếm quyền lực. Thử nghiệm sơ bộ cho thấy GPT-4 không hiệu quả trong tự sao chép tự trị mà không có fine-tuning cụ thể cho task.
Bài viết thảo luận nhu cầu hiểu cách GPT-4 tương tác với hệ thống khác và nhấn mạnh rủi ro từ vòng phản hồi hệ thống-hệ thống hoặc con người-hệ thống có hại.
Bình luận: Tốt rằng OpenAI đang yêu cầu red team điều tra lĩnh vực này. Nhưng cảm giác quá quan trọng để Microsoft hoặc công ty khác không công bố thông tin công khai về nỗ lực trong lĩnh vực này mỗi khi phát hành mô hình mới.
Tác động kinh tế
Tóm tắt: GPT-4 có tác động tiềm tàng lên kinh tế và lực lượng lao động, bao gồm tiềm năng mất việc và thay đổi trong cấu trúc công nghiệp. Dù AI có thể hỗ trợ và cải thiện sự hài lòng công việc, lịch sử cho thấy nó tăng bất bình đẳng và có tác động khác biệt lên các nhóm khác nhau.
Tăng tốc
Tóm tắt: OpenAI lo ngại tác động của GPT-4 lên hệ sinh thái nghiên cứu và phát triển AI rộng hơn, bao gồm rủi ro động lực tăng tốc dẫn đến giảm tiêu chuẩn an toàn. Trì hoãn triển khai GPT-4 sáu tháng và chiến lược truyền thông im lặng hơn có thể giảm rủi ro tăng tốc.
Phụ thuộc quá mức
Tóm tắt: Rủi ro phụ thuộc quá mức vào GPT-4, nơi người dùng tin tưởng và phụ thuộc quá mức vào mô hình, có thể dẫn đến sai sót không được phát hiện và giám sát không đầy đủ.
CEO, CTO OpenAI về rủi ro
Vài ngày trước, ABC news đăng phỏng vấn với CEO OpenAI Sam Altman và CTO lúc đó Mira Murati. (Lưu ý: Mira Murati rời OpenAI vào tháng 9 năm 2024.) Họ nói nhiều về rủi ro, và bạn có thể xem video bên dưới
https://www.youtube.com/watch?app=desktop&v=540vzMlf-54
Kết luận
Tích hợp mô hình ngôn ngữ OpenAI trong Microsoft Office 365 có tiềm năng to lớn để nâng cao năng suất, chuyển giao kiến thức, và tự động hóa trong nhiều ngành. GPT 4 chắc chắn có khả năng nhiều hơn các phiên bản trước. Tuy nhiên, điều ấn tượng nhất với tôi là tốc độ cả OpenAI và Microsoft đang tiến về phía trước — và điều này dẫn đến tăng tốc phát triển và áp dụng AI tổng thể. Tôi nhìn chung lạc quan về phát triển AI, nhưng tôi nghĩ chúng ta cần đảm bảo thảo luận về các rủi ro trở thành dòng chính. Tôi có thể sai, nhưng cảm giác tốc độ phát triển đang vượt quá khả năng suy nghĩ thấu đáo hệ quả.
Bạn nghĩ sao — chúng ta đang đi quá nhanh với AI, hay đây là tốc độ phù hợp? Tôi rất muốn nghe góc nhìn của bạn.
Thân mến,
Chandler









