Skip to content
··阅读时间1分钟

走进下一代办公:我希望看到的 OpenAI/ChatGPT 与 Office 365 深度集成

真正有价值的 Office 365 集成,不应只是“把聊天框塞进办公软件”,而是让 AI 理解文档、表格、会议上下文并完成端到端执行。

本文写于2023年,部分内容可能已发生变化。

微软已经公布 Bing 与 OpenAI/ChatGPT 的集成,带来了新的 Bing Search/Chat 体验。

但还有另一个非常大的方向正在推进,尚未全面向公众开放:把 OpenAI/ChatGPT 集成到微软生态里更多软件类别中。(Yusuf 在本周活动上也确认了这个方向。)

其中最直观的就是 Office 365 套件。

我并不了解微软内部具体路线,也没有和微软或 OpenAI 团队直接交流。下面是基于现有公开信息和实际使用体验,我对“应该优先做哪些集成场景”的一些判断和期待。

1) 让人可以“对话式”操作 Excel/表格

我很想当表格高手,但现实是:我不是 T.T

我能用 Google Sheets/Excel 做到中等水平,但很多函数还是要频繁查文档。即使看了示例,也常常要花时间把理解转成可用公式。

所以“用自然语言让 Excel 帮我写公式”这件事,对我来说价值非常直接。

现在很多人已经在用 ChatGPT 写 Excel 函数(可看 Kevin 的视频)。如果 OpenAI 能原生集成进 Excel,我期待至少两点:

  • 效果更好:模型应能读懂当前文件上下文和具体单元格内容。
  • 流程更顺:不再需要 Excel ↔ ChatGPT 来回切换、复制粘贴公式。

我也希望 Google Sheets 很快有同等级体验,因为我日常使用 Sheets 更多。(你在 YouTube 搜一下,会看到很多人已在尝试把 ChatGPT API 接进 Sheets。)

2) 自动总结会议并生成后续行动项

看这个 MeeTime 视频,他们演示了如何用 ChatGPT 总结会议转录。逻辑很清楚:

  • 线上会议(Teams、Google Meet,甚至多数 YouTube 内容)都可自动生成转录
  • 既然有完整转录,为什么不直接让模型生成 executive summary
  • 视频里没展开“自动拆解 action items 并指派 owner”,但技术上并不遥远

所以我对 Teams 原生集成的期待是:

  • 自动生成会议高层摘要,并基于参会人控制初始访问权限,避免未授权扩散
  • 自动抽取后续任务并按语境建议负责人
  • 自动生成“软提醒型”日程(或同类机制)标注任务截止时间
  • 以及更多流程化动作

这类能力会显著省时间。因为当前靠 ChatGPT 手工做的流程很笨重:

  • 字符限制导致无法一次塞入完整长会议转录
  • 分段喂给模型时,摘要语义可能偏移,因为模型看不到全局上下文

同样逻辑也可扩展到 Google Meet 或其他协作平台。

如果能把这件事做好,会非常有价值。

3) ChatGPT + DALL·E 2 直接生成完整演示文稿

我们已经知道 ChatGPT 擅长文本结构、提纲和叙事;DALL·E 2Stable DiffusionDreamStudio)擅长图像。

下一步理想状态是把两者合到一个工作流里,直接输出“文案 + 配图”的完整演示稿。

我自己也长期在用 Stable Diffusion 做图,当前痛点是:给机器足够上下文并做连续迭代并不容易。DreamStudio 免费界面在那时也不太支持像 ChatGPT 一样的多轮细化。

所以我的需求是:

  • 不只集成 OpenAI 文本能力,也把 DALL·E 2(或同类图像能力)接入 PowerPoint/演示工具
  • 支持用户和机器共同创作:叙事、文字、配图一体化
  • 每张幻灯片/图片都支持多轮对话式迭代编辑

当时我还没机会实测 Google Bard,也不清楚 Google 是否会在图像生成侧做对应产品,因此先不展开比较。

但需求是明确存在的,而且不只在白领场景,学生、老师、银行业、医生等都需要更高效的内容生产工具。

4) ChatGPT + DALL·E 做数据可视化辅助

这个是 #3 的延伸,但聚焦表格图表。

很多人都遇到过:同一份数字,有人能做出清晰漂亮的图,你却要花很久仍不理想。那为什么不把“对话式可视化”做成原生能力?

我的判断是:绝大多数人并不想为了做图专门学 Python 或 R。

更现实的方式是:用户直接“描述想要的图”,让系统基于原始数据生成并迭代优化。

所以我的需求很简单:

  • 把 ChatGPT + DALL·E(或同类能力)接入 Excel
  • 用对话式流程替代目前繁琐的图表设置流程
  • 就这两步,价值已经很大

5) ChatGPT 接入 Word / Outlook

这部分最容易理解。我的广告工作里邮件和文档非常多,而最难的往往不是信息本身,而是语气(tone of voice)。

我的需求:

  • 在 Word/Outlook 里原生理解情境与语气
  • 允许用户在个人语气风格下调用 ChatGPT 能力(改写、精炼、扩展、总结等)

网上和 YouTube 上还有很多有趣案例,我就不再继续展开。

可以确定的是:我很期待这些产品真正上线,并学习如何把机器能力用到极致。

虽然我以上都用 Microsoft 365 举例,但这些能力理论上也可以在 Google 或 Zoom 等生产力套件里实现。只是我看不到他们内部路线,所以不做判断。

6) 把 ChatGPT 接进 Google Sheets / Slides 的现有示例

现在已经有不少简单示例展示了 ChatGPT 如何接入 Google Sheets/Slides 完成任务。

我预计一旦 Bard 原生进入 Google 套件,交互会比当前 API 拼接方式直观得多。

Google Sheets 中的 ChatGPT API 示例

Google Slides 中的 ChatGPT API 示例

7) 2023 年 3 月 16 日:微软发布 Copilot 365

这篇写完约一个多月后,微软正式发布 Copilot 365,本质上就是把 OpenAI 能力系统性接入 Microsoft Office 365。

你可以看我后续这篇:连接这些点:AI、GPT-4 与未来工作方式。文中我也总结了 GPT-4 技术报告里提到的相关风险。

以上就是我的观察。

你觉得上面哪一个用例最能帮你省时间?或者你有我没提到但更关键的场景?欢迎交流。

致敬,

Chandler

P.S. 这篇没展开谈商业化收入,但从产品角度看,只要用户体验和粘性提高,长期留存和生命周期价值通常都会更好。

继续阅读

我的旅程
联系
语言
偏好设置