新闻

Gen-AI 如何重塑新一代幻灯片产品|初心海外专栏

2023.06.07

1987 年,第一代 PowerPoint 在苹果 Macintosh 电脑上发布,幻灯片成为图形界面(Graphical UI)时代的产物。此后三十余年,微软收购 PowerPoint 并持续更新,幻灯片上云并出现新一代多模态幻灯片产品。多年发展,行业始终希望将人们从幻灯片的琐碎排版与布局中解放而回归内容本身。而随着 GPT 技术背后的自然语言交互时代到来,生成式 AI 能如何突破传统 PowerPoint 的边界并重塑新一代幻灯片产品?本期初心海外专栏我们一同走进自然语言接口时代的幻灯片产品并对新一代生成式幻灯片提出展望。

01 PowerPoint:图形界面时代的产物

1983 年 1 月,苹果推出第一款图形界面操作系统 Mac OS,人与电脑的交互形式从 DOS 时代的命令行转变为二维的图形化页面,图形化电脑时代到来。前柏克莱博士生 Bob Gaskins 意识到 即将到来的图形接口时代可能会推翻传统基于文本的演示形式。

1984 年, Gaskins 加入硅谷软件公司 Forethought,与软件开发工程师 Dennis Austin 一同设计并实行了“Presenter” 计划,将产品命名为 “PowerPoint”。1987 年,PowerPoint 1.0 在苹果 Macintosh 电脑上发布,第一款幻灯片产品问世。随后,微软以 1400 万美金收购 Forethought。幻灯片从此代替文档,成为新一代图形化的公众演示工具。

640.png 历史上第一款幻灯片产品:PowerPoint 1.0

至今,微软的 PowerPoint 仍然是办公场合人们最常使用的幻灯片演示产品。然而,人们对 PowerPoint 白板化的演示形式看法始终褒贬不一,一方面一定尺寸的幻灯片能够让人们将所表达的内容提炼并形象化翻页展示,另一方面,为了追求呈现效果,人们不得不花费大量时间进行设计与排版,在内容呈现方面花费大量不必要的精力。 制作一份精美且高信息密度的 deck,掌握扎实的内容排版功底,也成为大部分白领岗位的必备技能。

图形界面时代的到来让人们的内容展示形式从文字拓展至图形,却也难免陷入形式主义的圈套,忽略所要传达的内容本身。如何创造一款易于编辑且兼具展示性的演示工具成为此后三十年人们持续探索的问题。

02 云计算背景下的幻灯片产品

2006 年被称为云计算的元年,Google 首席执行官埃里克·施密特(Eric Schmidt)首次提出“云计算”概念,亚马逊推出首个 IaaS 服务平台 AWS,高性能、高吞吐的基础设施使得软件系统开始探索云上发展模式。对于幻灯片产品而言,谷歌首先进入云上幻灯片领域,2006 年发布在线幻灯片协作套件,2012 年改名为 Google Slides,允许用户在线创建和编辑文件,同时与其他用户实时协作。

此后,微软办公套件上云并发布 Microsoft 365,一批云上幻灯片产品出现,如 Pitch 和 Beautiful.ai 。然而,此类在线幻灯片产品带来的基本是从本地编辑到在线协作的单点突破,对于实际的产品体验还没有太大的改变与提升。 同时由于幻灯片的编辑复杂度相比文档要高,线上幻灯片包括 Google Slides 无法承接微软 PowerPoint 的很多复杂功能。

作为一款文档协作管理软件,成立于 2012 年的 Notion 在 2021 年完成 2.5 亿美金 C 轮融资,估值达到 100 亿美金。Notion 将文档模块化并引入视频、网页、文件等多模态组件,在此背景下,作为新一代幻灯片领域的探索者 Gamma 应运而生。“像文档一样创作,像幻灯片一样展示”,Gamma 尝试模糊 Word 与 PowerPoint 的边界,取消了幻灯片的固定页面大小,将多模态内容设置成组件允许用户自由布局使得用户不被排版所困。然而自 2021 年内测版产品上线以来,Gamma 的发展时间较短,相比 Notion 也相对小众,更多是自由工作者和创新爱好者的个性化体验对象。

整体而言,从第一代微软 PowerPoint 到基于云的多模态产品,幻灯片的使用体验、制作门槛与成本在相当长的时间中没有出现显著变化,幻灯片依旧是聚焦于办公场景同时带有一定编辑复杂度的内容展示载体。

03 AGI 如何重塑新一代幻灯片产品

后 GPT 时代,初心团队认为大语言模型有望成为新的基础设施向应用层延伸。 对于幻灯片而言,生成式 AI 技术会带来哪些新的变量?以何种方式应用于幻灯片的哪些创造过程中?针对这两个问题,初心团队提出以下观点:

1.Gen-AI(生成式 AI )技术使得用户能够以自然语言的形式与产品交互,贯穿幻灯片的内容生成与优化全流程。对话式 AI 成为幻灯片产品的新变量,产品使用门槛大幅降低。

2.内容生成方面:内容生成的核心在于生成内容的可控度、丰富度、准确度。Prompt-to-Slides 的自动生成让幻灯片不仅仅作为内容展示的载体,而成为更强大的内容创作工具,为更多用户降低优质内容的创作门槛。

3.内容优化方面:AI 助手贯穿内容创作与优化全流程是生成式 AI 现阶段提升幻灯片生成效率和质量的关键,包括但不限于文字生成、图生成、逻辑编排与排版。

640 (1).png Microsoft 365 Copilot 产品预告

3 月 16 日,微软宣布将推出 Microsoft 365 Copilot,将生成式 AI 全面整合至其生态中的 PowerPoint、Excel、Outlook 等产品,标志着大语言模型能力全面融入生产力工具的开端。在微软正式推出 Copilot 前,已有第一批幻灯片产品推出嵌入了大模型的 AI Bot 版应用。我们选择目前海外市场生成式技术应用相对完整的Gamma、Tome 和 Beautiful.ai,对其 AI 应用模式展开研究。

640 (2).png

Tome 是最先整合大模型的幻灯片应用,于 2022 年年底推出对话机器人 Tome AI 。公司由前 FaceBook 和 Instagram 产品负责人 Keith Peiris 和 Henri Liriani 成立于 2020 年。去年 12 月底,Tome 率先将 GPT 整合至其产品生态,并提出生成式故事叙述的时代已经到来。 2023 年 1 月,Tome 用户量突破100万人,2 月宣布完成 4300 万美金 B 轮融资,估值 3 亿美金。

今年年初,作为早期云上幻灯片产品的探索者 Beautiful.ai 推出 DesignerBot。Beautiful.ai 的创始人 Mitch Grasso 在 PowerPoint 已持续深耕 15 年,在 2007 年创办在线幻灯片公司 SlideRocket (后被 VMware 收购)并兼任 CTO,并于 2015 年成立 Beautiful.ai。相比 Gamma 和 Tome,Beautiful.ai 更类似固定页面大小的在线 PowerPoint,以服务 B 端客户为主。将对话机器人整合后,Beautiful.ai 有望进一步加速 B 端用户转化。

Gamma 相对较晚地推出 Gamma AI 对话机器人,但从目前用户评价和整体使用情况来看,Gamma 的对话机器人技术成熟度较高,可用性最强。创始人 Grant Lee 是一名在美华裔,早年在投行与咨询的工作让他多年生活在 PowerPoint 的纺织劳作中,希望重塑信息的交流媒介。2020 年 11 月,Grant Lee 与同在数字营销 SaaS 公司 Optimizely 的核心员工共同创办 Gamma。团队仅 12 人,极为扁平精干,包括 5 位工程师和 4 位设计师。诚如 OpenAI 团队始终坚定地信仰 AGI,从 Gamma 官网用自家产品制作的团队介绍可知,团队的每个人都对创造一种新型的信息交流媒介从而将人们从苦力的幻灯片劳动中解救出来具有极大的热忱。

I love that we're working on a medium that offers people a way to communicate their thoughts, ideas, and intentions in a format that's more aligned with how humans think rather than how computers function — and have a lot of fun while doing it! —— Alison Bemis, Designer of Gamma

640 (3).png

整体而言,目前 Gamma、Tome 和 Beautiful.ai 三大产品已初步实现展示文稿的生成,但在生成内容和内容优化两方面仍有较大提升空间。从用户反馈情况看,由于 AI 功能推出尚处早期,用户对产品的生成内容要求不高,整体体验感受较好。

下面以三款产品为例,对生成式幻灯片的核心功能进行分析与比较。

内容生成方面,目前产品基本实现了从 Prompt-to-Slides 的基础功能,但内容可控度、丰富度和准确度仍有较大提升空间,整体而言 Gamma 的表现最为优秀。 以 Gamma 为例,用户通过与 AI Bot 进行多轮对话的形式完成内容生成,并允许用户选择主题风格,并对大纲进行再生成与修改。

640 (4).png Gamma 幻灯片生成与交互界面

对于可控度与参与度,幻灯片生成需要将生成过程尽可能拆解,在提高内容可控度的同时能够让用户尽可能参与到内容生成全流程,从而提高用户的信息接收程度。目前海外主流产品对生成内容的可控度普遍不高,仅 Gamma 支持控制内容大纲、Tome 支持控制生成的配图风格( Cyberpunk 等),用户可以进行配置的内容包括页数、文字语气、排版样式等。

640 (5).png Gamma 幻灯片生成内容示例

生成内容的丰富度和准确度与所接大模型和 Prompt 工程相关,目前 Tome 和 Gamma 所接模型为 GPT-4,但其生成内容的颗粒度较低,内容还无法达到高度准确的水平。Beautiful.ai 的内容丰富度相对较高,内置词云图、数据图等数据图表。

640 (6).png Beautiful.ai 幻灯片生成内容示例

内容优化方面,Gamma 通过 AI Bot 的形式帮助用户实现内容扩写、改写、增加配图,同时可以将大段文字转换为图表、时间线等形式。

正如 Tome 官方所言,AI 于幻灯片并不意味着自动驾驶,它应当作为副驾贯穿内容创作与优化全流程,帮助我们快速找到图片、文字与布局格式,如此才是生成式技术真正赋能幻灯片生产的关键所在。

640 (7).png

对于应用场景,以 Gamma 和 Tome 为代表的新一代幻灯片应用仿佛天然适合自由职业者、团队合作等创新性场景。观察各产品官网提供的模版和作品案例可以看出,Beautiful.ai 以服务中大型企业为主,包括 Google、Uber、Salesforce 等公司;Tome 和 Gamma 的定位较为相似,包括企业融资、营销、团队合作和个人场景,而 Tome 特别针对 Freelancer 提出了个人作品集、个人简历等样例。

640 (8).png Gamma 幻灯片生成内容示例

除了以上场景,我们发现推特上不乏用户制作分享的有趣作品。“一只熊如何统治世界”,“一个海盗的历史”......用户整体对该类产品的好评度较高,对生成内容的框架完整度和部分脑洞大开内容的“Aha moment”经常出现。 生成式故事叙述的时代已经到来,AI 辅助创作的无限性有望重塑新一代幻灯片产品。

04 保持想象

三十年前,Bob Gaskins 提出图形化 PowerPoint 的概念时,他意识到商业幻灯片这一巨大但尚未被人发掘的市场同正在出现的图形界面时代形成了完美的结合。然而当时许多风险投资人不同意这点,他们坚持认为基于 DOS 界面的 DOS 操作系统永远不会消失。 如今,自然语言交互时代到来,基于大语言模型的生成式故事叙述有望成为幻灯片生产的新变量,以更便捷、丰富、灵活的形式重塑新一代幻灯片产品。

同样在三十年前,微软成功迎接图形界面时代的到来,推出图形界面操作系统 Windows 和 Office 套件。如今,与 OpenAI 深度绑定的微软有望抓住生成式 AI 技术与自然语言交互的变革,将大模型全面整合至其产品生态,实现各产品的内容生成与联动。而在幻灯片领域,以微软为代表的老玩家是否仍然会继续领先?我们相信,伴随生成式 AI 这一巨大技术变量的落地和自然语言交互形式创新的普及,包括幻灯片在内的诸多生产力工具赛道都将诞生属于新产品的机会。

写在最后

正如 Midjourney 能够帮助普通人解锁绘画技能,生成式幻灯片也可以让更多人实现更便捷的故事讲述与交互分享。我们会保持想象,持续关注 AI 赋能的生产力工具可能性,欢迎相关创业者将项目 BP 发送至 bp@monadventures.com。 以“【BP】- 公司名称 - 一句话业务定义”作为邮件主题。我们会认真查阅邮箱里的每一封 BP 并且联系有意向的项目。

初心多家被投企业上榜第一新声「2023 年中国最佳信创厂商系列榜单」 | 初心喜讯

做陪伴创业者
最早的投资机构

初心是积极布局新兴业态的早期股权投资基金,专注于企业级软件、科技创新等领域的投资。我们致力于捕捉因科技赋能而改变行业格局和通过软件帮助企业降本增效、优化运营的优秀企业,进行投资布局。欢迎留下你的联系方式,与我们取得联系。