首页 / 洞察 / 实践笔记 #2

CATLAXY · 实践笔记 #2 / PRACTICE NOTES

AI 写 HTML 取代 PPT,
企业落地卡在品牌、修改和成本

业务团队直接对话 Agent 做 PPT,品牌一致、数据准确、改了不用重来。

2026.05 · ALAN HUANG

用 AI 直接写 HTML/CSS 做演示文稿,是开发者社区最近半年最热的话题之一。归藏的 PPT Skill 在 GitHub 拿到 9.3k stars,PPT Master 拿到 17k stars。方向是对的:HTML 的表现力、响应式适配、版本控制能力确实比 .pptx 强,视觉上限也高出一截。

PPT 在企业里不只是"做提案"的工具。周会、月报、季度复盘、培训、客户汇报、内部立项,几乎所有需要结构化表达的场景都在用它。体量远比想象中大。当我们把这些方案拿给企业用,问题很快浮出来。

PART 1 · 现状与路线

五个困境,三条路线

跟企业聊完之后,卡住的点高度集中:

FRICTION · 五个反复出现的企业困境

01

做完了,但不能用

品牌色不对、字体不对、Logo 位置不对。客户一看就知道是 AI 做的,不是因为内容差,是因为"长得不像我们公司的东西"。个人分享无所谓,企业发出去就是品牌事故。

02

AI 编数据

测试了国内一个工具,上传合同模板让它做培训 PPT,结果它把"15 个工作日内支付"改成了"15 天内付款"。AI 在"帮你写得更通顺",但企业场景里准确比通顺重要。提案里出现一个编造的案例、一个不存在的数据来源,这份 PPT 就是风险来源。

03

改一个字就要重来

企业做 PPT,初稿只占 20%,80% 是改到能用:主管看→改方向→总监看→又改→客户看→再改。现有 AI PPT 的改动逻辑是"重新生成",花 30 分钟调好的第 3、7、12 页,改一次结构就全丢了。

04

使用门槛高,企业合规也是问题

Skill 型方案视觉很好,但使用者需要熟悉命令行、配置开发环境、选模板、跑验证脚本。企业里真正大量做 PPT 的是销售经理、市场主管、行政助理,不是技术团队。更现实的问题:这些方案大多依赖海外平台(如 Claude Code),Anthropic 2025 年封禁中国 IP,企业在国内合规部署本身就是障碍。

05

成本线性增长

不只是输出端,输入端也是大头。全部模板规则、用户材料、上下文要塞进 prompt,动辄几万 input token。一份 20 页 deck 迭代几轮,总 token 轻松破 10 万。

企业 PPT 修改流程:初稿 20%,反复修改 80%。对比全量重来 vs 增量修改

企业真实修改流程 vs AI 修改模式对比

市场上有三条主流路线,各自解了一部分问题。

路线一:Consumer SaaS

GAMMA · AIPPT · KIMI PPT · BEAUTIFUL.AI

做对了什么:把"从零到有"的门槛降到最低。一句话出一份 deck,Gamma 做到 1 亿美金 ARR、7000 万用户。需求是真实的。

天花板:Tome 的死亡是最好的证据:2500 万用户,年收入不到 400 万美金。"生成初稿"用户愿意用,不愿意付费。方法论锁在黑箱,每次从零猜你要什么。一旦需要精细调整,就回到手动模式。品牌无法锁定,修改只能重来。五个困境一个都没解。

适合:个人用户、快速原型、不需要品牌一致性的内部分享。

路线二:Skill / Code-gen

归藏 PPT SKILL · PPT MASTER · CC-SLIDEV · PRESENTON

做对了什么:证明了 LLM 直写 HTML 可以做出媲美设计师的视觉效果。归藏的 PPT Skill 用瑞士国际主义风格、22 种锁定布局和验证脚本来保证美学一致性,"保护美学优先于自由"这个设计哲学我完全认同。这条路线在开发者社区得到了强烈认可,说明市场确实需要超越传统 PPT 的视觉表现力。

天花板:LLM 同时承担方法论 + 内容 + 渲染三件事。来看真实消耗:

TOKEN ANATOMY · Skill 路线的真实消耗

输入

模板规则 + 用户材料全文 + 上下文 = 海量 input

Skill 的 prompt 要塞进完整模板规则(布局约束、配色规范、验证逻辑)、用户上传的原始内容、以及对话上下文。一份材料丰富的提案,input 轻松 3-5 万 token。而且用户材料是原封不动塞进去的,没有预处理,没有摘要提取。

输出

每页 500-1500 token 的完整 HTML / CSS / SVG

20 页 deck,output 1-3 万 token。迭代三轮,每轮全量重新生成(没有增量修改),output 总量 3-9 万。

实测

公开 benchmark:同一个任务,成本差 9 倍

V2EX 公开测试(OpenClacky 1.0),四个 Agent 用同一模型(Claude Opus)生成同一份 10 页 deck,OpenRouter 账单第三方验证:OpenClaw $5.07 · Hermes $10.96(最低的两个 Agent 分别为 $1.23 和 $1.45,但它们专门做了 token 优化,不代表典型 Skill 体验)。这还只是 10 页初稿,企业场景 20 页加三五轮修改(每轮全量重来),单份成本 $20-50。

个人偶尔做一份惊艳的 deck 完全值得,但企业把 PPT 当日常汇报工具时,周会、月报、复盘、培训全在用,体量完全不是一个量级。

Skill 路线解了品牌问题的一部分(可以锁定模板风格),但其他四个困境都还在:AI 仍然会编数据,改一个字还是要全量重新生成,只有开发者能用,而且成本随页数和迭代次数线性增长。

适合:开发者个人演讲、技术分享、Demo Day、一次性场景。

路线三:Agent + Platform(Catlaxy Deck 的选择)

前两条路线的共同问题是:AI 同时负责理解需求、组织内容、生成视觉,什么都做,什么都不够好。Catlaxy Deck 的做法是把这三件事拆开,让 Agent 只做它最擅长的判断,渲染和规则交给确定性系统。这是笔记 #1 提到的"AI 适合做判断,不适合做编排"在 PPT 场景的落地。核心是三层分离

三层分离架构

01 ·

规则层:系统编码 + 智能筛选

49 个模板的完整规范(206k 字符)编码在系统里。Code 层按当前任务筛选相关子集,只把约 6% 的规则送进 LLM。Skill 路线则把全部规则塞进每次 prompt。

02 ·

内容层:结构化 JSON,约 500-600 token/页

Agent 产出的是结构化 JSON(每页约 500-600 token),不是完整 HTML/CSS/SVG(每页 1000-1500 token)。输出体积压缩约 50%。

03 ·

渲染层:确定性引擎,0 LLM 消耗

同一份 JSON 永远渲染出同一个视觉结果。品牌一致性由 CSS token 系统保证,不靠 LLM 判断。

关键区别:整份 20 页 deck 的核心生成只需 2 次 LLM 调用(一次规划、一次内容),总计约 6-7 万 token。Skill 路线每次生成需要大量 LLM 来回,总计 10 万+ token。

三层分离架构:规则层(206k 筛选至 6%)→ 内容层(2 次 LLM,结构化 JSON)→ 渲染层(确定性引擎,0 LLM)vs Skill 路线

Platform 三层分离架构 vs Skill 路线

输入端也不一样。平台先用文档解析、视觉理解、数据分析等工具处理用户材料,提取结构化摘要后再给 LLM,不是把原始 PDF 整份塞进 prompt。输入筛选 + 输出压缩 + 调用次数锐减,三重降本。这是笔记 #1 里"标准化输入,个性化输出"在这个场景的落地。

适合:企业重复生产场景:销售提案、季度汇报、客户复盘、培训材料。需要品牌一致、数据准确、多人修改、成本可控的场景。

CORE THESIS · 核心判断

AI PPT 的问题不是"做不出来",
做出来了但不能用

PART 2 · CATLAXY DECK 落地实践

Catlaxy Deck 怎么过这五关

Agent 是终局形态(笔记 #1 聊过了),但不是所有 Agent 都能在企业用。以下是 Catlaxy Deck 的做法。

01

事实边界:不能瞎编

企业场景下编造数据的后果比"PPT 丑一点"严重得多。Catlaxy Deck 的做法是:数据先经过后端的分析模型处理和验证,AI 只负责解读已验证的结果,不直接从原始材料里"猜"数字。用户上传的文件、数据分析结果、搜索结果、对话中确认过的信息,这四类是 Agent 唯一可用的信息源。缺数据?写"待补充"。不编。

举个具体的例子:用户只给了起点、终点和增长率,系统不会硬画一张年度趋势图(中间的数据是编的),而是用数据卡片直接呈现已有数据。数据不够就不画,而不是"猜一个看起来合理的"。

这不是一条 prompt 能解决的。数据来源追溯、前端来源标注、敏感内容合规拦截,都是系统层面的硬约束,不依赖模型的"自觉"。

02

增量修改:不要每次重来

Agent 的修改逻辑不是"重新生成 20 页",而是四种动作:

修改协议 · KEEP / UPDATE / ADD / DELETE

KEEP:没人说要改,保留原样。

UPDATE:只重写用户说要改的字段。

ADD:新增一页,放到指定位置。

DELETE:删掉这一页,前后衔接。

Catlaxy Deck Planning 界面:每页内容规划卡片,用户直接修改内容

Catlaxy Deck Planning 界面:用户在卡片上直接修改内容,不碰模板

改了第 5 页的标题,第 3 页和第 12 页不会被动。用户只改内容,不碰模板和排版,平台自动处理布局,改内容不会破坏设计。

除了对话式修改,平台还提供可视化编辑器,可以直接在 deck 上改文字、调结构。对话做大改,编辑器做微调,两种方式配合使用。

Catlaxy Deck 可视化编辑器:对话式修改 + deck 实时预览与直接编辑

Catlaxy Deck 可视化编辑器

03

品牌一致:49 个模板 + 企业品牌定制

Catlaxy Deck 内置 49 个模板,覆盖 11 个场景族:首尾页、数据卡片、流程图、对比矩阵、时间线、长文排版、图文混排等。每个模板都经过设计验证,Agent 根据内容自动匹配最合适的布局,不需要你自己选。

企业可以根据自身需求定制品牌色、字体、Logo 和视觉风格,配置一次之后所有产出自动套用。不需要每次生成时反复调整,品牌一致性由平台保证。

Catlaxy Deck 模板库:多种模板类型在不同 Theme 下的效果

Catlaxy Deck 部分模板展示

04

业务用户可用:不需要写代码

Agent 做 PPT 的信息来源不只是"你打的那句话"。Catlaxy Deck 支持四类信息源:

上传文件:PDF、Word、Excel、图片都行,平台自动解析提取关键信息。

数据分析结果:平台内置真正的数据分析能力(不是 AI 读数字猜结论),分析结果可以直接作为 PPT 的数据来源。

其他 Agent 的产出:在 Catlaxy 平台上完成的分析、研究、洞察,可以直接引用到 Deck Agent 作为内容来源。一个平台内完成从研究到演示的完整链路。

AI 搜索:Agent 可以主动搜索行业数据和竞品信息,搜索结果遵守事实边界规则,标明来源。

上传一份文件,3 分钟第一版 deck 就出来了。PDF、Word、Excel、图片都行,说一句"给客户做产品 pitch,10 分钟"就够了。接下来是两阶段工作流

两阶段工作流 · 先规划,再执行

01 ·

规划

Agent 先做判断:选叙事框架(痛点驱动、金字塔、故事型、数据型、方案型),定节奏(10 分钟 ≈ 10-15 页),从 49 个模板里选最匹配的布局。方案给你过目,不满意可以调。

02 ·

内容

确认规划后,Agent 直接完成每页内容。如果信息不够,会用结构化表单向你补问,不是开放式的"你想怎么做",而是具体的选择题。

数据可视化也是结构化的。Agent 写简化的图表描述(类型、数据、标签),平台渲染成可交互图表。Agent 不碰像素。

全程不需要写代码、不需要懂 HTML。

Catlaxy Deck Agent 对话界面:上传文件、Agent 规划、结构化表单确认

Catlaxy Deck Agent 对话界面

05

Token 效率:企业能承受的成本结构

以下数据来自 Catlaxy Deck 生产环境实测,Skill 路线参考 V2EX 公开 benchmark(10 页 deck $5-11):

维度 Skill / Code-gen Catlaxy Deck
LLM 调用次数 大量来回(每页多次) 2 次(20 页 deck)
输出端(每页) 完整 HTML/CSS/SVG
1000-1500 token
结构化 JSON
500-600 token
20 页 deck 总 token 10 万+ 6-7 万(核心生成)
20 页含 2 轮修改 $20-50 $0.30-0.80
200 份/月 $4,000-10,000/月 $60-160/月

差距超过 25 倍。以上是核心生成链路的成本(规划 + 内容生成),不含文档解析、搜索、视觉理解等前置处理。即便加上这些,总成本仍然远低于 Skill 路线,因为前置处理是一次性的,不随迭代次数线性增长。

而且这个成本是在使用当代主流模型(Sonnet 4.6)的前提下实现的,不是靠降级模型省钱。核心的规划和内容生成用 Sonnet 4.6,辅助任务用轻量模型,多模型混合调度。Skill 路线要求全程使用顶级模型才能写出合格的 HTML,模型选择没有弹性。

KEY INSIGHT · 延伸笔记 #1 的判断

AI 适合做判断,不适合做编排。
PPT 的视觉渲染也一样。

笔记 #1 讲平台级的确定性编排。这篇是同一个逻辑在 PPT 生成上的具体落地。

CLOSING · 收束

三条路线各有天花板。
选择取决于你的场景,不是技术偏好。

个人要的是速度,开发者要的是表现力,企业要的是可控生产。Catlaxy Deck 做的不是"更会做 PPT",是把企业演示变成一条可复用、可修改、可审计、可品牌化的生产线。

这是我们用 Catlaxy Deck 做的公司介绍。目前模板适配还在持续扩展中,Catlaxy Deck 已对所有客户开放免费公测。

三条路线定位图:Consumer SaaS、Skill/Code-gen、Agent+Platform 的企业适用度与使用门槛对比

三条路线定位:使用门槛 × 企业适用度

ABOUT · 关于

关于 CATLAXY AI(乐晞科技)

把企业的专家经验变成系统能力

交付方式

业务咨询:理解你的业务,找出 AI 该解的关键问题

平台定制:基于 CATLAXY AI 智能体系统KnowledgeOS,搭建专属 Agent 与知识库

持续陪跑:长期优化与扩展

行业覆盖

零售、餐饮、咨询、物业、汽车、电商、品牌、跨境,累计交付 180+ 个智能体。

联系

公众号:乐晞AI洞察

官网:catlaxy.com.cn

Deck 示例:公司介绍