AI 做 PPT 最大的问题,不是能不能生成页面,而是生成出来能不能继续改。很多工具输出一堆图片,看着还行,到了客户修改、老板改字、设计调版时就废了。
Banana Slides 押的是另一条路:上传模板图片和素材,让 AI 解析内容,按自然语言生成或修改页面,并导出可编辑 PPTX。它更像一个 AI PPT 工作台,而不是一次性海报生成器。
先跑起来
克隆项目:
git clone https://github.com/Anionex/banana-slides
cd banana-slides准备配置:
cp .env.example .env根据你使用的模型提供方配置环境变量。示例:
AI_PROVIDER_FORMAT=openai
OPENAI_API_KEY=YOUR_OPENAI_KEY
OPENAI_API_BASE=https://api.openai.com/v1也可以配置 Gemini 或 Vertex AI。生产环境不要把真实密钥提交进仓库。
先准备模板,不要直接开写
PPT 的质量很大程度来自模板。建议先准备三类模板图片:
封面页:标题、副标题、品牌视觉
内容页:两栏、三栏、图文混排、时间线
结尾页:总结、行动建议、联系方式模板不要太复杂。AI 需要理解版式,如果模板本身全是特效、叠层和微小文字,生成稳定性会下降。
素材要先分包
不要把几十个文档和图片一次性丢进去。建议按用途分包:
brief.md:演示目标和受众
outline.md:页结构
facts.md:必须保留的事实和数字
assets/:图片、截图、图表
style/:品牌色、字体、禁用风格AI 做 PPT 时最怕信息混乱。你给它越像项目资料包,它越容易产出可复核内容。
用自然语言修改要具体
不要说“高级一点”“更好看”。要说清楚改哪里。
把第 3 页改成左右两栏,左侧保留三个痛点,右侧放解决方案。
第 5 页减少文字,每个卡片最多 18 个字。
把所有标题改成更像产品发布会的口吻,但不要夸张。AI 修改 PPT 的关键,是把设计反馈变成可执行指令。模糊反馈只会让页面来回漂。
导出后必须人工复核
可编辑 PPTX 只是交付基础,不代表内容正确。导出后至少检查五项:
标题是否和大纲一致
数字和事实是否准确
图片是否拉伸变形
字体是否缺失
页面是否能在 PowerPoint 或 Keynote 正常打开如果要对外发,最好再导出 PDF 看最终视觉。PPTX 在不同系统字体下可能会跑版。
适合哪些场景
Banana Slides 适合产品方案、课程讲义、内部汇报、活动提案、客户初稿。它不适合完全替代品牌设计师,也不适合生成需要强合规审查的财务、法律材料最终稿。
AI PPT 的正确用法,是把从 0 到 1 的搭架子速度提上来,把人从低价值排版里解放出来。最终判断、事实复核、叙事节奏,还是人负责。
别把 PPT 生成当魔法。把模板、素材、指令和复核流程管住,它才真能进入工作流。
做一份页面规格再生成
高质量 PPT 不建议只靠一句话生成。可以先写页面规格:
第 1 页:封面,讲清主题和结论
第 2 页:问题背景,三条痛点
第 3 页:方案架构,左流程右说明
第 4 页:落地步骤,时间线
第 5 页:风险和边界,表格形式
第 6 页:下一步行动这个规格越清楚,AI 生成越稳定。尤其是客户方案和内部汇报,先把信息结构定住,视觉才不会跑偏。
素材解析要人工筛一遍
上传素材前,先把无关图片、旧版本截图、重复文档删掉。AI 对素材来者不拒,但 PPT 不能什么都放。
可以按三档处理:
必须使用:Logo、产品截图、关键数据图
可参考:竞品页面、风格示例、旧版 PPT
禁止使用:过期价格、内部截图、未授权图片这一步很土,但很有效。素材不干净,生成出来的 PPT 会把脏东西包装得很漂亮。
交付前做一次演讲检查
PPT 不是静态文档,最后要能讲。导出后建议按演讲顺序过一遍:每页一句核心话,页间转场是否自然,听众能不能在 5 秒内看懂重点。
AI 擅长快速搭页,人擅长判断节奏。精品 PPT 最后一定要有人读、有人讲、有人删。