AICG

Chinese

English

Japanese

German

火爆全网的切水果ASMR视频，原来这样做！（附AI生成教程+免费通道）
最近 TikTok、小红书、youtube，掀起了一股“AI切水果 ASMR”视频热潮：
一把刀轻轻落下，水晶草莓啪地碎裂，带着玻璃破碎的清脆声，几秒钟让人身心放松，播放动辄几百万，评论全在求“原视频”。

这类视频到底怎么做？用的是哪个 AI 工具？是不是很复杂？要收费吗？

今天这篇文章，手把手教你用谷歌 Veo 3 免费制作这类视频，零成本、零剪辑基础，照做就行👇 （不过，打开 Veo 3 链接需要点魔法配置）

✅ 第一步：准备提示词（Prompt）

生成视频的核心是 文字提示词，就像给 AI 指令：

“你要拍一个什么样的场景、有什么物体、什么镜头、什么声音”

别自己瞎编提示词，新手最好的方式是：先抄，再改，再写。

🧠 示例提示词1（适合快速上手）：

Realistic 4K footage close up of a knife rapidly cutting a glowing purple glass peach on a wooden cutting board. Each slice falls apart with a crisp ASMR-style glass shatter sound.

👉 你只需把 “purple glass peach” 改成想要的水果即可，比如 glass mango / apple / lemon...

🧠 示例提示词2（高级版 + 多角度）：

Shot in extreme macro, a flawless, crystal-clear [fruit] rests on a wooden board under warm light. The knife slices it slowly with a clean “ting” sound. Reflections shimmer on the surface, ASMR-style audio layers blend gently in a quiet environment.

👉 [fruit] 替换你想做的对象，比如 glass watermelon / diamond pineapple 等等。

🔄 快速生成提示词（推荐 AI 帮写）：

让 DeepSeek / ChatGPT 模仿这些结构，做成模版，一行输入就能输出整段 prompt，比如：

输入：蓝色玻璃柠檬
输出：一整段Ve o提示词

✅ 第二步：使用 Veo 3 生成视频

Veo 是谷歌最新推出的 文本生成视频工具，目前已经支持 1080P + ASMR 音效 + 多角度拍摄。

📍方法1：Gemini 官网（简单易用）

链接：https://gemini.google.com
- 使用 Gemini 2.5 Pro 模型
- 输入提示词
- 点击视频按钮 → 等待生成
📍方法2：Google Labs Flow（可自定义）

链接：https://labs.google/flow/
- 切换模型为：Veo 3 – Fast (Text to Video)
- 可同时生成 1~4 条视频，支持续帧、转场
- 积分消耗更灵活、参数更多
🎬 最后的建议：别只玩，做账号！

ASMR 切水果视频并不是“玩具”，而是一个 流量密码 + 内容模型。

你可以像 TikTok 爆款博主一样，把这类视频批量化生成、定期发布，做成专属账号。

也可以走变现路径：
- 打包你的生成经验、剪辑流程 → 做付费教程
- 出售成品素材 → 挂淘宝 / 微店
- 推 AI 工具 → 联盟佣金
这类视频制作简单、门槛低、极度放松，非常适合短视频平台持续发布。
2025年7月13日

找到一个Github上非常优秀的AI项目Cradle，可控制鼠标、键盘，模拟人类操作，太丝滑，收藏～～～

Cradle 是由 BAAI‑Agents 团队开源的一款面向 通用计算机控制（GCC） 的多模态 AI Agent 框架，可以让大型多模态模型，通过截图输入和键鼠输出，像人一样使用各种软件和游戏。

通用目标：支持任意本地软件（如游戏、Office、图像/视频编辑工具）
多模态输入：以截图为输入，支持键盘鼠标操作输出
自主能力：内置“认知反思+技能更新”模块，能不断自我优化
模块化设计：兼顾高可控性和扩展性，轻松适配新环境

痛点场景

自 GPT 系列大师诞生后，LLM 迎来爆发式成长。但它们依赖“API 文本输入输出”，迟迟无法控制本地界面，本地任务自动化仍然困难：

操作 Office、可视化软件受限
拆分复杂任务，难以形成闭环
缺乏视觉能力，仅凭语言无法定位 UI 元素
无法长时间记忆历史，执行多步逻辑不足

Cradle 正是为解决这些痛点设计的：

可控制鼠标、键盘，模拟人类操作
强化“自我反思”“技能优化”策略
支持长程任务、复合游戏环境、专业软件操作

核心功能

下面盘点 Cradle 的 6 大核心模块功能：

信息收集（Information Gathering）
- 利用视觉模型处理 UI 截图、文字信息
- 可接入音频反馈，完成联觉输入
自我反思（Self‑Reflection）
- 回顾历史操作成果，判断是否达成
- 总结失败原因，为下一步运行提供指导
任务推断（Task Inference）
- 基于环境+历史记忆，推断当前目标
- 动态规划接下来最优策略
技能策划（Skill Curation）
- 每个任务生成或更新技能函数
- 按环境定制化策略，实现经验积累
动作规划（Action Planning）
- LLM 输出高层操作（如“点击 X”“移动鼠标到 Y”）
- 人写桥接层翻译为键鼠动作
记忆模块（Memory）
- 分为短期与长期记忆，含历史记录
- 支持跨任务复用记忆与技能

这些模块构成一套闭环：输入截图 → 所见 → 自省 → 规划 → 执行 → 记忆反馈。

实验证明，Cradle 可完成：

AAA 游戏：Red Dead Redemption 2 主线任务、高成功率完成；
市政游戏：Cities: Skylines 打造千人城市；
农场游戏：Stardew Valley 自动播种收获；
经营游戏：Dealer’s Life 2 实现 87% 最高周盈利；
办公软件：登录 Chrome、回复 Outlook、使用 Feishu；
编辑工具：美图秀秀、CapCut 图像/视频处理。

技术架构

技术优势一览表

技术优势	描述
完全无 API 洞察	不依赖 UI 内部接口，适配广泛软件
高度模块化配置	易扩展至新游戏或软件环境
能力逐步增强	LLM + 自反思 + 记忆技术，支持自提升
通用操作接口	截图 + 键鼠输出，真正通用

界面示意

应用场景

R&D AI Agent 能自主模拟用户操作，替代 UI API 测试https://wxa.wxs.qq.com/tmpl/mi/base_tmpl.html
自动化办公：大量重复任务（邮件、表格、报表）可彻底自动化
游戏 AI 研发：成为游戏内智能体，测试任务/训练 NPC
流程自动化：提供 UI 自动流水线，少依赖传统 RPA
教育培训： Cradle 可演示操作方法，辅助学员理解复杂软件

谁更强？

框架项目	支持模式	是否依赖 API	关键需求	核心优势
Cradle	截图 + 键鼠操作	❌ 无 API	完整闭环、自主学习	通用性、模块化、适配广
LangChain Agent	文本 API 输入输出	✅ 有 API	文本指令 / HTTP 请求	精于信息检索、文本管理
AutoHotkey / RPA 等	键鼠宏	❌ 无 API	单步宏操作，缺记忆规划	易用但智力低，自提升弱
Playwright/Selenium	DOM 操作 API	✅ DOM API	网页自动化	擅长网页，局限性大于桌面

优势结论：Cradle 领先于传统或网页自动化工具，是多模态、具备认知能力的“通用软件执行体”。

文章小结

Cradle 是首个通用软件控制 AI Agent，支持各种本地软件和 AAA 游戏操作
核心为 6 大模块，具备自思考、自学习、自适应能力
技术架构模块化、可维护性强
相比传统工具，Cradle 拥有视频级体验、全局闭环智能
适用研发自动化、办公、游戏研发与教学等场景

项目地址

https://github.com/baai-agents/cradle

2025年7月13日

用智能体一键生成沉浸式历史故事，真是太香了
哈喽，大家好，我是李华，全网超十万粉丝的AI博主，专注于AI科普与智能体分享。

最近我一直在研究用Coze来生成一系列自媒体短视频的智能体工作流，目标是一键生成各种爆款短视频。

今天要分享的是沉浸式历史故事视频智能体工作流，我们先来看案例。

这个抖音账号 @奇异史 才56条作品，竟然涨粉48万，条条都是爆款。

经过几天的研究，我终于把它的逻辑和流程理清楚了，并且开发出了工作流。

我只要在工作流运行框中输入一个历史类话题，点击试运行，很快就能一键帮我生成一个爆款历史短视频。

比如我输入的是“暗度陈仓”，点击运行后，生成了短视频草稿，然后在剪映中导出草稿，就有了下面的视频。

看了演示效果，那这个工作流是怎么制作的呢？

一、开发思路：
1. 通过大模型根据主题生成文案主题，背景，及图像提示词
2. 根据提示词生成分镜图片
3. 通过图像生成及画板模块确定画面展示效果
4. 根据音频生成时间线，并创建剪映草稿
三、详细工作流分析

1、开始节点

2、根据主题生成短视频文案

3、借助大模型生成分镜提示词

4、批处理生成图片、音频

5、创建剪映草稿，并根据音频生成对应时间线

到此，沉浸式历史故事的工作流就开发完成了。

感谢您的阅读，如果本文对您有帮助的话，请点赞关注哦，我将持续给大家分享好用的工作流教程。

目前这个工具已经放在我们的共享空间啦，还有超几十个智能体工作流等你来体验~

欢迎加入我的AI智能体工作空间

你将获取到的权益：

〇进入共创空间，几十个智能体工作流随心用，还会持续新增更多工作流

〇专属会员群答疑服务，智能体工作流使用中的任何问题均可

〇会员朋友可以提智能体需求，需求多的就开发出来放空间供大家使用
2025年7月13日

AICG

火爆全网的切水果ASMR视频，原来这样做！（附AI生成教程+免费通道）

✅ 第一步：准备提示词（Prompt）

🧠 示例提示词1（适合快速上手）：

🧠 示例提示词2（高级版 + 多角度）：

🔄 快速生成提示词（推荐 AI 帮写）：

✅ 第二步：使用 Veo 3 生成视频

📍方法1：Gemini 官网（简单易用）

📍方法2：Google Labs Flow（可自定义）

🎬 最后的建议：别只玩，做账号！