AICG

  • 火爆全网的切水果ASMR视频,原来这样做!(附AI生成教程+免费通道)

    火爆全网的切水果ASMR视频,原来这样做!(附AI生成教程+免费通道)

    最近 TikTok、小红书、youtube,掀起了一股“AI切水果 ASMR”视频热潮:
    一把刀轻轻落下,水晶草莓啪地碎裂,带着玻璃破碎的清脆声,几秒钟让人身心放松,播放动辄几百万,评论全在求“原视频”

    这类视频到底怎么做?用的是哪个 AI 工具?是不是很复杂?要收费吗?

    今天这篇文章,手把手教你用谷歌 Veo 3 免费制作这类视频,零成本、零剪辑基础,照做就行👇 (不过,打开 Veo 3 链接需要点魔法配置)

    ✅ 第一步:准备提示词(Prompt)

    生成视频的核心是 文字提示词,就像给 AI 指令:

    “你要拍一个什么样的场景、有什么物体、什么镜头、什么声音”

    别自己瞎编提示词,新手最好的方式是:先抄,再改,再写

    🧠 示例提示词1(适合快速上手):

    Realistic 4K footage close up of a knife rapidly cutting a glowing purple glass peach on a wooden cutting board. Each slice falls apart with a crisp ASMR-style glass shatter sound.

    👉 你只需把 “purple glass peach” 改成想要的水果即可,比如 glass mango / apple / lemon...

    🧠 示例提示词2(高级版 + 多角度):

    Shot in extreme macro, a flawless, crystal-clear [fruit] rests on a wooden board under warm light. The knife slices it slowly with a clean “ting” sound. Reflections shimmer on the surface, ASMR-style audio layers blend gently in a quiet environment.

    👉 [fruit] 替换你想做的对象,比如 glass watermelon / diamond pineapple 等等。

    🔄 快速生成提示词(推荐 AI 帮写):

    让 DeepSeek / ChatGPT 模仿这些结构,做成模版,一行输入就能输出整段 prompt,比如:

    输入:蓝色玻璃柠檬
    输出:一整段Ve o提示词

    ✅ 第二步:使用 Veo 3 生成视频

    Veo 是谷歌最新推出的 文本生成视频工具,目前已经支持 1080P + ASMR 音效 + 多角度拍摄。

    📍方法1:Gemini 官网(简单易用)

    链接:https://gemini.google.com

    • 使用 Gemini 2.5 Pro 模型
    • 输入提示词
    • 点击视频按钮 → 等待生成

    📍方法2:Google Labs Flow(可自定义)

    链接:https://labs.google/flow/

    • 切换模型为:Veo 3 – Fast (Text to Video)
    • 可同时生成 1~4 条视频,支持续帧、转场
    • 积分消耗更灵活、参数更多

    🎬 最后的建议:别只玩,做账号!

    ASMR 切水果视频并不是“玩具”,而是一个 流量密码 + 内容模型

    你可以像 TikTok 爆款博主一样,把这类视频批量化生成、定期发布,做成专属账号。

    也可以走变现路径:

    • 打包你的生成经验、剪辑流程 → 做付费教程
    • 出售成品素材 → 挂淘宝 / 微店
    • 推 AI 工具 → 联盟佣金

    这类视频制作简单、门槛低、极度放松,非常适合短视频平台持续发布

  • 找到一个Github上非常优秀的AI项目Cradle,可控制鼠标、键盘,模拟人类操作,太丝滑,收藏~~~

    Cradle 是由 BAAI‑Agents 团队开源的一款面向 通用计算机控制(GCC) 的多模态 AI Agent 框架,可以让大型多模态模型,通过截图输入和键鼠输出,像人一样使用各种软件和游戏。

    • 通用目标:支持任意本地软件(如游戏、Office、图像/视频编辑工具)
    • 多模态输入:以截图为输入,支持键盘鼠标操作输出
    • 自主能力:内置“认知反思+技能更新”模块,能不断自我优化
    • 模块化设计:兼顾高可控性和扩展性,轻松适配新环境

    痛点场景

    自 GPT 系列大师诞生后,LLM 迎来爆发式成长。但它们依赖“API 文本输入输出”,迟迟无法控制本地界面,本地任务自动化仍然困难:

    • 操作 Office、可视化软件受限
    • 拆分复杂任务,难以形成闭环
    • 缺乏视觉能力,仅凭语言无法定位 UI 元素
    • 无法长时间记忆历史,执行多步逻辑不足

    Cradle 正是为解决这些痛点设计的:

    • 可控制鼠标、键盘,模拟人类操作
    • 强化“自我反思”“技能优化”策略
    • 支持长程任务、复合游戏环境、专业软件操作

    核心功能

    下面盘点 Cradle 的 6 大核心模块功能:

    1. 信息收集(Information Gathering)
      • 利用视觉模型处理 UI 截图、文字信息
      • 可接入音频反馈,完成联觉输入
    2. 自我反思(Self‑Reflection)
      • 回顾历史操作成果,判断是否达成
      • 总结失败原因,为下一步运行提供指导
    3. 任务推断(Task Inference)
      • 基于环境+历史记忆,推断当前目标
      • 动态规划接下来最优策略
    4. 技能策划(Skill Curation)
      • 每个任务生成或更新技能函数
      • 按环境定制化策略,实现经验积累
    5. 动作规划(Action Planning)
      • LLM 输出高层操作(如“点击 X”“移动鼠标到 Y”)
      • 人写桥接层翻译为键鼠动作
    6. 记忆模块(Memory)
      • 分为短期与长期记忆,含历史记录
      • 支持跨任务复用记忆与技能

    这些模块构成一套闭环:输入截图 → 所见 → 自省 → 规划 → 执行 → 记忆反馈。

    实验证明,Cradle 可完成:

    • AAA 游戏:Red Dead Redemption 2 主线任务、高成功率完成;
    • 市政游戏:Cities: Skylines 打造千人城市;
    • 农场游戏:Stardew Valley 自动播种收获;
    • 经营游戏:Dealer’s Life 2 实现 87% 最高周盈利;
    • 办公软件:登录 Chrome、回复 Outlook、使用 Feishu;
    • 编辑工具:美图秀秀、CapCut 图像/视频处理。

    技术架构

    技术优势一览表

    技术优势描述
    完全无 API 洞察不依赖 UI 内部接口,适配广泛软件
    高度模块化配置易扩展至新游戏或软件环境
    能力逐步增强LLM + 自反思 + 记忆技术,支持自提升
    通用操作接口截图 + 键鼠输出,真正通用

    界面示意

    应用场景

    • R&D AI Agent 能自主模拟用户操作,替代 UI API 测试https://wxa.wxs.qq.com/tmpl/mi/base_tmpl.html
    • 自动化办公: 大量重复任务(邮件、表格、报表)可彻底自动化
    • 游戏 AI 研发: 成为游戏内智能体,测试任务/训练 NPC
    • 流程自动化:提供 UI 自动流水线,少依赖传统 RPA
    • 教育培训: Cradle 可演示操作方法,辅助学员理解复杂软件

    谁更强?

    框架项目支持模式是否依赖 API关键需求核心优势
    Cradle截图 + 键鼠操作❌ 无 API完整闭环、自主学习通用性、模块化、适配广
    LangChain Agent文本 API 输入输出✅ 有 API文本指令 / HTTP 请求精于信息检索、文本管理
    AutoHotkey / RPA 等键鼠宏❌ 无 API单步宏操作,缺记忆规划易用但智力低,自提升弱
    Playwright/SeleniumDOM 操作 API✅ DOM API网页自动化擅长网页,局限性大于桌面

    优势结论:Cradle 领先于传统或网页自动化工具,是多模态、具备认知能力的“通用软件执行体”。

    文章小结

    • Cradle 是首个通用软件控制 AI Agent,支持各种本地软件和 AAA 游戏操作
    • 核心为 6 大模块,具备自思考、自学习、自适应能力
    • 技术架构模块化、可维护性强
    • 相比传统工具,Cradle 拥有视频级体验、全局闭环智能
    • 适用研发自动化、办公、游戏研发与教学等场景

    项目地址

    https://github.com/baai-agents/cradle

  • 用智能体一键生成沉浸式历史故事,真是太香了

    哈喽,大家好,我是李华,全网超十万粉丝的AI博主,专注于AI科普与智能体分享。

    最近我一直在研究用Coze来生成一系列自媒体短视频的智能体工作流,目标是一键生成各种爆款短视频。

    今天要分享的是沉浸式历史故事视频智能体工作流,我们先来看案例。

    这个抖音账号 @奇异史 才56条作品,竟然涨粉48万,条条都是爆款。

    经过几天的研究,我终于把它的逻辑和流程理清楚了,并且开发出了工作流。

    我只要在工作流运行框中输入一个历史类话题,点击试运行,很快就能一键帮我生成一个爆款历史短视频。

    比如我输入的是“暗度陈仓”,点击运行后,生成了短视频草稿,然后在剪映中导出草稿,就有了下面的视频。

    看了演示效果,那这个工作流是怎么制作的呢?

    一、开发思路:

    1. 通过大模型根据主题生成文案主题,背景,及图像提示词
    2. 根据提示词生成分镜图片
    3. 通过图像生成及画板模块确定画面展示效果
    4. 根据音频生成时间线,并创建剪映草稿

    三、详细工作流分析

    1、开始节点

    2、根据主题生成短视频文案

    3、借助大模型生成分镜提示词

    4、批处理生成图片、音频

    5、创建剪映草稿,并根据音频生成对应时间线

    到此,沉浸式历史故事的工作流就开发完成了。

    感谢您的阅读,如果本文对您有帮助的话,请点赞关注哦,我将持续给大家分享好用的工作流教程。

    目前这个工具已经放在我们的共享空间啦,还有超几十个智能体工作流等你来体验~


    欢迎加入我的AI智能体工作空间

    你将获取到的权益:

    〇 进入共创空间,几十个智能体工作流随心用,还会持续新增更多工作流

    〇 专属会员群答疑服务,智能体工作流使用中的任何问题均可

    〇 会员朋友可以提智能体需求,需求多的就开发出来放空间供大家使用