AICG

  • ネットで話題の激辛カットフルーツASMR動画、こんな風にできることが判明!(AI生成チュートリアル+無料チャンネル付き)

    ネットで話題の激辛カットフルーツASMR動画、こんな風にできることが判明!(AI生成チュートリアル+無料チャンネル付き)

    最近、TikTok、Xiaohongshu、youtubeが「AIフルーツカッティングASMR」動画の波を起こしている:
    ナイフがそっと落ち、クリスタルのイチゴがガラスの割れるような鮮明な音とともにパチンと音を立てて砕け散った。再生回数は数百万回に達し、"オリジナルのビデオ "を求めるコメントが寄せられている。.

    この種のビデオは具体的にどのように作られるのか?どのAIツールを使っているのですか?複雑ですか?有料ですか?

    今日の投稿Google Veo 3 無料制作ハンズオンこの種のビデオ、コストゼロ、編集の基本ゼロ、ただやるだけです👇(ただし、オープン ヴェオ 3 (リンクにはポイントマジックの設定が必要)

    ✅ ステップ1:プロンプト(促音)の準備

    生成されたビデオの核心は テキストアラートAIに指示を与えるようなものだ:

    "どんなシーンで、どんなものを、どんなショットで、どんな音で撮るのか"

    初心者に一番いいのは、自分でキュー・ワードを作らないことだ:コピーして、変えて、書く。.

    🤎 例題のプロンプトワード 1 (すぐに始めるのに適しています):

    木製のまな板の上で、紫色に光るガラスの桃をナイフで素早く切るリアルな4K映像のクローズアップ。 一切れ一切れ、ASMR風の鮮明なガラスの砕ける音とともにバラバラになる。ASMR風のガラスの粉々音。

    👉「紫のグラスピーチ」を、グラスマンゴー/リンゴ/レモン...など、希望のフルーツに変えるだけ。

    🧠 プロンプト・ワードの例2(プレミアム+複数の視点):

    極端なマクロで撮影された、温かな光の下で木の板の上に置かれた、完璧で透明な[果物]。 ナイフが「チーン」というきれいな音を立てながら、それをゆっくりと切っていく。表面には反射光が揺らぎ、ASMRスタイルのオーディオレイヤーが静かな環境の中で優しく溶け合う。

    👉[果物]作りたいものに置き換える(例:ガラススイカ/ダイヤモンドパイナップルなど)。

    🔄 迅速にプロンプトワードを生成する(AIヘルプライティングを推奨):

    DeepSeek / ChatGPTにこれらの構造を模倣させ、たとえば1行の入力がプロンプト全体を出力するようなテンプレートを作成させます:

    インプット:ブルーグラス・レモン
    出力:段落全体のキューワード

    ✅ ステップ 2: Veo 3 でビデオを生成する

    VeoはGoogleの最新作 テキストをビデオに変換するツール1080P+ASMRサウンド+マルチアングル撮影に対応。

    方法1:ジェミニ公式サイト(簡単に利用できる)

    リンク:https://gemini.google.com

    • ジェミニ2.5プロモデルを使用して
    • プロンプトを入力
    • ビデオボタンをクリック → 生成を待つ

    方法2:Google Labs Flow(カスタマイズ可能)

    リンク:https://labs.google/flow/

    • モデルの切り替え:Veo 3 - Fast(テキストからビデオへ)
    • 連続したフレームとトランジションで1~4本のビデオを同時生成。
    • より柔軟なポイント消費とより多くのパラメーター

    🎬 最後のアドバイス:ただプレーするだけでなく、アカウントを作ること!

    ASMRのフルーツカット・ビデオは "おもちゃ "ではない。 トラフィックコード+コンテンツモデル.

    TikTokのポップアップブロガーがやっているように、この種のビデオを作ることができる。バッチ生成、レギュラーリリース専用口座にした。

    悟りの道を歩むこともできる:

    • 自分の世代経験、編集プロセスをパッケージ化する→有料チュートリアルを行う
    • 完成した材料を売る→タオバオ/Weishopをぶら下げる
    • プッシュ型AIツール → アフィリエイト報酬

    この種のビデオは作りやすく、敷居が低く、非常にリラックスできる。コンスタントに投稿する短い動画プラットフォームに最適.

  • Githubの非常に良いAIプロジェクトクレードルを発見し、マウス、キーボードを制御することができ、人間の操作をシミュレートし、あまりにも絹のような滑らかな、コレクション〜〜〜〜。

    クレードル BAAI-Agentsチームのオープンソースです。 ゼネラル・コンピューター・コントロール(GCC) のマルチモーダルAIエージェントフレームワークは、大規模なマルチモーダルモデルが、スクリーンショット入力やキーストローク出力を通じて、人間のように様々なソフトウェアやゲームを使用することを可能にする。

    • 共通の目標:あらゆるネイティブ・ソフトウェアをサポートする(ゲーム、Office、画像/ビデオ編集ツールなど)
    • マルチモーダル入力:入力としてスクリーンショット、サポートキーボードとマウス操作の出力
    • 自律性:継続的な自己最適化のための「認知的考察+スキル更新」モジュールを内蔵。
    • モジュール設計:高い制御性と拡張性、新しい環境への適応が容易。

    ペインポイントシナリオ

    GPTシリーズの第一人者が誕生して以来、LLMは爆発的に普及した。しかし、それらは「APIのテキスト入出力」に依存しているため、ローカルインターフェースの制御ができず、ローカルタスクの自動化はまだ難しい:

    • オフィス、ビジュアライゼーション・ソフトウェアの操作に制限がある
    • 複雑なタスクを分割すると、ループを閉じるのが難しくなる
    • 視覚的スキルが不足しており、言語だけではUI要素を特定できない。
    • 歴史を長期間記憶することができず、多段階のロジックを十分に実行できない。

    クレイドルは、このようなペインポイントに対処するために設計されている:

    • 人間の操作をシミュレートするマウスとキーボード操作
    • 自己反省」と「スキルの最適化」戦略の強化
    • 長期的なタスク、複雑なゲーム環境、プロフェッショナルなソフトウェア操作に対応

    コア機能

    以下は、クレイドルの6つのコアモジュール機能のリストである:

    1. 情報収集
      • ビジュアルモデルを使ってUIのスクリーンショットやテキストメッセージを処理する
      • 音声フィードバックにアクセスすることで、インターオセプティブ・インプットを完成させることができる。
    2. 自己反省
      • 過去の営業成績を検証し、達成されたかどうかを判断する
      • 失敗の理由をまとめ、次の作戦のためのガイダンスを提供する。
    3. タスク推論
      • 環境+過去の記憶から現在のゴールを推測する
      • 動的計画法 次善の策
    4. スキル・キュレーション
      • 各タスクのスキル関数を生成または更新する
      • 経験を可能にする環境別のカスタマイズされた戦略
    5. 行動計画
      • LLMは高レベルのアクション(例えば「Xをクリック」「マウスをYに移動」)を出力する。
      • 人間が書いたブリッジング・レイヤーをキーストローク・アクションに変換
    6. メモリモジュール(メモリ)
      • 歴史的記録を含む短期記憶と長期記憶
      • 記憶とスキルの再利用をサポート

    これらのモジュールは、入力されたスクリーンショット→見たもの→内省→計画→実行→記憶のフィードバックという一連の閉じたループを形成する。

    ゆりかごが実現可能であることは実験で証明されている:

    • AAAゲーム:レッド・デッド・リデンプション2 メインクエスト、高い成功率で完了;
    • 自治体対抗戦:シティーズ:スカイライン 千の都市を創造する
    • ファームゲーム:スターデューバレー 自動播種と収穫;
    • ビジネスゲーム:ディーラーズ・ライフ2 週間最高利益87%を達成;
    • オフィスソフト:Chromeにサインイン、Outlookに返信、Feishuを使用;
    • 編集ツール:Meituxiu、CapCut画像/ビデオ処理。

    テクノロジー・アーキテクチャー

    技術的優位性一覧

    テクニカル・アドバンテージ説明
    APIインサイトがまったくない内部UIインターフェースに依存せず、幅広いソフトウェアに適応。
    高度なモジュール構成新しいゲームやソフトウェア環境への拡張が容易
    段階的な能力向上LLM+自己反省+記憶術で自己向上をサポート
    ユニバーサル・オペレーティング・インターフェーススクリーンショット+キーボード&マウス出力、真のユニバーサル

    インターフェイスの図解

    アプリケーションシナリオ

    • 研究開発 AI エージェントがユーザーの行動を自律的にシミュレートし、UI API テストに取って代わる https://wxa.wxs.qq.com/tmpl/mi/base_tmpl.html
    • オフィスの自動化:多くの反復作業(Eメール、フォーム、レポート)を完全に自動化できる。
    • ゲームAI開発:ゲーム内のインテリジェンスとなり、ミッションのテストやNPCの訓練を行う。
    • プロセス自動化:従来のRPAに依存することなく、UIの自動化されたパイプラインを提供する。
    • 教育およびトレーニング:クレイドルは、生徒が複雑なソフトウェアを理解できるよう、操作方法を実演します。

    どちらが強いか?

    フレームワーク・プロジェクトサポートモードAPIに依存しているかどうか主な要件コアの強み
    クレードルスクリーンショット+キーボードAPI なし完全なクローズド・ループの自己学習汎用性、モジュール性、幅広い適応性
    ラングチェーンエージェントテキストAPI入出力✅ API付きテキストコマンド / HTTPリクエスト情報検索、テキスト管理の専門知識
    AutoHotkey / RPAなどキーボードマウスマクロAPI なしシングルステップマクロ操作、メモリプランニングの欠如使いやすいが、知能が低く、自己改善が弱い。
    劇作家/セレニウムDOM操作APIDOM APIウェブオートメーションウェブは得意だが、デスクトップより制限される

    強み:Cradleは、従来の自動化ツールやウェブ自動化ツールを超える、マルチモーダルな認知機能付き「ユニバーサル・ソフトウェア実行可能ツール」である。

    記事の概要

    • クレイドルは、初の汎用ソフトウェア制御AIエージェントである。幅広いローカルソフトウェアとAAAゲームの操作に対応。
    • コアとなるのは、自己思考、自己学習、自己適応能力を備えた6つのモジュールだ。
    • モジュール式で保守性の高いテクニカル・アーキテクチャ
    • 従来のツールに比べ、Cradleはビデオクオリティの体験、グローバルなクローズドループインテリジェンスを提供します。
    • 研究開発の自動化、オフィス、ゲーム開発、教育現場などに適しています。

    プロジェクト住所

    https://github.com/baai-agents/cradle

  • ボタンを押すだけで、スマートな身体を使って没入感のある歴史的ストーリーを生み出すのは、とてもいい匂いだ!

    AIサイエンスとインテリジェント・ボディ・シェアリングに焦点を当て、ウェブ上で10万人以上のフォロワーを持つAIブロガーの李華です。

    最近、私はCozeを使って一連の短い自費出版ビデオを生成するためのインテリジェントなボディワークフローに取り組んでいる。

    今日は、没入型歴史ストーリーテリング・ビデオ・インテリジェンス・ボディのワークフローを紹介し、ケーススタディから始めます。

    このジッターバグのアカウント奇妙な歴史 わずか56のエントリーで、48万人のファンを驚かせた。

    数日間の調査の後、私はようやくそのロジックと流れを整理し、ワークフローを開発した。

    ワークフローの実行ボックスに履歴ベースのトピックを入力し、試運転をクリックするだけで、すぐに短いポップアップ履歴ビデオがワンクリックで生成された。

    例えば、"darkness "と入力して実行をクリックし、短いビデオ草稿を作成した。

    デモの動きを見て、このワークフローはどのように作られたのですか?

    I. アイデアの発展

    1. ビッグモデルを通じて、テーマに基づいたコピーのトピック、コンテキスト、イメージキューを生成する。
    2. 手がかりとなる派生語に基づく鏡像
    3. 画像生成とドローイングボードモジュールによる画面表示の決定
    4. 音声からタイムラインを生成し、カットシーンの下書きを作成する。

    III.詳細なワークフロー分析

    1.スタートノード

    2、テーマに沿った短いビデオコピーを作成する。

    3、大きな模型の助けを借りて、生徒が鏡に映ったプロンプトの言葉に答える。

    4、画像、音声を生成するバッチ処理

    5.下書きカットアウトを作成し、オーディオに基づいて対応するタイムラインを生成します。

    この時点で、没入型歴史ストーリーテリングのワークフローが構築される。

    この記事を読んでいただきありがとうございます、この記事はあなたに有用である場合、ああに注意を払うようにお願いします、私は良いワークフローのチュートリアルを共有し続けます。

    このツールは私たちの共有スペースに置かれ、何十ものインテリジェントなワークフローが、あなたが体験するのを待っている〜!


    AIインテリジェンシアのワークスペースへようこそ!

    権利と利益を取得する:

    Co-Creationスペースに入れば、何十ものインテリジェントなワークフローが自由に使えます!

    〇 独占的な会員グループQ&Aサービス、インテリジェントなボディワークフローは、どんな質問でも使用することができます。

    会員や友人からスマートボディの要望があれば、誰でも利用できるスペースを設置し、さらなる需要を開拓していく!