AICG

  • Die feurigen Schnitt Obst ASMR Video auf der ganzen Internet, es stellt sich heraus, wie diese gemacht werden! (mit Tutorial zur KI-Erzeugung + kostenloser Kanal)

    Die feurigen Schnitt Obst ASMR Video auf der ganzen Internet, es stellt sich heraus, wie diese gemacht werden! (mit Tutorial zur KI-Erzeugung + kostenloser Kanal)

    In letzter Zeit haben TikTok, Xiaohongshu und youtube eine Welle von ASMR-Videos zum Schneiden von KI-Früchten ausgelöst:
    Ein Messer fiel sanft herab, und die kristallenen Erdbeeren zerbrachen mit dem knackigen Geräusch von zerbrechendem Glas, was Geist und Körper für einige Sekunden entspannte.Millionen von Aufrufen, Kommentare, die um das "Originalvideo" betteln..

    Wie genau werden diese Art von Videos erstellt? Welches KI-Tool wird verwendet? Ist es kompliziert? Ist es kostenpflichtig?

    Der heutige Beitrag.Praktische Erfahrung mit Google Veo 3 Free ProductionDiese Art von Videos, null Kosten, null Bearbeitungsgrundlagen, machen Sie es einfach 👇 (öffnen Sie jedoch die Veo 3 (Link erfordert die Konfiguration von Point Magic)

    ✅ Schritt 1: Vorbereiten der Eingabeaufforderung (Prompt)

    Der Kern des erzeugten Videos ist TextmeldungEs ist, als würde man einer KI Anweisungen geben:

    "Was für eine Szene drehen Sie, welche Objekte gibt es, welche Aufnahmen, welche Geräusche"

    Denken Sie sich keine eigenen Stichworte aus, das ist der beste Weg für Neulinge, es zu tun:Erst kopieren, dann ändern, dann schreiben..

    🧠 Beispiel Aufforderungswort 1 (gut für den schnellen Einstieg):

    Realistische 4K-Aufnahmen in Nahaufnahme eines Messers, das schnell einen glühenden lila Glaspfirsich auf einem Holzbrett schneidet. Jede Scheibe fällt mit einem knackigen ASMR-ähnlichen Glaszersplitterungsgeräusch auseinander. Stil Glas zerbrechen Ton.

    👉 Du musst nur "lila Glaspfirsich" in die gewünschte Frucht ändern, z.B. Glasmango / Apfel / Zitrone...

    🧠 Beispiel Prompt Word 2 (Premium + Multiple Perspectives):

    In extremer Makroaufnahme ruht eine makellose, kristallklare [Frucht] auf einem Holzbrett unter warmem Licht. Das Messer schneidet sie langsam mit einem sauberen "ting"-Geräusch. Reflexionen schimmern auf der Oberfläche, ASMR-artige Audioschichten mischen sich sanft in eine ruhige Umgebung.

    👉 [Obst] Ersetzen Sie das Objekt, das Sie herstellen möchten, z. B. Wassermelone aus Glas / Diamantananas usw.

    🔄 Schnelles Erzeugen von Aufforderungswörtern (KI-Schreibhilfe empfohlen):

    Lassen Sie DeepSeek / ChatGPT diese Strukturen nachahmen und eine Vorlage erstellen, bei der eine einzige Eingabezeile z. B. eine ganze Eingabeaufforderung ausgibt:

    Eingang: Blaues Glas Zitrone
    Ausgabe: ein ganzer Absatz mit vielen Stichwörtern

    ✅ Schritt 2: Video mit Veo 3 generieren

    Veo ist Googles neueste Text-zu-Video-ToolEs hat Unterstützung für 1080P + ASMR-Sound + Multi-Winkel-Aufnahmen.

    📍 Methode 1: Offizielle Gemini-Website (einfach zu bedienen)

    Link: https://gemini.google.com

    • Verwendung des Modells Gemini 2.5 Pro
    • Geben Sie die Aufforderung
    • Klicken Sie auf die Schaltfläche für das Video → warten Sie auf die Generierung

    📍 Methode 2: Google Labs Flow (anpassbar)

    Link: https://labs.google/flow/

    • Modellwechsel zu: Veo 3 - Schnell (Text zu Video)
    • Gleichzeitige Erstellung von 1~4 Videos mit kontinuierlichen Bildern und Übergängen
    • Flexiblerer Punktverbrauch und mehr Parameter

    🎬 Letzter Ratschlag: nicht nur spielen, sondern Konten anlegen!

    Das ASMR-Video zum Obstschneiden ist kein "Spielzeug", sondern ein Traffic Codes + Inhaltsmodelle.

    Sie können diese Art von Videos wie die TikTok-Pop-up-Blogger machenChargengenerierung, regelmäßige Freigabezu einem exklusiven Konto gemacht.

    Sie können auch den Weg der Verwirklichung gehen:

    • Verpacken Sie Ihre Erzeugungserfahrung, den Bearbeitungsprozess → machen Sie bezahlte Tutorials
    • Verkaufe fertiges Material → Hängende Taobao / Weishop
    • Push AI Tools → Partnerprovisionen

    Diese Art von Videos ist einfach zu erstellen, barrierearm, äußerst entspannend undHervorragend geeignet für kurze Videoplattformen, die regelmäßig veröffentlicht werden.

  • Fand eine Github sehr gute AI-Projekt Cradle, kann die Maus, Tastatur, simulieren den menschlichen Betrieb, zu seidig glatt, Sammlung ~ ~ ~ ~

    Wiege Es ist eine offene Quelle für das Team der BAAI-Agenten. Allgemeine Computersteuerung (GCC) s multimodales KI-Agenten-Framework, das es großen multimodalen Modellen ermöglicht, eine Vielzahl von Software und Spielen wie ein Mensch zu nutzen, indem sie Screenshots eingeben und Tastatureingaben tätigen.

    • Gemeinsames Ziel: Unterstützung jeglicher nativer Software (z. B. Spiele, Office, Bild-/Videobearbeitungsprogramme)
    • Multimodale Eingabe: Bildschirmfoto als Eingabe, Unterstützung von Tastatur- und Mausbedienung als Ausgabe
    • Autonomie: Eingebautes Modul "kognitive Reflexion + Aktualisierung der Fähigkeiten" für kontinuierliche Selbstoptimierung.
    • Modularer Aufbau: hohe Kontrollierbarkeit und Skalierbarkeit, einfache Anpassung an neue Umgebungen.

    Schmerzpunktszenario

    LLMs haben sich seit der Geburt der GPT-Reihe von Gurus explosionsartig entwickelt. Sie sind jedoch auf die "API-Texteingabe/-ausgabe" angewiesen, wodurch sie nicht in der Lage sind, die lokale Schnittstelle zu steuern, und die Automatisierung lokaler Aufgaben ist immer noch schwierig:

    • Bedienung von Office, Visualisierungssoftware ist eingeschränkt
    • Die Aufteilung komplexer Aufgaben erschwert das Schließen der Schleife
    • Mangelnde visuelle Fähigkeiten und Unfähigkeit, UI-Elemente allein aufgrund der Sprache zu finden
    • Unfähigkeit, sich über einen längeren Zeitraum an eine Geschichte zu erinnern und unzureichende Ausführung einer mehrstufigen Logik

    Cradle wurde entwickelt, um diese Probleme zu lösen:

    • Maus- und Tastatursteuerung, die die menschliche Bedienung simuliert
    • Verstärkung der Strategien "Selbstreflexion" und "Optimierung der Fähigkeiten"
    • Unterstützt weitreichende Aufgaben, komplexe Spielumgebungen und professionellen Softwarebetrieb

    Kernfunktionalität

    Nachfolgend finden Sie eine Liste der 6 Kernfunktionen des Cradle-Moduls:

    1. Sammeln von Informationen
      • Verwendung visueller Modelle zur Verarbeitung von UI-Screenshots und Textnachrichten
      • Audio-Feedback kann zur Vervollständigung des interozeptiven Inputs abgerufen werden
    2. Selbstreflexion
      • Überprüfung historischer Betriebsergebnisse, um festzustellen, ob sie erreicht wurden
      • Fassen Sie die Gründe für das Scheitern zusammen und geben Sie Hinweise für den nächsten Einsatz
    3. Aufgabe Inferenz
      • Ableitung aktueller Ziele auf der Grundlage von Umfeld und historischem Gedächtnis
      • Dynamische Programmierung Nächstbeste Strategie
    4. Kuratieren von Fertigkeiten
      • Erzeugen oder Aktualisieren von Kompetenzfunktionen für jede Aufgabe
      • Maßgeschneiderte Strategien für jede Umgebung, um Erfahrungen zu ermöglichen
    5. Aktionsplanung
      • LLM gibt High-Level-Aktionen aus (z. B. "Klick auf X", "Maus nach Y bewegen").
      • Übersetzung der von Menschen geschriebenen Überbrückungsschichten in Tastatureingaben
    6. Speichermodul (Speicher)
      • Kurzzeit- und Langzeitgedächtnis, einschließlich historischer Aufzeichnungen
      • Unterstützung der Wiederverwendung von Erinnerungen und Fähigkeiten bei verschiedenen Aufgaben

    Diese Module bilden eine Reihe von geschlossenen Kreisläufen: Eingabe Screenshot → was Sie sehen → Introspektion → Planung → Ausführung → Gedächtnisrückmeldung.

    Experimente haben bewiesen, dass Cradle erreicht werden kann:

    • AAA-Spiele:Red Dead Redemption 2 Hauptquests, hohe Erfolgsquote beim Abschluss;
    • Städtische Spiele:Städte: Skylines Die Schaffung einer Stadt der Tausend;
    • Bauernhof-Spiele:Stardew Valley Automatisches Säen und Ernten;
    • Wirtschaftsspiele:Das Leben des Händlers 2 Erzielen Sie den höchsten wöchentlichen Gewinn von 87%;
    • Bürosoftware: Bei Chrome anmelden, in Outlook antworten, Feishu verwenden;
    • Bearbeitungswerkzeuge: Meituxiu, CapCut Bild-/Videobearbeitung.

    Technologie Architektur

    Liste der technischen Vorteile

    Technischer VorteilBeschreibungen
    Keinerlei API-EinblickeEs ist nicht auf interne UI-Schnittstellen angewiesen und passt sich an eine breite Palette von Software an.
    Hochgradig modulare KonfigurationLeichte Skalierbarkeit für neue Spiele oder Softwareumgebungen
    Progressive KapazitätserweiterungLLM + Selbstreflexion + Gedächtnistechniken zur Unterstützung der Selbstverbesserung
    Universelle BedienoberflächeScreenshots + Tastatur- und Mausausgabe, wirklich universell

    Eine Illustration der Schnittstelle

    Anwendungsszenario

    • F&E-KI-Agent kann Benutzeraktionen autonom simulieren und ersetzt UI-API-Tests https://wxa.wxs.qq.com/tmpl/mi/base_tmpl.html
    • Büroautomatisierung: Eine große Anzahl sich wiederholender Aufgaben (E-Mails, Formulare, Berichte) kann vollständig automatisiert werden.
    • KI-Entwicklung im Spiel: Werden Sie zur Intelligenz im Spiel, testen Sie Missionen und trainieren Sie NPCs
    • Prozessautomatisierung: Bietet eine automatisierte UI-Pipeline mit weniger Abhängigkeit von herkömmlicher RPA
    • Bildung und Ausbildung: Cradle demonstriert, wie man etwas macht, und hilft den Schülern, komplexe Software zu verstehen.

    Wer ist stärker?

    RahmenprojekteUnterstützungsmodusUnabhängig davon, ob es sich auf eine API stützt oder nichtWichtige AnforderungenZentrale Stärken
    WiegeScreenshots + Tastaturschreiben❌ Keine APIVollständiges selbstgesteuertes Lernen in einem geschlossenen KreislaufVielseitigkeit, Modularität, große Anpassungsfähigkeit
    LangChain AgentText API Eingabe/Ausgabe✅ Mit APITextbefehle / HTTP-AnfragenFachkenntnisse in den Bereichen Information Retrieval, Textmanagement
    AutoHotkey / RPA usw.Tastatur- und Mausmakro (Informatik)❌ Keine APIEinschrittiger Makrobetrieb, fehlende SpeicherplanungEinfach zu bedienen, aber geringe Intelligenz, schwache Selbstverbesserung
    Dramatiker/SeleniumDOM Manipulation API✅ DOM APIWeb-AutomatisierungGut im Web, eingeschränkter als Desktop

    Stärken: Cradle ist eine multimodale, kognitiv unterstützte "universelle ausführbare Software", die über herkömmliche oder Web-Automatisierungswerkzeuge hinausgeht.

    Artikel Zusammenfassung

    • Cradle ist der erste universell einsetzbare, softwaregesteuerte KI-Agent.Unterstützt eine breite Palette von lokaler Software und AAA-Spielen.
    • Der Kern besteht aus 6 Modulen mit selbstdenkenden, selbstlernenden und selbstanpassenden Fähigkeiten.
    • Modulare und wartbare technische Architektur
    • Im Vergleich zu herkömmlichen Tools bietet Cradle ein Erlebnis in Videoqualität, globale Closed-Loop-Intelligenz und die Möglichkeit, ein neues, attraktiveres und effektiveres Tool für Ihr Unternehmen zu schaffen.
    • Geeignet für F&E-Automatisierung, Büro, Spieleentwicklung und Unterrichtsszenarien.

    Adresse des Projekts

    https://github.com/baai-agents/cradle

  • Es riecht so gut, mit intelligenten Körpern auf Knopfdruck fesselnde historische Geschichten zu erzeugen!

    Hallo zusammen, ich bin Li Hua, ein KI-Blogger mit über 100.000 Followern im Internet, der sich auf KI-Wissenschaft und intelligentes Body-Sharing konzentriert.

    In letzter Zeit habe ich an einem intelligenten Arbeitsablauf für die Erstellung einer Reihe von kurzen Videos zur Selbstveröffentlichung mit Coze gearbeitet, mit dem Ziel, eine Vielzahl von explosiven Kurzvideos mit einem einzigen Klick zu erstellen.

    Heute werden wir den Arbeitsablauf des Immersive Historical Storytelling Video Intelligence Body vorstellen und mit einer Fallstudie beginnen.

    Dieses Jitterbug-Konto @seltsame Geschichte Nur 56 Einträge, die überraschenderweise 480.000 Fans anziehen, die allesamt brisant sind.

    Nach einigen Tagen der Recherche habe ich schließlich die Logik und den Ablauf geklärt und den Workflow entwickelt.

    Alles, was ich tun musste, war, ein geschichtsbezogenes Thema in das Feld für den Workflow-Lauf einzugeben, auf den Probelauf zu klicken, und schon wurde mit einem Klick ein kurzes Pop-up-Geschichtsvideo für mich erstellt.

    Ich habe z. B. "Dunkelheit" eingegeben, auf "Ausführen" geklickt, einen kurzen Videoentwurf erstellt und dann den Entwurf in den Bildschirmausschnitt exportiert, und schon haben Sie das folgende Video.

    Wie wurde dieser Arbeitsablauf erstellt, wenn man sieht, wie die Demo funktioniert?

    I. Entwicklung von Ideen:

    1. Generierung von Textthemen, Kontexten und Bildhinweisen auf der Grundlage von Themen durch große Modelle
    2. Spiegelbilder auf der Grundlage von Wortableitungen
    3. Festlegung der Bildschirmdarstellung durch Bilderzeugungs- und Zeichenbrettmodule
    4. Erzeugen einer Zeitleiste aus dem Ton und Erstellen eines Entwurfs für eine Cutscene

    III. detaillierte Analyse des Arbeitsablaufs

    1. starten Sie den Knoten

    2、Erstellen eines kurzen Videotextes entsprechend dem Thema

    3、Mit Hilfe eines großen Modells rufen die Schüler in den Spiegel Worte auf

    4, Stapelverarbeitung zur Erzeugung von Bildern, Audio

    5 Erstellen Sie einen Entwurf für einen Ausschnitt und generieren Sie eine entsprechende Zeitleiste auf der Grundlage des Audios.

    An diesem Punkt wird der Workflow für immersives historisches Storytelling entwickelt.

    Vielen Dank für die Lektüre dieses Artikels, wenn dieser Artikel ist hilfreich für Sie, bitte wie die Aufmerksamkeit auf oh zu zahlen, werde ich weiterhin gute Workflow-Tutorials zu teilen.

    Dieses Tool wurde in unseren gemeinsamen Raum gestellt, und es gibt Dutzende von intelligenten Arbeitsabläufen, die darauf warten, von Ihnen erlebt zu werden~!


    Willkommen in meinem AI Intelligentsia-Arbeitsbereich!

    Sie erwerben die Rechte und Vorteile:

    Dutzende von intelligenten Arbeitsabläufen stehen Ihnen zur Verfügung, wenn Sie den Co-Creation-Bereich betreten, und es werden ständig weitere hinzugefügt!

    〇 Exklusive Mitgliedergruppe Q&A-Service, alle Fragen in der Verwendung von intelligenten Körper-Workflow kann sein

      €ã€€Mitglieder und Freunde können die Bedürfnisse des Körpers zu erwähnen, wird die Nachfrage nach mehr entwickelt werden, um Platz für alle zu nutzen!