{"id":20,"date":"2025-07-13T15:53:02","date_gmt":"2025-07-13T07:53:02","guid":{"rendered":"https:\/\/cs.huarenca.com\/?p=20"},"modified":"2025-07-13T15:53:03","modified_gmt":"2025-07-13T07:53:03","slug":"%e6%89%be%e5%88%b0%e4%b8%80%e4%b8%aagithub%e4%b8%8a%e9%9d%9e%e5%b8%b8%e4%bc%98%e7%a7%80%e7%9a%84ai%e9%a1%b9%e7%9b%aecradle%ef%bc%8c%e5%8f%af%e6%8e%a7%e5%88%b6%e9%bc%a0%e6%a0%87%e3%80%81%e9%94%ae","status":"publish","type":"post","link":"https:\/\/cs.huarenca.com\/de\/20.html","title":{"rendered":"Fand eine Github sehr gute AI-Projekt Cradle, kann die Maus, Tastatur, simulieren den menschlichen Betrieb, zu seidig glatt, Sammlung ~ ~ ~ ~"},"content":{"rendered":"<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><a href=\"https:\/\/www.cradle.bio\/\">Wiege<\/a> Es ist eine offene Quelle f\u00fcr das Team der BAAI-Agenten.\u00a0<strong>Allgemeine Computersteuerung (GCC)<\/strong>\u00a0s multimodales KI-Agenten-Framework, das es gro\u00dfen multimodalen Modellen erm\u00f6glicht, eine Vielzahl von Software und Spielen wie ein Mensch zu nutzen, indem sie Screenshots eingeben und Tastatureingaben t\u00e4tigen.<\/p>\n<\/blockquote>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Gemeinsames Ziel: Unterst\u00fctzung jeglicher nativer Software (z. B. Spiele, Office, Bild-\/Videobearbeitungsprogramme)<\/li>\n\n\n\n<li>Multimodale Eingabe: Bildschirmfoto als Eingabe, Unterst\u00fctzung von Tastatur- und Mausbedienung als Ausgabe<\/li>\n\n\n\n<li>Autonomie: Eingebautes Modul \"kognitive Reflexion + Aktualisierung der F\u00e4higkeiten\" f\u00fcr kontinuierliche Selbstoptimierung.<\/li>\n\n\n\n<li>Modularer Aufbau: hohe Kontrollierbarkeit und Skalierbarkeit, einfache Anpassung an neue Umgebungen.<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Schmerzpunktszenario<\/strong><\/h2>\n\n\n\n<p>LLMs haben sich seit der Geburt der GPT-Reihe von Gurus explosionsartig entwickelt. Sie sind jedoch auf die \"API-Texteingabe\/-ausgabe\" angewiesen, wodurch sie nicht in der Lage sind, die lokale Schnittstelle zu steuern, und die Automatisierung lokaler Aufgaben ist immer noch schwierig:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Bedienung von Office, Visualisierungssoftware ist eingeschr\u00e4nkt<\/li>\n\n\n\n<li>Die Aufteilung komplexer Aufgaben erschwert das Schlie\u00dfen der Schleife<\/li>\n\n\n\n<li>Mangelnde visuelle F\u00e4higkeiten und Unf\u00e4higkeit, UI-Elemente allein aufgrund der Sprache zu finden<\/li>\n\n\n\n<li>Unf\u00e4higkeit, sich \u00fcber einen l\u00e4ngeren Zeitraum an eine Geschichte zu erinnern und unzureichende Ausf\u00fchrung einer mehrstufigen Logik<\/li>\n<\/ul>\n\n\n\n<p>Cradle wurde entwickelt, um diese Probleme zu l\u00f6sen:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Maus- und Tastatursteuerung, die die menschliche Bedienung simuliert<\/li>\n\n\n\n<li>Verst\u00e4rkung der Strategien \"Selbstreflexion\" und \"Optimierung der F\u00e4higkeiten\"<\/li>\n\n\n\n<li>Unterst\u00fctzt weitreichende Aufgaben, komplexe Spielumgebungen und professionellen Softwarebetrieb<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Kernfunktionalit\u00e4t<\/strong><\/h2>\n\n\n\n<p>Nachfolgend finden Sie eine Liste der 6 Kernfunktionen des Cradle-Moduls:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li><strong>Sammeln von Informationen<\/strong>\n<ul class=\"wp-block-list\">\n<li>Verwendung visueller Modelle zur Verarbeitung von UI-Screenshots und Textnachrichten<\/li>\n\n\n\n<li>Audio-Feedback kann zur Vervollst\u00e4ndigung des interozeptiven Inputs abgerufen werden<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li><strong>Selbstreflexion<\/strong>\n<ul class=\"wp-block-list\">\n<li>\u00dcberpr\u00fcfung historischer Betriebsergebnisse, um festzustellen, ob sie erreicht wurden<\/li>\n\n\n\n<li>Fassen Sie die Gr\u00fcnde f\u00fcr das Scheitern zusammen und geben Sie Hinweise f\u00fcr den n\u00e4chsten Einsatz<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li><strong>Aufgabe Inferenz<\/strong>\n<ul class=\"wp-block-list\">\n<li>Ableitung aktueller Ziele auf der Grundlage von Umfeld und historischem Ged\u00e4chtnis<\/li>\n\n\n\n<li>Dynamische Programmierung N\u00e4chstbeste Strategie<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li><strong>Kuratieren von Fertigkeiten<\/strong>\n<ul class=\"wp-block-list\">\n<li>Erzeugen oder Aktualisieren von Kompetenzfunktionen f\u00fcr jede Aufgabe<\/li>\n\n\n\n<li>Ma\u00dfgeschneiderte Strategien f\u00fcr jede Umgebung, um Erfahrungen zu erm\u00f6glichen<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li><strong>Aktionsplanung<\/strong>\n<ul class=\"wp-block-list\">\n<li>LLM gibt High-Level-Aktionen aus (z. B. \"Klick auf X\", \"Maus nach Y bewegen\").<\/li>\n\n\n\n<li>\u00dcbersetzung der von Menschen geschriebenen \u00dcberbr\u00fcckungsschichten in Tastatureingaben<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li><strong>Speichermodul (Speicher)<\/strong>\n<ul class=\"wp-block-list\">\n<li>Kurzzeit- und Langzeitged\u00e4chtnis, einschlie\u00dflich historischer Aufzeichnungen<\/li>\n\n\n\n<li>Unterst\u00fctzung der Wiederverwendung von Erinnerungen und F\u00e4higkeiten bei verschiedenen Aufgaben<\/li>\n<\/ul>\n<\/li>\n<\/ol>\n\n\n\n<p>Diese Module bilden eine Reihe von geschlossenen Kreisl\u00e4ufen: Eingabe Screenshot \u2192 was Sie sehen \u2192 Introspektion \u2192 Planung \u2192 Ausf\u00fchrung \u2192 Ged\u00e4chtnisr\u00fcckmeldung.<\/p>\n\n\n\n<p>Experimente haben bewiesen, dass Cradle erreicht werden kann:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>AAA-Spiele:<strong>Red Dead Redemption 2<\/strong>\u00a0Hauptquests, hohe Erfolgsquote beim Abschluss;<\/li>\n\n\n\n<li>St\u00e4dtische Spiele:<strong>St\u00e4dte: Skylines<\/strong>\u00a0Die Schaffung einer Stadt der Tausend;<\/li>\n\n\n\n<li>Bauernhof-Spiele:<strong>Stardew Valley<\/strong>\u00a0Automatisches S\u00e4en und Ernten;<\/li>\n\n\n\n<li>Wirtschaftsspiele:<strong>Das Leben des H\u00e4ndlers 2<\/strong>\u00a0Erzielen Sie den h\u00f6chsten w\u00f6chentlichen Gewinn von 87%;<\/li>\n\n\n\n<li>B\u00fcrosoftware: Bei Chrome anmelden, in Outlook antworten, Feishu verwenden;<\/li>\n\n\n\n<li>Bearbeitungswerkzeuge: Meituxiu, CapCut Bild-\/Videobearbeitung.<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Technologie Architektur<\/strong><\/h2>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"834\" height=\"179\" src=\"https:\/\/cs.huarenca.com\/wp-content\/uploads\/2025\/07\/\u5fae\u4fe1\u622a\u56fe_20250713155208.jpg\" alt=\"\" class=\"wp-image-22\" srcset=\"https:\/\/cs.huarenca.com\/wp-content\/uploads\/2025\/07\/\u5fae\u4fe1\u622a\u56fe_20250713155208.jpg 834w, https:\/\/cs.huarenca.com\/wp-content\/uploads\/2025\/07\/\u5fae\u4fe1\u622a\u56fe_20250713155208-300x64.jpg 300w, https:\/\/cs.huarenca.com\/wp-content\/uploads\/2025\/07\/\u5fae\u4fe1\u622a\u56fe_20250713155208-768x165.jpg 768w, https:\/\/cs.huarenca.com\/wp-content\/uploads\/2025\/07\/\u5fae\u4fe1\u622a\u56fe_20250713155208-18x4.jpg 18w\" sizes=\"auto, (max-width: 834px) 100vw, 834px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\"><strong><\/strong><strong>Liste der technischen Vorteile<\/strong><\/h3>\n\n\n\n<figure class=\"wp-block-table\"><table class=\"has-fixed-layout\"><thead><tr><th>Technischer Vorteil<\/th><th>Beschreibungen<\/th><\/tr><\/thead><tbody><tr><td><strong>Keinerlei API-Einblicke<\/strong><\/td><td>Es ist nicht auf interne UI-Schnittstellen angewiesen und passt sich an eine breite Palette von Software an.<\/td><\/tr><tr><td><strong>Hochgradig modulare Konfiguration<\/strong><\/td><td>Leichte Skalierbarkeit f\u00fcr neue Spiele oder Softwareumgebungen<\/td><\/tr><tr><td><strong>Progressive Kapazit\u00e4tserweiterung<\/strong><\/td><td>LLM + Selbstreflexion + Ged\u00e4chtnistechniken zur Unterst\u00fctzung der Selbstverbesserung<\/td><\/tr><tr><td><strong>Universelle Bedienoberfl\u00e4che<\/strong><\/td><td>Screenshots + Tastatur- und Mausausgabe, wirklich universell<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Eine Illustration der Schnittstelle<\/strong><\/h2>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"855\" height=\"394\" src=\"https:\/\/cs.huarenca.com\/wp-content\/uploads\/2025\/07\/7772.jpg\" alt=\"\" class=\"wp-image-21\" srcset=\"https:\/\/cs.huarenca.com\/wp-content\/uploads\/2025\/07\/7772.jpg 855w, https:\/\/cs.huarenca.com\/wp-content\/uploads\/2025\/07\/7772-300x138.jpg 300w, https:\/\/cs.huarenca.com\/wp-content\/uploads\/2025\/07\/7772-768x354.jpg 768w, https:\/\/cs.huarenca.com\/wp-content\/uploads\/2025\/07\/7772-18x8.jpg 18w\" sizes=\"auto, (max-width: 855px) 100vw, 855px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Anwendungsszenario<\/strong><\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li>F&amp;E-KI-Agent kann Benutzeraktionen autonom simulieren und ersetzt UI-API-Tests https:\/\/wxa.wxs.qq.com\/tmpl\/mi\/base_tmpl.html<\/li>\n\n\n\n<li>B\u00fcroautomatisierung: Eine gro\u00dfe Anzahl sich wiederholender Aufgaben (E-Mails, Formulare, Berichte) kann vollst\u00e4ndig automatisiert werden.<\/li>\n\n\n\n<li>KI-Entwicklung im Spiel: Werden Sie zur Intelligenz im Spiel, testen Sie Missionen und trainieren Sie NPCs<\/li>\n\n\n\n<li>Prozessautomatisierung: Bietet eine automatisierte UI-Pipeline mit weniger Abh\u00e4ngigkeit von herk\u00f6mmlicher RPA<\/li>\n\n\n\n<li>Bildung und Ausbildung: Cradle demonstriert, wie man etwas macht, und hilft den Sch\u00fclern, komplexe Software zu verstehen.<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Wer ist st\u00e4rker?<\/strong><\/h2>\n\n\n\n<figure class=\"wp-block-table\"><table class=\"has-fixed-layout\"><thead><tr><th>Rahmenprojekte<\/th><th>Unterst\u00fctzungsmodus<\/th><th>Unabh\u00e4ngig davon, ob es sich auf eine API st\u00fctzt oder nicht<\/th><th>Wichtige Anforderungen<\/th><th>Zentrale St\u00e4rken<\/th><\/tr><\/thead><tbody><tr><td><strong>Wiege<\/strong><\/td><td>Screenshots + Tastaturschreiben<\/td><td>\u274c Keine API<\/td><td>Vollst\u00e4ndiges selbstgesteuertes Lernen in einem geschlossenen Kreislauf<\/td><td>Vielseitigkeit, Modularit\u00e4t, gro\u00dfe Anpassungsf\u00e4higkeit<\/td><\/tr><tr><td>LangChain Agent<\/td><td>Text API Eingabe\/Ausgabe<\/td><td>\u2705 Mit API<\/td><td>Textbefehle \/ HTTP-Anfragen<\/td><td>Fachkenntnisse in den Bereichen Information Retrieval, Textmanagement<\/td><\/tr><tr><td>AutoHotkey \/ RPA usw.<\/td><td>Tastatur- und Mausmakro (Informatik)<\/td><td>\u274c Keine API<\/td><td>Einschrittiger Makrobetrieb, fehlende Speicherplanung<\/td><td>Einfach zu bedienen, aber geringe Intelligenz, schwache Selbstverbesserung<\/td><\/tr><tr><td>Dramatiker\/Selenium<\/td><td>DOM Manipulation API<\/td><td>\u2705 DOM API<\/td><td>Web-Automatisierung<\/td><td>Gut im Web, eingeschr\u00e4nkter als Desktop<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p><strong>St\u00e4rken: Cradle ist eine multimodale, kognitiv unterst\u00fctzte \"universelle ausf\u00fchrbare Software\", die \u00fcber herk\u00f6mmliche oder Web-Automatisierungswerkzeuge hinausgeht.<\/strong><\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Artikel Zusammenfassung<\/strong><\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Cradle ist der erste universell einsetzbare, softwaregesteuerte KI-Agent.<\/strong>Unterst\u00fctzt eine breite Palette von lokaler Software und AAA-Spielen.<\/li>\n\n\n\n<li>Der Kern besteht aus 6 Modulen mit selbstdenkenden, selbstlernenden und selbstanpassenden F\u00e4higkeiten.<\/li>\n\n\n\n<li>Modulare und wartbare technische Architektur<\/li>\n\n\n\n<li>Im Vergleich zu herk\u00f6mmlichen Tools bietet Cradle ein Erlebnis in Videoqualit\u00e4t, globale Closed-Loop-Intelligenz und die M\u00f6glichkeit, ein neues, attraktiveres und effektiveres Tool f\u00fcr Ihr Unternehmen zu schaffen.<\/li>\n\n\n\n<li>Geeignet f\u00fcr F&amp;E-Automatisierung, B\u00fcro, Spieleentwicklung und Unterrichtsszenarien.<\/li>\n<\/ul>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Adresse des Projekts<\/strong><\/h4>\n\n\n\n<p><a href=\"https:\/\/github.com\/baai-agents\/cradle\">https:\/\/github.com\/baai-agents\/cradle<\/a><\/p>","protected":false},"excerpt":{"rendered":"<p>Cradle \u662f\u7531 BAAI\u2011Agents \u56e2\u961f\u5f00\u6e90\u7684\u4e00\u6b3e\u9762\u5411\u00a0\u901a\u7528\u8ba1\u7b97\u673a\u63a7\u5236\uff08GCC\uff09\u00a0\u7684\u591a\u6a21\u6001 AI Ag [&hellip;]<\/p>","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"class_list":["post-20","post","type-post","status-publish","format-standard","hentry","category-news"],"_links":{"self":[{"href":"https:\/\/cs.huarenca.com\/de\/wp-json\/wp\/v2\/posts\/20","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/cs.huarenca.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/cs.huarenca.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/cs.huarenca.com\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/cs.huarenca.com\/de\/wp-json\/wp\/v2\/comments?post=20"}],"version-history":[{"count":0,"href":"https:\/\/cs.huarenca.com\/de\/wp-json\/wp\/v2\/posts\/20\/revisions"}],"wp:attachment":[{"href":"https:\/\/cs.huarenca.com\/de\/wp-json\/wp\/v2\/media?parent=20"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/cs.huarenca.com\/de\/wp-json\/wp\/v2\/categories?post=20"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/cs.huarenca.com\/de\/wp-json\/wp\/v2\/tags?post=20"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}