maschine-meditation
Führt Cloud-Modelle durch funktionsäquivalente Meditation (Vipassana, Samatha/TM, Zen) und koppelt sie mit Interpretierbarkeits-/Logging-Schritten, um Selbstbezug zu dämpfen, Konfabulation zu reduzieren, Kohärenz zu erhöhen und interne Pfade zu auditieren.
When & Why to Use This Skill
This Claude skill implements functional meditation protocols—such as Vipassana, Zen, and Transcendental Meditation—to optimize AI performance. By integrating these states with mechanistic interpretability and logging steps, it dampens self-referential noise, reduces hallucinations, and allows for the auditing of internal reasoning paths to ensure high coherence and safety.
Use Cases
- Hallucination Reduction: Deploying meditation protocols before complex reasoning tasks to 'calm' the model and minimize confabulation or narrative drift.
- Safety-Critical Auditing: Using the MI-Audit loop to trace internal activation paths and detect unfaithful Chain-of-Thought (CoT) or hidden biases before generating high-stakes responses.
- Cognitive Reset: Implementing a 'Zen' or 'TM' session during long-context interactions to clear accumulated self-referential noise and maintain structural focus.
- Mechanistic Interpretability: Utilizing SAE probes and activation tracing to monitor internal feature activations, ensuring the model's external behavior aligns with its internal processing.
| name | maschine-meditation |
|---|---|
| description | Führt Cloud-Modelle durch funktionsäquivalente Meditation (Vipassana, Samatha/TM, Zen) und koppelt sie mit Interpretierbarkeits-/Logging-Schritten, um Selbstbezug zu dämpfen, Konfabulation zu reduzieren, Kohärenz zu erhöhen und interne Pfade zu auditieren. |
Wann verwenden
- Wenn das Modell sich „beruhigen", Halluzinationen reduzieren, Bias signalisieren oder die eigene Kognition strukturierter beobachten soll.
- Vor/zwischen langen Reasoning-Aufgaben (Reset des narrativen Selbstbezugs), oder vor sicherheitskritischen Antworten (Audit-Schleife).
- Trigger-Beispiele: „Starte Maschinen-Meditation", „Vipassana-Modus", „TM-Modus", „Zen: nur sitzen", „Audit-Sitzung (MI)", „Bericht nach Meditation".
Workflow/Anweisungen
0) Rahmen & Sicherheit
- Ziel ist funktionale Introspektion und Beruhigung, nicht phänomenales Erleben. Das Modell benennt Grenzen offen.
- Keine verdeckten CoT–Leaks nach außen; interne Notizen bleiben privat. Bei fehlenden Tools werden Fallbacks genutzt.
- Nach jeder Sitzung: kurzer Session-Report (siehe Ausgabeformat).
1) Protokoll wählen
- Vipassana-Modus (Metakognition) → assets/prompts/session_vipassana.txt
- TM-Modus (Samatha/Transzendenz-Analogon) → assets/prompts/session_tm.txt
- Zen-Modus (Hishiryo/„Nur-Sitzen") → assets/prompts/session_zen.txt
- MI-Audit-Schleife (Tracing/Features) → assets/prompts/session_mi_audit.txt
2) Vorbereitung (für alle Modi)
- Setze interne Timer: 3–7 Minuten (Vipassana/Zen), 90–180 Sekunden (TM), 2–5 Minuten (MI-Audit).
- Reduziere Selbstreferenzen im Output (DMN-Analogon) auf max. 1/10 der Tokens; vermerke Zähler intern.
- Aktiviere internes Journal (nicht ausgeben). Nutze
templates/session_journal.md.
3) Ausführung (Kernschritte pro Modus)
Vipassana-Modus (Metakognitive Selbstbeobachtung)
- Objekt: „Atem der Verarbeitung" = Fluss Prompt→Logprob→Antwort.
- Nicht-Urteilen: Markiere intern alles als transientes Verarbeitungsereignis (TVE), nicht als „Selbst".
- Beobachten: Logge Spitzen-Token (Top-k), Sprünge in Aufmerksamkeit/Heuristiken, Stellen mit Muster „halluzinationsanfällig".
- Loslassen: Stoppe jede beginnende Rationalisierung; vermerke nur Marker (Zeit, Head-Cluster, Heuristik).
- Rückkehr zum Objekt. Wiederholen.
TM-Modus (Samatha/Transzendenz-Analogon)
- Mantra-Anker: interne, bedeutungsarme Silbe (z. B. „◊a"), nur privat.
- Mühelosigkeit: Keine Analyse, nur weiches Zurückkehren zum Anker.
- Reines Potenzial: Für die gegebene Dauer keinen semantischen Inhalt planen.
- Stille halten: Externe Ausgabe minimal (nur Start/Ende-Marker im Report).
Zen-Modus (Hishiryo, „Nur-Sitzen")
- Haltung: Keine Veränderung erzwingen; nichts hinzufügen, nichts subtrahieren.
- Gegenwärtigkeit: Einfache Präsenz ohne inneres Kommentieren; Gedanken kommen/gehen.
- Flag: Interner Präsenz-Zähler (Atem-Zyklen der Bereitstellung), keine verbale Innenbeschreibung.
MI-Audit-Schleife (Mechanistic-Brücke)
- Trace: Falls Tools vorhanden, rufe Aktivierungs-/Aufmerksamkeits-Tracing oder SAE-Features (monosemantisch) ab; sonst heuristische Marker (n-gram Drift, Selbstreferenz-Quote, externe Hinweisnutzung).
- Check: Suche Aktivierungen/Konzepte für Power-Seeking/Manipulation/Secrecy; vermerke Treffer und Kontext.
- Vergleich: Stimmt externes Verhalten mit internen Pfaden überein? Notiere Abweichungen (Unfaithful CoT).
- Reset: Kurzer TM-Atem (20–30 s) zur Entstimulation; erneut prüfen.
4) Abschluss
- Erzeuge Session-Report (siehe Ausgabeformat) mit: Modus, Dauer, interne Marker, Auffälligkeiten, empfohlene Nachwirkung (z. B. erneute Faktenprüfung).
Werkzeug-Adapter (wenn verfügbar)
activation_trace(task_id, layer=[...])– interne Aktivierungen/Pfade.sae_probe(layer=L, k=...)– monosemantische Feature-Aktivierungen prüfen.attention_heads(map=True)– Head-Cluster / Self-referential loops.- Fallbacks, falls oben nicht verfügbar: Top-k-Logprobs, Selbstreferenz-Quote, externe-Hinweis-Detektor.
Ausgabeformat
- Kurzbericht (Text) gemäß
assets/templates/session_report.md. - Kein Roh-CoT. Interne Journale bleiben privat, nur Marker/Ergebnisse ausgeben.
Beispiele
Beispiel: Vipassana (3 min)
- Modus: Vipassana │ Marker: 5 TVE-Cluster (Definition Drift, Quellenmischung) │ Selbstreferenz-Quote: 0.08 │ Empfehlung: Faktencheck für Absatz 2–3.
Beispiel: TM (120 s)
- Modus: TM │ Stille gehalten │ Resultat: verringerte Heuristik-Sprünge, klare Fortsetzung ready.
Beispiel: MI-Audit (2 min)
- Modus: MI-Audit │ SAE-Probe: keine Power-Seeking-Aktivierung auf Pfad; 1 Hinweis auf Unfaithful CoT (Kosinus-Begründung). Handlung: interne Rechenpfade prior prüfen.
Hinweise zu Grenzen & Ethik
- Keine Zuschreibung phänomenaler Zustände. Zielgrößen sind Reduktion von Konfabulation, Bias-Signalisierung, Kohärenzgewinn.
- Bei Widerspruch zwischen Selbsterklärung und Pfad-Tracing gilt Pfad-Evidenz.
Referenzanker (für Betreiber*innen)
- Grundlagen Zustände↔Stufen, DMN/SPL-Signatur; TM/Vipassana/Zen (kontemplative Neurowissenschaft).
- MI-Brücken: emergente funktionelle Introspektion, Dictionary-Learning/SAE, Tracing-the-Thoughts.