Infrastruktur-Dokumentation · Stand: Juni 2026

Lokales KI-ÖkosystemMac Studio M3 Ultra · 256 GB · Vollständig lokal

Vollständig lokale, cloud-unabhängige KI-Infrastruktur für strikt lokale, private, experimentelle KI-Experimente. Alle Berechnungen auf Mac Studio M3 Ultra (256 GB unified memory) — kein Cloud-Zugang, keine Daten verlassen den Rechner.

Stand: Juni 2026 · v3.8

00 Hardware-Infrastruktur Hardware Infrastructure

256 GBUnified Memory

80-coreApple GPU (M3 Ultra)

24-coreCPU (16P + 8E)

2 TBInterner SSD

4 TBTB5-WORK (extern)

Komponente	Spezifikation
Modell	Apple Mac Studio M3 Ultra
Unified Memory	256 GB (LLM + System + Chemie ohne Konflikt)
GPU	80-core (MPS-Beschleunigung für ML-Tools)
CPU	24-core (16 Performance + 8 Efficiency)
Betriebssystem	macOS Sequoia
Externer SSD	4 TB OWC Aura Pro IV NVMe via Thunderbolt 5 (TB5-WORK) — hält DeepSeek V4 Flash GGUF (164 GB) und R1-671B (202 GB)
Memory Stick	/Volumes/CLAUDE-DATA — Backup, Bridge-Dateien, Session-Logs, Projekt-Persistenz

RAM-Beschränkung: MAX_LOADED_MODELS=1, NUM_PARALLEL=1 — DSV4 (~164 GB) + qwen3:235b (~142 GB) = 306 GB > 256 GB. Deshalb strikt sequenzieller Betrieb.

Component	Specification
Model	Apple Mac Studio M3 Ultra
Unified Memory	256 GB (LLM + system + chemistry without conflict)
GPU	80-core (MPS acceleration for ML tools)
CPU	24-core (16 Performance + 8 Efficiency)
Operating System	macOS Sequoia
External SSD	4 TB OWC Aura Pro IV NVMe via Thunderbolt 5 (TB5-WORK) — holds DeepSeek V4 Flash GGUF (164 GB) and R1-671B (202 GB)
Memory stick	/Volumes/CLAUDE-DATA — backup, bridge files, session logs, project persistence

01 Lokale Sprachmodelle (Ollama 0.30.8 + DSV4 + R1-671B)

Modell	Größe	Rolle / Routing
qwen3:235b-a22b	142 GB MoE	Flagship — komplexe Analyse, Philosophie, Mathematik-Synthese
DeepSeek-V4-Flash (DSV4)	~164 GB MoE	256K Kontext-Fenster — lange Dokumente, Corpus-Ingestion (Port 8888)
deepseek-r1:70b	~45 GB	Adversarielle Prüfung, Chain-of-Thought, formale Verifikation
DeepSeek-R1-0528-671B	202 GB (UD-IQ2_XXS, 5 Shards)	Hochqualitäts-Reasoning, llama-server 9650 Port 8889 (~23 tok/s) — Flagship für Critic/Comparator in komitee_bewertung; auf TB5-WORK
qwen3.6:35b-a3b	~23 GB MoE	Schnelle All-Purpose, Routing-Interpreter (~47 tok/s)
gemma4:26b	~17 GB	Multimodal, 256K Kontext, MTP-Spekulation (~80 tok/s)
mistral-small3.1:24b	~15 GB	Leichtgewicht, Commit-Messages (Aider weak model)
bge-m3:latest	1,2 GB	Multilinguales Embedding-Modell — primär für RAG, LanceDB-Indexe und Primärtext-Retrieval
mxbai-embed-large	669 MB	Embedding-Modell (Vektordatenbanken)
llama-guard3:8b	4.9 GB	Safety-Klassifikator

DeepSeek V4 Flash (DSV4) — separater llama-server

284B MoE, 153 GB GGUF, gemischte Quantisierung (Q4KExperts/F16HC), auf TB5-WORK. Eigener llama-server 9650 auf Port 8888 — 256K Kontext, 99 GPU-Lagen. Automatisch via Router für sehr lange Eingaben (>400-Token-Komplexitätsschwelle) gestartet.

MLX-LM 0.31.3 — Apple-Silicon-nativer Inferenz-Layer

Zusätzlich zu Ollama ist MLX-LM 0.31.3 (Apple MLX-Bibliothek) installiert. OLLAMA_BACKEND=mlx ist dauerhaft in ~/.zshrc gesetzt — ca. 26–30 % Geschwindigkeitsgewinn bei langen Prompts durch Apple-Silicon-optimierte Kernel. Verwendbar auch direkt via mlx_lm.generate oder mlx_lm.server.

Model	Size	Role / Routing
qwen3:235b-a22b	142 GB MoE	Flagship — complex analysis, philosophy, mathematics synthesis
DeepSeek-V4-Flash (DSV4)	~164 GB MoE	256K context window — long documents, corpus ingestion (port 8888)
deepseek-r1:70b	~45 GB	Adversarial checking, chain-of-thought, formal verification
DeepSeek-R1-0528-671B	202 GB (UD-IQ2_XXS, 5 shards)	High-quality reasoning, llama-server 9650 port 8889 (~23 tok/s) — flagship for Critic/Comparator in komitee_bewertung; on TB5-WORK
qwen3.6:35b-a3b	~23 GB MoE	Fast all-purpose, routing interpreter (~47 tok/s)
gemma4:26b	~17 GB	Multimodal, 256K context, MTP speculation (~80 tok/s)
mistral-small3.1:24b	~15 GB	Lightweight, commit messages (Aider weak model)
bge-m3:latest	1.2 GB	Multilingual embedding model — primary for RAG, LanceDB indexes and primary-text retrieval
mxbai-embed-large	669 MB	Embedding model (vector databases)
llama-guard3:8b	4.9 GB	Safety classifier

02 LLM-Router-Proxy v3.3 LLM Router Proxy v3.3

FastAPI-Middleware auf Port 11435 (~/llm_router/llm_proxy.py). Jede Anfrage von Open WebUI und allen anderen Clients läuft ausschließlich über diesen Proxy.

Zweistufiges Routing: Stufe 1 — regelbasierter Dispatcher (Domain-Keywords, Token-Länge, <1 ms). Stufe 2 (ambig) — L1-Reformulator (kleineres LLM klassifiziert Absicht).

Anti-Halluzinations-Protokoll: P4-Struktur in allen epistemischen Prompts. Synthegy-Evaluator: Jede Antwort durch separates Evaluator-LLM (Genauigkeit 1–5, Fundierung 1–5).

Quelle	Zweck	Timeout
SearXNG (Port 8080)	Web-Suche, multilingual	18s
Wikipedia	DE + EN + FR + RU	20s
CORE (Open Access)	Wissenschaftliche Paper	18s
OpenAlex	Akademische Literatur	18s
Open Library	Bücher	12s
arXiv	Mathematik/Physik-Preprints	25s

Spezialbefehle: /ensemble, /kreativ, /navigator, /destilliere, /speichere, /journal.

Source	Purpose	Timeout
SearXNG (port 8080)	Web search, multilingual	18s
Wikipedia	DE + EN + FR + RU	20s
CORE	Academic papers	18s
OpenAlex	Academic literature	18s
Open Library	Books	12s
arXiv	Math/physics preprints	25s

04 Mathematik-Stack Mathematics Stack

Tool	Version	Verwendung
Lean 4 + Mathlib	4.31.0-rc2	Formale Verifikation; PR #39701 (kondensierte Moduln) · CI Build ✅ Lint ✅
SageMath	10.9 (ARM64)	Algebraische Geometrie, Berechnungen
PARI/GP	2.17.3	Zahlentheorie, Fundamentaleinheiten, Iwasawa
Julia 1.12.6 + Hecke.jl	0.39.15	Algebraische Zahlentheorie (ITensorNetworks 0.21.2, Nemo 0.54.2)
Macaulay2	1.26.05	Kommutative Algebra, Gröbner-Basen
Kenzo (SBCL)	7.0 (Common Lisp)	Effektive Homotopieberechnungen (K(Z/2,n))
Lean 4 lean-liquid	aktuell	Formalisiertes LTE-Fundament (liquid Tensor)
Z3 Prover	4.16.0	SMT-Solving, formale Verifikation
Singular	4.4.1	Algebraische Geometrie, Normalen
Agda 2.8.0 / Rocq	aktuell	Typentheoretische Formalisierung
SpheriCo.jl	0.1.0 (Julia)	Numerische Relativität: sphär. symmetrischer Skalarfeld-Kollaps (Choptuik-Projekt)
NRPy+	2.1.1 (conda nr_env)	Symbolische GR-Codegenerierung; Jupyter-Kernel registriert
SFcollapse1D	arm64-Binary	Skalarfeld-Kollaps in C++ (GCC 15.2.0, -O2 -fopenmp)
msolve	0.10.0	Polynomiales Gleichungssystem-Löser — Gröbner-Basen über ℤ/pℤ (LIP6, algebraische Geometrie)

lean_iterativ v4 — Iterativer Proof-Refinement-Loop

Open-WebUI-Tool für iterative Lean 4-Beweisverifikation (Ralph Loop, arXiv:2605.22763). Implementierungsgrundlage: Li et al. "Compile to Compress" (ICML 2026).

A — Inline-Fehlerinjektion: Compiler-Fehler direkt als -- ERROR:-Kommentar. Li et al. Table 10: +3 % auf MiniF2F.
B — Markovianische Disziplin: Nur aktueller Code + Compiler-Fehler, keine Geschichte.
C — Fehlertyp-Routing: unfixierbar (linarith, omega, nested error — Frühabbruch ab Runde 2), schwer (unsolved goals, type mismatch), reparierbar.
D — BFS/DFS + EVOLVE-BLOCK: frische_versuche=N streut alle N Runden unabhängigen Versuch. locked_regions=True schützt Theorem-Signatur.
v4 — Bugfix: _lean_kompiliere() überschreibt Test.lean temporär, JSON-Fehlerformat korrekt geparst.
E — Prä-Validierung (lake env lean): Neuer Schritt VOR dem Ralph Loop: _praeval_lean_env() führt lake env lean MathProject/Test.lean aus. Strukturell unfixierbare Fehler (unknown package, file not found, parse error) → sofortiger Abbruch, spart max_runden × lake-build-Iterationen. Runde-1-Ergebnis wiederverwendet (kein Doppel-Build). Neue _FEHLER_UNFIXIERBAR-Muster: unknown package, file not found, unknown import.

Signatur

lean_iterativ(aufgabe_oder_sketch, modell='deepseek-r1:70b', max_runden=8, frische_versuche=0, locked_regions=True)

Open-WebUI-Tools — KI-Okosystem-Erweiterungen (Juni 2026)

Basierend auf Sakka, Mizukami & Mitarai, "An LLM System for Autonomous Variational Quantum Circuit Design" (arXiv, Osaka, Juni 2026): Drei neue bzw. substantiell erweiterte Tools implementieren die Kernarchitektur des Papers (Exploration → Discussion → Review-Memory).

komitee_bewertung v2.0 — Discussion-Phase (Sakka et al. 2026)

Drei-Rollen-Kritikzyklus statt generischem SCORE: X/10:

Expert 1 + 2 (domänenspezifisch): Valve expertenrollen_domaene: mathematik (Arithmetischer Geometer · Homotopie-Theoretiker · Lean-4-Logiker · Falsifizierer), physik, philosophie, allgemein.
Advocate: Entscheidet selektiv, liefert verbesserten Proposal.

R1-671B optional als Critic/Comparator-Backend (Port 8889). Ablationsstudien-Nachweis: Discussion > Self-Reflection (Sakka et al. Fig. 6).

Neue Valves (v2.0)

discussion_verwenden · expertenrollen_domaene · searxng_url · r1_671b_url

komitee_exploration — Exploration-zuerst-Modus

Sakka et al. Ablation (Fig. 6): Exploration stabilisiert Optimierungstrajektorie unabhängig von Startqualität. Ohne: Korrelation = -0,57. Mit: +0,003 (stabil). SearXNG-Recherche → n_seeds=8 diverse Ideen → n_final=3 ausgewählt → danach komitee_bewertung.

forschungsgraph_neo4j — Kausales Review-Memory

Kausalkette: hypothese_neu → experiment_starten → ergebnis_erfassen → kritik_hinzufuegen → revision_erstellen. Speichert nicht nur WAS, sondern WARUM etwas funktionierte/scheiterte. Schema: 5 Knoten-Constraints (Hypothese, FExperiment, FErgebnis, FKritik, FRevision). Projekte: ArithGaugeTheory, Anima-IV, FloerCondensed.

context_state_condenser — Epistemischer Context State (QUEST-Paradigma)

Implementiert das Context-State-Schema aus Xie et al., Quest: Training Frontier Deep Research Agents with Fully Synthetic Tasks (arXiv:2605.24218, Mai 2026). Komprimiert lange Konversationsverläufe in ein strukturiertes JSON mit drei Buckets: trusted (verifizierte Fakten mit Quellenangabe), untrusted (widerlegte Claims), uncertain (offene Punkte mit explizitem need-Feld als konkrete Handlungsanweisung). Bestehende States werden gemergt, nie überschrieben.

kontext_kondensieren: Hauptfunktion, Modellwahl über Valve (qwen3:235b-a22b voll, qwen3.6:35b-a3b schnell).
state_lesen: Markdown-Zusammenfassung eines States, farbcodiert nach Bucket.
uncertain_aktionen: extrahiert offene Verifikationsschritte als Checkliste.

Endpunkt

Router-Proxy (Port 11435, OpenAI-kompatibel) mit Fallback auf Ollama direkt (Port 11434)

rubrik_baum_komitee — Rubrik-Baum-Erweiterung von komitee_bewertung

Erweitert komitee_bewertung um hierarchische Rubrik-Bäume nach QUEST (Xie et al., arXiv:2605.24218, Abschnitt 2.1). Jeder Knoten trägt eine critical-Markierung (kritisches Versagen nullt den Elternknoten) und eine aggregation_strategy (sequential oder parallel). Blattknoten-Bewertung erfolgt als ein einzelner Batch-Aufruf statt n Einzelaufrufen — alle Kriterien eines Proposals werden in einem LLM-Call bewertet, danach rekursiv durch den Baum aggregiert.

rubrik_baum_definieren: generiert Rubrik-Baum automatisch aus Aufgabenbeschreibung (qwen3:235b-a22b).
antwort_bewerten: Batch-Bewertung aller Blattknoten gegen einen Text, rekursive Aggregation.
komitee_mit_rubrik: vollständiges Verfahren — k Proposals aus vier epistemischen Perspektiven (analytisch, synthetisch, adversariell, pragmatisch), Rubrik-Bewertung, Ranking.
rubrik_analyse_lesen: lesbare Markdown-Analyse mit farbcodierten Score-Balken.

Modellrollen

qwen3:235b-a22b für Rubrik-Generierung und Proposals, qwen3.6:35b-a3b für Blattknoten-Batch-Evaluierung

Tool	Version	Use
Lean 4 + Mathlib	4.31.0-rc2	Formal verification; PR #39701 (condensed modules) · CI Build ✅ Lint ✅
SageMath	10.9 (ARM64)	Algebraic geometry, computations
PARI/GP	2.17.3	Number theory, fundamental units, Iwasawa
Julia 1.12.6 + Hecke.jl	0.39.15	Algebraic number theory (ITensorNetworks 0.21.2, Nemo 0.54.2)
Macaulay2	1.26.05	Commutative algebra, Gröbner bases
Kenzo (SBCL)	7.0 (Common Lisp)	Effective homotopy computations
Lean 4 lean-liquid	current	Formalized LTE foundation (liquid Tensor)
Singular	4.4.1	Algebraic geometry, normalization
Agda 2.8.0 / Rocq	current	Type-theoretic formalization
Z3 Prover	4.16.0	SMT solving, formal verification
SpheriCo.jl	0.1.0 (Julia)	Numerical GR: scalar field collapse (Choptuik project)
NRPy+	2.1.1	Symbolic GR code generation
SFcollapse1D	arm64 binary	Scalar field collapse in C++ (GCC 15.2.0)
msolve	0.10.0	Polynomial system solver — Gröbner bases over ℤ/pℤ (LIP6, algebraic geometry)

lean_iterativ v4 — Iterative Proof Refinement Loop

Open WebUI tool for iterative Lean 4 proof verification (Ralph Loop, arXiv:2605.22763). Based on Li et al. "Compile to Compress" (ICML 2026): A — inline error injection (+3% MiniF2F), B — Markovian discipline, C — error-type routing, D — BFS/DFS + EVOLVE-BLOCK, E — pre-validation via lake env lean (saves N x lake-build iterations on structural failures).

Signature

lean_iterativ(aufgabe_oder_sketch, modell='deepseek-r1:70b', max_runden=8, frische_versuche=0, locked_regions=True)

Open WebUI Tools — Ecosystem Extensions (June 2026)

Based on Sakka et al. 2026 (Osaka): three tools implement the Exploration → Discussion → Review-Memory architecture (komitee_bewertung v2.0, komitee_exploration, forschungsgraph_neo4j). Two additional tools implement the QUEST epistemic framework (Xie et al., arXiv:2605.24218): context_state_condenser and rubrik_baum_komitee.

komitee_bewertung v2.0: Expert 1+2 (domain-specific) + Advocate cycle. Valves: discussion_verwenden, expertenrollen_domaene (mathematik/physik/philosophie), r1_671b_url (port 8889).
komitee_exploration: SearXNG search → 8 seed ideas → 3 selected → then komitee_bewertung. Stabilizes trajectory (ablation: -0.57 vs +0.003 correlation).
forschungsgraph_neo4j: Causal research memory. Chain: hypothese_neu → experiment_starten → ergebnis_erfassen → kritik_hinzufuegen → revision_erstellen. 5 node constraints, [:REVIDIERT_ZU] edges.
context_state_condenser: QUEST-style epistemic context state (arXiv:2605.24218) — trusted/untrusted/uncertain buckets, merge not overwrite, uncertain entries carry an explicit follow-up action.
rubrik_baum_komitee: hierarchical rubric-tree extension of komitee_bewertung (QUEST Sec. 2.1) — critical/non-critical nodes, sequential/parallel aggregation, single-batch leaf scoring.

05 Chemie / Biochemie / Neurobiologie-Stack (neu Juni 2026)

Installiert in Miniforge3-Umgebung chem_env (Python 3.12). Vollständig isoliert von unified_env, kein Konflikt mit LLM-Stack.

Tool	Version	Domäne	Status
PySCF	2.13.1	Quantenchemie: HF/DFT/CCSD	✓ Getestet
MACE-OFF23	0.3.16	ML-Kraftfeld organische Moleküle	✓ MPS-GPU
ASE	3.28.0	Molekülstruktur-Framework	✓
OpenMM	8.4	Molekulardynamik (OpenCL/GPU)	✓ OpenCL
NEURON	9.0.1	Kompartiment-Neuronenmodelle, HH	✓
Brian2	2.10.1	Spiking Neural Networks	✓
Nengo	4.1.0	Neural Engineering Framework	✓ NEF
MNE	1.12.1	EEG/MEG-Signalanalyse	✓
RDKit	2026.03.3	Cheminformatik, SMILES-Parsing	✓
MDAnalysis	2.10.0	MD-Trajektorienanalyse	✓
NetworkX	3.6.1	Graphentheorie, Konnektomics	✓
nilearn/nibabel/dipy	aktuell	Neuroimaging, fMRI	✓
PyMOL (OS)	aktuell	Molekülvisualisierung	✓
Tellurium	2.2.13	Systembiologie, SBML	✓

Verifikationstest PySCF: Hartree-Fock auf HF-Molekül, Ergebnis: E_HF = -99.987397 Hartree.

Tool	Version	Domain	Status
PySCF	2.13.1	Quantum chemistry: HF/DFT/CCSD	✓ Tested
MACE-OFF23	0.3.16	ML force field organic molecules	✓ MPS-GPU
ASE	3.28.0	Molecular structure framework	✓
OpenMM	8.4	Molecular dynamics (OpenCL/GPU)	✓ OpenCL
NEURON	9.0.1	Compartment neuron models, HH	✓
Brian2	2.10.1	Spiking neural networks	✓
Nengo	4.1.0	Neural engineering framework	✓ NEF
MNE	1.12.1	EEG/MEG signal analysis	✓
RDKit	2026.03.3	Cheminformatics, SMILES parsing	✓
MDAnalysis	2.10.0	MD trajectory analysis	✓
NetworkX	3.6.1	Graph theory, connectomics	✓
nilearn/nibabel/dipy	current	Neuroimaging, fMRI	✓
PyMOL (OS)	current	Molecular visualization	✓
Tellurium	2.2.13	Systems biology, SBML	✓

05b Physik-Simulation & Tensor-Kalkül Physics Simulation & Tensor Calculus

Physik-Stack für Quantenmechanik, Allgemeine Relativitätstheorie und Numerische Relativität. Ergänzt den Chemie/Bio-Stack durch spezialisierte GR-Werkzeuge (Cadabra2, EinsteinPy) und den Julia/NRPy+-Stack für numerischen Gravitationskollaps.

Werkzeug	Version	Einsatzbereich
QuTiP	5.2.3	Quantenmechanik — Qubits, Lindblad-Evolution, offene Quantensysteme, Dekohärenz (Python 3.12)
Cadabra2	2.5.14 (headless)	Tensor-Kalkül für ART — symbolische Indexmanipulation, Riemann-/Ricci-Tensor, Einstein-Gleichungen; aus Quellcode gebaut (Python 3.14)
EinsteinPy	0.4.0	Allgemeine Relativitätstheorie — Geodäten, Schwarzschild/Kerr-Raumzeiten, Christoffel-Symbole (chem_env)
Julia DifferentialEquations	8.0.0	ODE/DDE/SDE-Ökosystem — Kerr-Geodäten, Post-Newton-Inspirale, N-Körper (OrdinaryDiffEq 7.0.0)
NeuralPDE.jl / DiffEqFlux.jl	on-demand	Physics-Informed Neural Networks für PDEs; kann mit `Pkg.add` aktiviert werden

Open-WebUI-Werkzeuge: physik_simulation (Julia+QuTiP), qutip_simulation (Lindblad-Meister-Gleichung), physik_simulation_generieren (LLM→Code→Ausführung).

✓ Cadabra2 Tensor-Test: Ex('R^{a}_{b c d}') → Riemann-Tensor korrekt. EinsteinPy: Geodäten-Import OK.

Tool	Version	Domain
QuTiP	5.2.3	Quantum mechanics — qubits, Lindblad evolution, open quantum systems, decoherence (Python 3.12)
Cadabra2	2.5.14 (headless)	Tensor calculus for GR — symbolic index manipulation, Riemann/Ricci tensors, Einstein equations; built from source (Python 3.14)
EinsteinPy	0.4.0	General relativity — geodesics, Schwarzschild/Kerr spacetimes, Christoffel symbols (chem_env)
Julia DifferentialEquations	8.0.0	ODE/DDE/SDE ecosystem — Kerr geodesics, post-Newtonian inspirals, N-body (OrdinaryDiffEq 7.0.0)
NeuralPDE.jl / DiffEqFlux.jl	on-demand	Physics-informed neural networks for PDEs; activatable via `Pkg.add`

06 Systemarchitektur: Verbindungsstruktur

Dienst	Port	Funktion
LLM-Router-Proxy	11435	Zentrale Middleware, Routing, Synthegy
Ollama	11434	Modell-Backend (9 Modelle)
DSV4 llama-server 9650	8888	DeepSeek V4 Flash, 256K Kontext
R1-671B llama-server	8889	DeepSeek-R1-0528-671B, Hochqualitäts-Reasoning (~23 tok/s)
Open WebUI 0.9.6	3002	Chat-Interface, 28 Python-Tools
Perplexica	3000	Lokale Suche
SearXNG	8080	Meta-Suchmaschine
Neo4j 2026.05.0	7687	Knowledge Graph + Forschungsgraph (Slow Memory)
PostgreSQL 15.18	5432	Daten-Backend (Homebrew LaunchAgent)
ComfyUI (SDXL)	8188	Bildgenerierung on-device (SDXL Base 1.0; FLUX.1-dev entfernt)
Draw Things	1.20260520	Weitere Bildgenerierung on-device (SDXL); vollständig lokal
Lean 4 Verifier	Lokal	lake build für Mathlib-PRs
Master-Orchestrator	LaunchAgent	21 Projekte, 100 Phasen automatisch

Developer- & Build-Tools

Werkzeug	Version	Funktion
Git	2.50.1 (Apple Git-155)	Versionskontrolle — Mathlib-Fork, alle Projekte
GitHub CLI (gh)	2.94.0	GitHub-Integration, PR-Management, API-Zugriff
uv	0.11.21	Schneller Python-Paketmanager (Homebrew)
Node.js	26.3.0 (via nvm 0.40.5)	Frontend-Build, Perplexica, diverse Tools
Aider	—	KI-Coding-Assistent (qwen3.6:35b-a3b als Backend, CONVENTIONS.md in 9 Projekten)

Vektordatenbanken (LanceDB): plotinus_multilingual (78.674 Chunks), latin_passages, cardano_hybrid, philarchive, OSE-Wiki, Macrobius — BGE-M3-Embeddings, multilingual.

Slow Memory — Neo4j Knowledge Graph

Neo4j (Port 7687, Bolt): persistentes Wissensgraph-System als "Slow Memory". Labels: Person, MathConcept, Project, Text, Argument. Synthegy-Scores und Evaluationsergebnisse persistiert. Zusätzlich: Forschungsgraph-Schema (Hypothese · FExperiment · FErgebnis · FKritik · FRevision) für kausales Review-Memory nach Sakka et al. 2026.

Lokales KI-ÖkosystemMac Studio M3 Ultra · 256 GB · Vollständig lokal

00 Hardware-Infrastruktur Hardware Infrastructure

01 Lokale Sprachmodelle (Ollama 0.30.8 + DSV4 + R1-671B)

DeepSeek V4 Flash (DSV4) — separater llama-server

MLX-LM 0.31.3 — Apple-Silicon-nativer Inferenz-Layer

DeepSeek V4 Flash (DSV4) — dedicated llama-server

MLX-LM 0.31.3 — Apple Silicon native inference layer

02 LLM-Router-Proxy v3.3 LLM Router Proxy v3.3

04 Mathematik-Stack Mathematics Stack

lean_iterativ v4 — Iterativer Proof-Refinement-Loop

Open-WebUI-Tools — KI-Okosystem-Erweiterungen (Juni 2026)

komitee_bewertung v2.0 — Discussion-Phase (Sakka et al. 2026)

komitee_exploration — Exploration-zuerst-Modus

forschungsgraph_neo4j — Kausales Review-Memory

context_state_condenser — Epistemischer Context State (QUEST-Paradigma)

rubrik_baum_komitee — Rubrik-Baum-Erweiterung von komitee_bewertung

lean_iterativ v4 — Iterative Proof Refinement Loop

Open WebUI Tools — Ecosystem Extensions (June 2026)

05 Chemie / Biochemie / Neurobiologie-Stack (neu Juni 2026)

05b Physik-Simulation & Tensor-Kalkül Physics Simulation & Tensor Calculus

06 Systemarchitektur: Verbindungsstruktur

Developer- & Build-Tools

Slow Memory — Neo4j Knowledge Graph

Developer & Build Tools

Slow Memory — Neo4j Knowledge Graph

Service	Port	Function
LLM Router Proxy	11435	Central middleware, routing, Synthegy
Ollama	11434	Model backend (9 models)
DSV4 llama-server	8888	DeepSeek V4 Flash, 256K context
R1-671B llama-server	8889	DeepSeek-R1-0528-671B, high-quality reasoning (~23 tok/s)
Open WebUI 0.9.6	3002	Chat interface, 28 Python tools
Perplexica	3000	Local search
SearXNG	8080	Meta search engine
Neo4j 2026.05.0	7687	Knowledge graph + research graph (slow memory)
PostgreSQL 15.18	5432	Data backend (Homebrew LaunchAgent)
ComfyUI (SDXL)	8188	On-device image generation (SDXL Base 1.0; FLUX.1-dev removed)
Draw Things	1.20260520	Additional on-device image generation (SDXL); fully local
Lean 4 Verifier	Local	lake build for Mathlib PRs
Master Orchestrator	LaunchAgent	21 projects, 100 phases automated

Tool	Version	Function
Git	2.50.1 (Apple Git-155)	Version control — Mathlib fork, all projects
GitHub CLI (gh)	2.94.0	GitHub integration, PR management, API access
uv	0.11.21	Fast Python package manager (Homebrew)
Node.js	26.3.0 (via nvm 0.40.5)	Frontend build, Perplexica, miscellaneous tools
Aider	—	AI coding assistant (qwen3.6:35b-a3b backend, CONVENTIONS.md in 9 projects)

00 Hardware-Infrastruktur Hardware Infrastructure

01 Lokale Sprachmodelle (Ollama 0.30.8 + DSV4 + R1-671B) Local Language Models (Ollama 0.30.8 + DSV4 + R1-671B)

DeepSeek V4 Flash (DSV4) — separater llama-server

MLX-LM 0.31.3 — Apple-Silicon-nativer Inferenz-Layer

DeepSeek V4 Flash (DSV4) — dedicated llama-server

MLX-LM 0.31.3 — Apple Silicon native inference layer

02 LLM-Router-Proxy v3.3 LLM Router Proxy v3.3

04 Mathematik-Stack Mathematics Stack

lean_iterativ v4 — Iterativer Proof-Refinement-Loop

Open-WebUI-Tools — KI-Okosystem-Erweiterungen (Juni 2026)

komitee_bewertung v2.0 — Discussion-Phase (Sakka et al. 2026)

komitee_exploration — Exploration-zuerst-Modus

forschungsgraph_neo4j — Kausales Review-Memory

context_state_condenser — Epistemischer Context State (QUEST-Paradigma)

rubrik_baum_komitee — Rubrik-Baum-Erweiterung von komitee_bewertung

lean_iterativ v4 — Iterative Proof Refinement Loop

Open WebUI Tools — Ecosystem Extensions (June 2026)

05 Chemie / Biochemie / Neurobiologie-Stack (neu Juni 2026) Chemistry / Biochemistry / Neuroscience Stack (new June 2026)

05b Physik-Simulation & Tensor-Kalkül Physics Simulation & Tensor Calculus

06 Systemarchitektur: Verbindungsstruktur System Architecture: Connection Structure

Developer- & Build-Tools

Slow Memory — Neo4j Knowledge Graph

Developer & Build Tools

Slow Memory — Neo4j Knowledge Graph

01 Lokale Sprachmodelle (Ollama 0.30.8 + DSV4 + R1-671B)

05 Chemie / Biochemie / Neurobiologie-Stack (neu Juni 2026)

06 Systemarchitektur: Verbindungsstruktur