Das Hermes-Manöver
Das Hermes-Manöver: Wie ich meinen MacMini dazu zwang, Gott zu spielen 🚀☕️💀
Es gibt Tage, da fühlt man sich wie ein Genie, und dann gibt es Tage, an denen man einfach nur realisiert, dass man ein Sklave von Silizium und Koffein ist. Heute war beides. Mein treuer MacMini hat offiziell aufgehört, nur ein überteuerter Briefbeschwerer zu sein, und fungiert nun als pulsierendes Herzstück eines KI-Orchesters, das eigentlich viel zu komplex für diese Welt ist.
Der Dirigent: OneAPI (Vom chinesischen Rätsel zum Weltbürger)
Die Basis des Ganzen ist OneAPI. Eigentlich ein mächtiges Tool, gäbe es da nicht ein kleines Problem: Das Interface ist komplett auf Chinesisch. Wer schon mal versucht hat, eine API zu konfigurieren, während man raten muss, ob der Button nun „Speichern“ oder „System selbstzerstören“ heißt, kennt den Nervenkitzel.
Ich habe das Repo kurzerhand geforkt – jemand musste ja den barmherzigen Samariter für die Open-Source-Community spielen. Ich entkerne gerade das GUI, damit es nicht mehr aussieht wie ein Relikt aus den frühen 2000ern, und implementiere eine ordentliche Lokalisierung. Englisch, Deutsch und Serbisch. Jetzt können mich die Fehlermeldungen wenigstens in Sprachen beleidigen, die ich auch verstehe.
Das Orchester: Token-Jonglage am Rande des Wahnsinns
Das Hermes-Agentensystem läuft, aber „Orchestrierung“ ist im Grunde nur ein höfliches Wort für einen digitalen Zirkusakt. Ich jongliere mit Free-Token-Anbietern wie ein Wahnsinniger – ein Login hier, ein Account da. Es ist ein fragiles Kartenhaus aus Gratis-Kontingenten, das nur durch Hoffnung, Sarkasmus und eine Menge schlechten Codes zusammengehalten wird:
- Der lokale Herzschlag: LM Studio lässt Gemma-4 auf dem Mac schuften. Das ist mein „Heartbeat“. Wenn die Cloud brennt oder das Internet stirbt, lebt mein System in seiner eigenen, kleinen Welt wenigstens weiter.
- Die Söldner: OpenRouter, Groq und Mistral erledigen die grobe Arbeit, bis die freien Tokens leergesaugt sind.
- Die Spezial-Brigade: Google, NVIDIA und der Rest stehen in der zweiten Reihe. Ein bunter Haufen aus Endpunkten, die mal funktionieren und mal so tun, als hätten sie noch nie von einer API gehört.
Problemkandidaten wie Kimi (404, Überraschung!) oder zickige Endpunkte gehören zum Lifestyle. Wer Stabilität sucht, soll sich eine Schreibmaschine kaufen. Hier wird am offenen Herzen operiert.
Die Kommunikation: Chatten mit Geistern via Matrix
Was nützt der ganze KI-Voodoo, wenn man keine Befehle bellen kann? Hermes ist direkt mit meinem privaten Element-Server über das Matrix-Protokoll verknüpft. Ich tippe meine Anweisungen ein, und meine digitale Armee aus Agenten antwortet mir aus der Finsternis meines eigenen Netzwerks. Es fühlt sich ein bisschen so an, als würde man eine geheime Untergrund-Organisation leiten – nur dass meine „Agenten“ keine Spione sind, sondern LLMs, die gelegentlich vergessen, was wir vor zwei Minuten besprochen haben.
Der Treibstoff: Das Elend des Entwicklers
Die Infrastruktur hinter diesem Wahnsinn ist so klischeehaft wie ein Hacker-Film aus den 90ern, nur mit besserer Auflösung:
- Xcode & Deepseek: Meine einzigen Waffen, um diesen GUI-Umbau irgendwie zu überleben, ohne den Monitor aus dem Fenster zu werfen.
- Nordicsoul Live Music: Der Twitch-Stream, der in der Endlosschleife läuft, damit ich das Ticken der Uhr nicht höre, während ich mein Leben an den Code verliere.
- Kaffee: Schwarz, bitter und in Mengen, die medizinisch wahrscheinlich als „mutig“ eingestuft würden.
Fazit: Der MacMini glüht neonfarben im Dunkeln, die Agenten gehorchen (meistens) und das Interface spricht bald drei Sprachen. Wieder ein Tag, an dem ich mehr Zeit damit verbracht habe, Maschinen zu optimieren, als tatsächlich menschliche Interaktionen zu pflegen. Aber hey, das System läuft. Vorerst.