Diese Demo benötigt JavaScript – erst damit kann das Sprachmodell in Ihrem Browser rechnen. Ohne JavaScript bleibt diese Seite ein (immerhin trackingfreies) Schaufenster.

KI-Demo · 100 % lokal

Die KI, die in Ihrem Browser läuft

Fast jeder Chatbot schickt Ihre Fragen an einen Cloud-Server. Unserer nicht – denn es gibt keinen. Der byteland Copilot lädt ein offenes Sprachmodell direkt in Ihren Browser und beantwortet Fragen zu unseren Leistungen anschließend komplett auf Ihrem Gerät. Genau so bauen wir auch KI-Lösungen für Unternehmen: lokal, datensparsam, ohne Abhängigkeit von fremden Clouds.

So funktioniert es

1Modell wählen & ladenIhr Browser lädt das Modell einmalig herunter. Netzwerker-Tipp: am besten am LAN-Kabel – ein Gigabyte ist kein Fall fürs Handynetz.
2Grafikchip übernimmtDas Modell läuft per WebGPU auf Ihrem eigenen Grafikchip – nicht auf einem Server.
3Fragen stellenAb jetzt ist alles lokal: Ihre Eingaben verlassen Ihr Gerät zu keinem Zeitpunkt.

Ehrlichkeit vorab – was geladen wird und was nicht

Einmalig geladen werden die freie WebLLM-Bibliothek (CDN: jsDelivr) und das gewählte offene Modell (CDN: Hugging Face) – das sind die einzigen externen Zugriffe dieser Demo, und nur nach Ihrem Klick.
Danach läuft alles lokal. Ihre Fragen und die Antworten werden auf Ihrem Gerät berechnet – es existiert kein Chat-Server, an den sie geschickt werden könnten, und wir können sie nicht mitlesen.
Keine Cookies, kein Tracking – wie auf der gesamten Website. Das Modell bleibt im Browser-Cache: Beim nächsten Besuch startet der Copilot ohne erneuten Download.

Wählen Sie Ihre Gewichtsklasse

Winzling SmolLM2 360M Redet begeistert mit, versteht herzlich wenig – die Comedy-Referenz dafür, wie klein zu klein ist · Download ca. 0,25 GB · ca. 0,4 GB Grafikspeicher Leichtgewicht Llama 3.2 1B Winzig und flott – die Antworten nehmen Sie am besten mit Humor · Download ca. 0,6 GB · ca. 0,9 GB Grafikspeicher Hausmarke Gemma 2 2B Googles Gemma-Familie – deren größere Geschwister arbeiten in unseren Kundenprojekten; hier die kompakte Browser-Ausgabe · Download ca. 1,4 GB · ca. 1,9 GB Grafikspeicher Empfohlen Qwen3 1.7B Gibt spürbar die besten Antworten dieser Runde – unsere Empfehlung · Download ca. 1 GB · ca. 2 GB Grafikspeicher Kraftpaket Llama 3.2 3B Merklich souveräner als die Kleinen – der Allrounder der Runde · Download ca. 1,8 GB · ca. 2,3 GB Grafikspeicher Schwergewicht Phi-4-mini Microsofts dickstes Kaliber unserer Runde – lohnt sich, wenn Ihre Grafikkarte mitspielt (die Ampel verrät es) · Download ca. 2,3 GB · ca. 3,4 GB Grafikspeicher

Sechs Gewichtsklassen, ein Test: Probieren Sie ruhig alle durch – der Qualitätssprung von Klasse zu Klasse ist ausdrücklich Teil der Demo. Und genau so sind die Antworten gemeint: als Kostprobe der jeweiligen Gewichtsklasse, nicht als verbindliche Auskunft – beim Winzling darf gelacht, beim Schwergewicht gestaunt werden. Und Hand aufs Herz zur Hardware: Richtig flott laufen die oberen Klassen nur mit dedizierter Grafikkarte – Laptops mit Chip-Grafik sind mit den leichten Klassen besser bedient (die Einschätzung an den Karten und der Tempo-Check im Chat sagen es Ihnen ehrlich). Warum die Modellgröße so einen Unterschied macht, haben wir in der Werkstatt vermessen (welche offenen Modelle echte Arbeit leisten, welche Grafikkarte es braucht, wo die ehrlichen Grenzen liegen): Der lokale KI-Agent 2026. Diese Seite ist der Live-Beweis dazu.

Prüfe, ob Ihr Browser WebGPU unterstützt …

Mit dem Klick starten Sie den einmaligen Download von jsDelivr und Hugging Face (Details im grünen Kasten · Datenschutzerklärung, Abschnitt 9). Läuft komplett in diesem Tab – Abbruch jederzeit.

Und wozu das Ganze?

Vom Spielzeug zum Werkzeug: KI, die Ihr Firmenwissen kennt

Dieser Copilot kennt byteland, weil wir ihm das Wissen dieser Website mitgegeben haben. Nichts anderes – nur ernsthafter – machen wir im Kundenprojekt: Ein lokal betriebenes Modell wird mit Ihrem Wissen angefüttert (Telefonlisten, Zuständigkeiten, Handbücher, Abläufe, FAQ) und beantwortet in Sekunden, was sonst Suchen, Nachfragen oder Warten bedeutet. Zum Beispiel:

Der Zettel-Ersatz„Welche Durchwahl hat die Buchhaltung? Wer genehmigt Firewall-Freigaben?" – Nummern und Zuständigkeiten sofort, statt Intranet-Odyssee oder Rundmail.
Das Onboarding-AssNeue Kollegen fragen den Assistenten statt dreimal täglich den Sitznachbarn: „Wie richte ich mein VPN ein? Wo liegt die Angebotsvorlage?"
Die Kunden-AuskunftAuf Ihrer Website: „Welche Unterlagen brauche ich für die Schadensmeldung? Wann ist die Werkstatt besetzt?" – beantwortet aus Ihren eigenen FAQ, ohne fremde Cloud.
Das FirmengedächtnisBetriebswissen bleibt abrufbar, auch wenn der Kollege im Urlaub ist – wie das aussieht, zeigt die Werkstatt: KI als zweites Gehirn.

Im Ernstfall läuft so ein Assistent nicht im Browser, sondern auf einem kleinen Server bei Ihnen im Haus: kräftigere Modelle, echter Zugriff auf Ihre Dokumente, und die Daten verlassen das Gebäude nicht. Neugierig, wie das für Ihren Betrieb aussähe? Unsere KI-Leistungen · welcome@byteland.de

Technik, Lizenzen & Marken: Inferenz per WebLLM (Apache 2.0) über WebGPU direkt im Browser; die Modelle werden nach Ihrem Start-Klick von Hugging Face geladen und laufen ausschließlich lokal. Qwen3 und SmolLM2 stehen unter Apache 2.0, Phi-4-mini unter MIT-Lizenz, Gemma 2 unter den Gemma-Nutzungsbedingungen von Google und Llama 3.2 unter der Llama 3.2 Community License – Built with Llama. Alle Modell- und Markennamen gehören ihren jeweiligen Inhabern; die Antworten der Modelle sind automatisch erzeugt und keine Aussagen der Modell-Anbieter oder von byteland. Wie wir so etwas in Unternehmen einsetzen, lesen Sie in der Werkstatt. Datenschutz-Details: Datenschutzerklärung, Abschnitt 9.

Die KI, die in Ihrem Browser läuft

So funktioniert es

Ehrlichkeit vorab – was geladen wird und was nicht

Wählen Sie Ihre Gewichtsklasse

Modell wird in Ihren Browser geladen …

Vom Spielzeug zum Werkzeug: KI, die Ihr Firmenwissen kennt