Das ist ein großes Release. Deine Zwischenablage kann jetzt Bilder lesen. Rechtsklick auf einen Screenshot, ein Foto oder einen Scan, und bitte die KI, Text zu extrahieren, zu beschreiben, was sie sieht, strukturierte Daten zu ziehen oder zu übersetzen. KI-Transforms laufen jetzt im Hintergrund, also friert nichts ein, während du wartest.

Auf einen Blick:

AI-Vision-Transforms: analysiere Bilder mit 5 eingebauten Prompts plus eigenen
Hintergrund-AI-Job-Queue: Transforms frieren die UI nicht mehr ein
Alle KI-Anbieter in nativem Rust: schneller, zuverlässiger, keine CORS-Probleme
Native Windows-Notifications: Ergebnisse poppen auf, wenn Beetroot ausgeblendet ist
11 Bug-Fixes

AI-Vision-Transforms

Wähle ein beliebiges Bild aus deiner Clipboard-Historie, Rechtsklick → AI, und such einen Vision-Prompt. Das Bild geht zu deinem KI-Anbieter und das Ergebnis landet in deiner Zwischenablage, bereit zum Einfügen.

Fünf eingebaute Vision-Prompts:

Prompt	Was er tut
Read Text	OCR aus Fotos, Screenshots, handgeschriebenen Notizen
Describe Image	Liefert eine Textbeschreibung dessen, was im Bild ist
Extract Data	Zieht strukturierte Daten aus Tabellen, Belegen, Rezepten
Summarize Image	Schnelle Zusammenfassung visueller Inhalte
Translate Image Text	Übersetzt Text aus Bildern

Du kannst auch eigene Vision-Prompts in den Settings anlegen.

Funktioniert mit allen Anbietern:

Cloud: OpenAI GPT-5.4, Anthropic Claude (Haiku/Sonnet), Google Gemini 2.5, DeepSeek
Lokal: Ollama (llava, bakllava, moondream), LM Studio

Selbst ein 4B lokales Modell auf deiner eigenen Hardware kann handgeschriebene Rezepte lesen. Keine Cloud, kein API-Key, keine Daten verlassen deinen Rechner.

Real-World-Test: Arzt-Handschrift

Um AI Vision zu testen, habe ich ein zufälliges handgeschriebenes ärztliches Rezept aus Google Images gegriffen, eine Notiz aus einer Zahnarztpraxis mit kursiver Handschrift und medizinischen Abkürzungen. Das Zeug, das schwer zu lesen ist, sogar für Menschen.

Original handgeschriebenes Rezept aus einer Zahnarztpraxis

Ich habe es durch fünf verschiedene Modelle geschickt. So sah es aus:

Modell	Typ	Geschwindigkeit	Qualität
GPT 5.4 mini	Cloud	Schnell	Exzellent. Akkurates Lesen der Kursivschrift, gute Formatierung
Gemini 2.5 Flash	Cloud	Sehr schnell	Exzellent. Gut strukturierter Output, behält Layout bei
Claude Haiku 4.5	Cloud	Schnell	Exzellent. Sauberer Output, akkurat
LM Studio Qwen 3.5 4B	Lokal	Mittel	Sehr gut. Bestes lokales Modell, gute Formatierung
Ollama Qwen 3 4B	Lokal	Mittel	Gut. Solides OCR, weniger Formatierung

Alle fünf lasen die Medikamente (Augmentin 625mg, Enzoflam, Pan-D 40mg), Dosierungen und Anweisungen korrekt. Aus kursiver Handschrift auf Papier.

GPT 5.4 mini. Sauberer, gut formatierter Output

Gemini 2.5 Flash. Gut strukturiert, behält das Original-Layout bei

Claude Haiku 4.5. Sauber und akkurat

LM Studio Qwen 3.5 4B. Bestes lokales Modell, läuft komplett auf deinem Rechner

Ollama Qwen 3 4B. Solides OCR aus einem komplett lokalen Modell

Ein paar Ideen, was du damit machen kannst:

Handschriftliche Notizen, Whiteboards, Sticky Notes lesen
Daten aus Belegen, Rechnungen, Visitenkarten extrahieren
OCR von Screenshots fremdsprachiger Apps
Charts, Diagramme, technische Zeichnungen beschreiben
Schilder, Menüs, Dokumente aus Fotos übersetzen

Hintergrund-AI-Job-Queue

KI-Transforms haben die UI früher 5–30 Sekunden eingefroren, während sie auf die Antwort warteten. Jetzt laufen sie im Hintergrund:

Vorher: Klick auf KI-Prompt → UI friert ein → Ergebnis erscheint

Jetzt: Klick auf KI-Prompt → Menü schließt sofort → weiterarbeiten → Notification poppt auf mit dem Ergebnis

Mehrere Transforms in die Queue stellen, sie laufen einer nach dem anderen. Wenn Beetroots Fenster ausgeblendet ist, bekommst du eine native Windows-Notification. Klick darauf, um Beetroot in den Vordergrund zu holen.

Alle KI-Anbieter in nativem Rust

Alle Cloud-API-Calls (OpenAI, Anthropic, Gemini, DeepSeek, Ollama) sind von Browser-JavaScript zu nativem Rust-Code gewandert:

Keine CORS-Errors mehr
Funktioniert, wenn das Fenster ausgeblendet ist (notwendig für Hintergrund-Transforms)
Zuverlässiger mit konsistentem Error-Handling
Schneller

Bug-Fixes

KI-Menü, das nach einem Fehler manchmal hängenblieb, behoben
Settings, die Font-Änderungen bei Cancel nicht zurücksetzten, behoben
Error-Toast, der auf dunklen Themes unlesbar war, behoben
Legacy-Modellnamen, die nicht korrekt migrierten, behoben
6 Fixes für Edge-Cases in Vision-Transforms

Update

Beetroot bietet das Update automatisch an. Oder v1.6.5 von GitHub herunterladen.

Beetroot v1.6.5: Deine Zwischenablage kann jetzt Bilder lesen

AI-Vision-Transforms

Real-World-Test: Arzt-Handschrift

Hintergrund-AI-Job-Queue

Alle KI-Anbieter in nativem Rust

Bug-Fixes

Update

Diskussion

Weitere Artikel

Beetroot v1.6.6: Der Office-Fix

Beetroot v1.6.4: Vorschau-Panel-Redesign und ein Overlay, das du wirklich anpassen kannst

Beetroot v1.6.3: Copied-Overlay, Explorer-Bilder, GPT-5.4