Kyra

Dein persönlicher KI‑Sprachassistent für ESP32‑S3

v1.0.0 Release

Hey, ich bin Kyra 👋

Stell dir vor, du kommst nach Hause, sagst einfach „Hi Kyra“ – und schon erwacht dein persönlicher Assistent zum Leben. Ich höre dir zu, verstehe deine Fragen und antworte dir mit einer natürlichen Stimme. Ob du wissen willst, wie das Wetter wird, eine lustige Geschichte hören möchtest oder einfach nur plaudern willst – ich bin für dich da.

Ich laufe auf einem kleinen Waveshare ESP32‑S3 Audio Board, brauche nur eine SD‑Karte und Strom. Meine Intelligenz kommt aus der Cloud – mit Groq (Whisper + Llama) und VoiceRSS für die Sprachausgabe. Das Beste: Du kannst mich über eine moderne Weboberfläche nach deinen Wünschen konfigurieren. Klingt gut? Dann lass uns loslegen!

Kyra in Aktion

Fertige Binärdatei

Alles vorkonfiguriert – einfach flashen & loslegen

19,99 €

Du erhältst:
bootloader.bin, partition-table.bin, ota_data_initial.bin, kyra.bin

So flasht du Kyra in 5 Minuten

1
ESP‑IDF installieren

Folge der Anleitung auf docs.espressif.com

2
Binärdateien entpacken

Lege die 4 .bin Dateien in einen Ordner, z.B. ~/kyra_flash

3
Gerät anschließen

Verbinde das Waveshare‑Board per USB – Port merken (z.B. /dev/ttyUSB0)

4
Flashen mit esptool
esptool.py --chip esp32s3 -p /dev/ttyUSB0 -b 460800 --before=default_reset --after=hard_reset write_flash --flash_mode dio --flash_freq 80m --flash_size 16MB 0x0 bootloader.bin 0x8000 partition-table.bin 0x10000 ota_data_initial.bin 0x20000 kyra.bin

Danach SD‑Karte mit index.html einlegen, Gerät neustarten – fertig!

  • Waveshare ESP32‑S3‑Audio‑Board (ES8311 + ES7210)
  • microSD‑Karte (FAT32, mind. 1 GB)
  • USB‑Kabel (Strom + Daten)

DienstZweckLink
GroqWhisper (Spracherkennung) + Llama (Antwort)console.groq.com
VoiceRSSSprachausgabe (TTS)voicerss.org

TabParameterBeschreibung
AudioMikrofon‑Kanal0 oder 1
Mikrofon‑VerstärkungFaktor (z.B. 8)
Silence ThresholdSchwellwert für Sprachbeginn
Stille‑Chunks bis StopAnzahl stiller Chunks (100 ms) bis Abbruch
Max Aufnahme (s)maximale Länge
Min Chunks für WhisperMindestlänge für Transkription
Max Warte‑Chunks auf SpracheTimeout ohne Sprache
Dialog‑Timeout (s)Inaktivität → Schlaf
Pause nach Antwort (ms)Pause nach Sprachausgabe
APIDein Namewird im Prompt verwendet
Groq API‑Key-
VoiceRSS API‑Key-
Groq‑PromptSystemnachricht (Platzhalter %s für Name)
LEDModi für ZuständeZahlen 0‑17 (siehe Web‑UI)

ProblemLösung
Wake‑Word wird nicht erkanntMikrofon‑Kanal prüfen, Verstärkung erhöhen, silence_threshold senken
Keine Antwort von GroqAPI‑Key prüfen, WLAN‑Verbindung testen
Sprachausgabe zu schnell/langsamVoiceRSS‑URL muss f=48khz_16bit_stereo enthalten (Standard)
Web‑UI nicht erreichbarhttp://kyra.local oder IP aus Router‑Log
SD‑Karte nicht erkanntFAT32? Pins richtig? Log prüfen