Reference implementation
Homai
Роль: фаундер проекта.
Умная колонка на башкирском языке.
Real‑time voice‑агент: wake word на устройстве → ASR/TTS воркеры → LLM‑агент с действиями и RAG по данным пользователя.
Я фаундер Homai.
Что важно в этом проекте
- Real‑time: голосовой UX требует предсказуемой задержки и стабильного поведения.
- Агентность: ассистент умеет выполнять задачи через инструменты/сценарии.
- RAG: ответы на основе данных пользователя, а не только “общих знаний”.
- Продакшн‑инженерия: компоненты разделены (воркеры), чтобы управлять latency и масштабированием.
Архитектура (крупными блоками)
- On‑device (C++): wake word и базовая логика.
- Backend (Go): оркестрация запросов, состояние, очереди/воркеры.
- Workers: ASR / TTS / LLM как отдельные сервисы.
- LLM‑agent: ответы + действия (рутины, автоматизация).
- RAG: retrieval по данным пользователя.
Ссылки
- Сайт проекта: homai.ru
- Homai Tech: homai.tech
- AI for Good: aiforgood.itu.int
Сборка и контроль качества
Мы собираем устройства сами. Сборщик SMD‑компонент работает на ПО, написанном нами: в процессе используются ML‑модели и vision LLM, чтобы повысить качество сборки и снизить процент ошибок.
Медиа
Хотите сделать похожий voice‑agent?
Напишите 3–5 строк контекста — предложу следующий шаг.