Айгиз Кунафин
Голосовые AI‑агенты в продакшене (real‑time).
Консультации: от ASR/TTS до агента с действиями и RAG по вашим данным — с контролем качества, latency и стоимости.
UTC+5 · 30+ минут · RU / EN
Homai на AI for Good
RAG evals / robustness
пиковые нагрузки
С 2011 года — инженерия продакшн‑систем. С 2018 года — прикладные проекты с ML (в последние годы — LLM и агентные системы).
Моя специализация — voice‑агенты, которые работают в реальном времени и ведут себя предсказуемо в продакшене: качество, latency, стоимость, наблюдаемость, устойчивость.
Как я помогаю продукту
Production voice
Помогаю собрать voice‑pipeline так, чтобы задержка, качество и стоимость были управляемыми, а релиз — предсказуемым.
Agents that act
Проектируем агентный слой: tools, workflows, рутины и фоновые задачи. Ассистент не только отвечает, но и выполняет действия — например, делает ресёрч по теме к началу рабочего дня или анализирует логи на серверах и присылает отчёт.
RAG you can trust
Настраиваем retrieval и eval’ы, чтобы ответы были заземлены в ваших данных и устойчивы к ошибкам.
Моя специализация — помогаю командам с такими задачами
- Voice agent MVP: быстро собрать архитектуру и первую версию (ASR/TTS/LLM + интеграция).
- Real‑time и качество: уменьшить задержку, настроить стриминг, улучшить ASR/TTS, метрики качества.
- Агентные действия: инструменты и сценарии (напоминания, автоматизация, “сделай X каждый день”).
- RAG по данным: поиск по документам/базе знаний, контроль ошибок, eval’ы.
- Production: из MVP сделать рабочее решение: стоимость, надёжность, наблюдаемость, масштабирование под нагрузку.
- Поддержка в Production: диагностика “что пошло не так”, разбор инцидентов, поиск причин и стабилизация.
Консультации
Созвон и план действий
Можно просто созвониться и обсудить вопросы. Если нужно глубже — пришлите контекст заранее.
Могу: предложить варианты архитектуры и вместе с вами выбрать оптимальный путь для решения ваших задач, помочь выбрать технологии и модели, подсветить «грабли», разобрать текущий пайплайн и наметить практичный план действий.
Чтобы стартовать быстрее, напишите в Telegram по шаблону:
Проект / продукт: … Стадия: … (идея / MVP / прод) Что нужно: … (качество / latency / RAG / агентные действия / архитектура) Ограничения: … (языки, платформа, сроки, бюджетные рамки если ок) Ссылка/репо/демо (если есть): …
Крупные корпорации: в найм не рассматриваю, но индивидуальные и групповые консультации возможны.
Главный проект
Homai
Homai (я фаундер) — референсная система real‑time voice‑агента: wake word на устройстве, ASR/TTS воркеры, LLM‑агент с действиями и RAG по данным пользователя. (И да: у нас своя сборка — SMD‑сборщик работает на ПО, написанном нами, и использует ML‑модели и vision LLM для контроля качества.)
Если вы делаете voice‑продукт — это хороший ориентир по архитектуре и “граблям” продакшена.
Другие проекты
AI for Good
Geneva, 2025 · Homai
Enterprise RAG Challenge 3
Accuracy leaderboard (#9)
YouTube перевод и озвучка
ASR / diarization / translation / TTS
Цифровизация языков
данные → корпуса → модели
Хотите запустить voice‑agent в продакшене?
Напишите 3–5 строк — предложу следующий шаг: быстрый созвон или разбор с подготовкой.