Адаптивная интеллектуальная система взаимодействия «Умная кнопка»

Компактное устройство на базе Python и Google Gemini API, которое понимает контекст и намерения пользователя без необходимости запоминать команды. Две версии — цилиндрическая и кубическая. Интегрируется с умным домом и любыми внешними системами.


Проект ученика 9 класса Чистова Никиты Леонидовича (ГБОУ Школа №2009) под руководством Мырадова Мырата Вепаевича.

Представьте кнопку, которая не просто нажимается — она думает. «Умная кнопка» Никиты — это компактное устройство с искусственным интеллектом, которое понимает, что именно нужно пользователю прямо сейчас, и автоматически выбирает нужное действие. Никаких сложных команд, никакого запоминания горячих клавиш.

«Умная кнопка» — вторая версия устройства


1. Проблема и актуальность

Современные голосовые помощники — Siri, Google Assistant, Alexa — при всей своей популярности имеют серьёзные ограничения:

АссистентПроблема
SiriЖёсткий набор функций, слабая кастомизация
Google AssistantЗамкнут в экосистеме Google, плохо интегрируется с внешними сервисами
AlexaПолностью зависит от голосовых команд — неудобно в шумных местах или при нестандартном произношении

«Умная кнопка» решает эти проблемы: она анализирует контекст и намерения пользователя, а не распознаёт фиксированный набор фраз.


2. Технологический стек

Никита построил систему на четырёх ключевых технологиях:

🐍
Python
Основной язык
🧠
Google Gemini API
«Мозг» системы
🎙️
Groq API (Whisper)
Распознавание речи
🔊
Edge TTS
Синтез речи

3. Как работает система

Шаг 1 — Ввод. Пользователь нажимает кнопку и говорит произвольную фразу. Groq API (Whisper) мгновенно транскрибирует аудио в текст.

Шаг 2 — Анализ. Google Gemini получает текст запроса вместе с контекстом (время суток, история предыдущих действий, подключённые устройства). Модель определяет намерение пользователя и выбирает подходящую функцию.

Шаг 3 — Исполнение. Python-модуль выполняет выбранное действие — управляет умными устройствами, открывает приложения, отправляет сообщения, запускает сценарии автоматизации.

Шаг 4 — Обратная связь. Edge TTS синтезирует голосовой ответ и подтверждает выполнение задачи.


4. Два поколения устройства

Проект прошёл два итерационных цикла — каждая версия принципиально отличалась по форм-фактору.

Версия 1 — Цилиндрическая форма

Первый прототип в виде цилиндра позволил проверить алгоритм и отладить взаимодействие всех API. Корпус напечатан на 3D-принтере, кнопка расположена на верхней грани.

Версия 1 — вид сверху (кнопка)

Версия 1 — вид снизу (USB-порт зарядки и выключатель)

Характеристики v1:

  • Форм-фактор: цилиндр
  • Одна физическая кнопка сверху
  • USB-C порт и тумблер питания снизу
  • Открытая макетная плата внутри

Версия 2 — Кубическая форма

Финальный корпус переработан в форму куба с разъёмом для расширения на верхней грани и синим тумблером на боку. Компактнее, технологичнее, готова к демонстрации.

Версия 2 — вид спереди (кубический корпус)

Версия 2 — чистовое фото на тёмном фоне

Характеристики v2:

  • Размеры: 6.3 × 6.3 × 4.7 см
  • Масса: 86 г
  • Разъём расширения на верхней грани
  • Синий тумблер питания на боку
  • USB-C для зарядки/обновления ПО

5. Уникальные преимущества

Нет жёстких команд. В отличие от Alexa («Alexa, включи свет на кухне»), «Умная кнопка» понимает «стало темно» и сама включает нужный свет.

Расширяемость. Любой разработчик может добавить собственные функции через Python-интерфейс без перепрошивки устройства.

Мультиплатформенность. Интегрируется с умным домом, рабочими инструментами (Notion, Telegram, Google Calendar) и любыми другими сервисами через API.


6. Перспективы

  • Полноценное мобильное приложение для управления устройством со смартфона
  • Графический интерфейс для добавления пользовательских функций без написания кода
  • Расширение возможностей — интеграция с большим числом умных устройств и IoT-платформ

Автор проекта

Чистов Никита
Чистов Никита Леонидович
9 класс, ГБОУ Школа №2009, Москва

«Умная кнопка» — демонстрация того, как современный ИИ можно встроить в физический объект и сделать управление технологиями по-настоящему интуитивным. Проект находится на пересечении аппаратной разработки, машинного обучения и продуктового дизайна.