Нативная генерация речи (Совместимо с API NVDA 2025)

Используйте мощь передового искусственного интеллекта Google Gemini для генерации высококачественной речи непосредственно в NVDA. Это дополнение предоставляет удобный диалог для преобразования текста в естественно звучащее аудио. Ключевые возможности: Высококачественные голоса: Выбирайте между Gemini Pro для премиального, реалистичного звучания и Gemini Flash для стандартного качества и быстрой генерации. Режимы для одного и нескольких говорящих: Легко создавайте аудио для одного говорящего или создавайте динамические диалоги с двумя различными голосами. Просто форматируйте текст как "ИмяГоворящего:" для назначения голосов. Расширенное управление голосом: Тонко настраивайте вывод, регулируя параметр "температура" для более креативных или стабильных результатов, а также задавая пользовательские инструкции по стилю. Доступный интерфейс: Все элементы управления полностью доступны, включая свёртываемую панель для расширенных настроек, что делает интерфейс чистым и удобным для навигации. Бесшовный рабочий процесс: Дополнение обеспечивает мгновенное воспроизведение аудио после генерации и позволяет сохранять полученный файл .wav для последующего использования. Чтобы начать, получите Gemini API-ключ в Google AI Studio и введите его на панели настроек дополнения, которая находится в меню Сервис NVDA. Сочетание клавиш можно изменить в жестах ввода, в категории «Нативная генерация речи».

← Вернуться к списку дополнений