Ограничения скорости регулируют количество запросов, которые вы можете сделать к API Gemini в течение определенного периода времени. Эти ограничения помогают обеспечить справедливое использование, защитить от злоупотреблений и поддерживать производительность системы для всех пользователей.
Как работают ограничения скорости
Пределы скорости измеряются по четырем параметрам:
- Запросов в минуту ( RPM )
- Запросов в день ( RPD )
- Токенов в минуту ( TPM )
- Токенов в день ( TPD )
Ваше использование оценивается по каждому лимиту, и превышение любого из них вызовет ошибку ограничения скорости. Например, если ваш лимит RPM равен 20, выполнение 21 запроса в течение минуты приведет к ошибке, даже если вы не превысили свой TPM или другие лимиты.
Ограничения по скорости применяются к проекту, а не к ключу API.
Ограничения различаются в зависимости от конкретной используемой модели, а некоторые ограничения применяются только к определенным моделям. Например, Images per minute (количество изображений в минуту), или IPM, рассчитывается только для моделей, способных генерировать изображения (Imagen 3), но концептуально аналогичен TPM.
Для экспериментальных и предварительных моделей ограничения скорости более строгие.
Уровни использования
Ограничения по скорости привязаны к уровню использования проекта. По мере увеличения использования API и расходов у вас будет возможность перейти на более высокий уровень с увеличенными ограничениями по скорости.
Уровень | Квалификации |
---|---|
Бесплатно | Пользователи в странах, имеющих право на участие |
Уровень 1 | Платежный счет, привязанный к проекту |
Уровень 2 | Общая сумма расходов: 250 долларов США + не менее 30 дней с момента успешной оплаты |
Уровень 3 | Общая сумма расходов: 1000 долларов США + не менее 30 дней с момента успешной оплаты |
Когда вы запрашиваете обновление, наша автоматизированная система защиты от злоупотреблений выполняет дополнительные проверки. Хотя соответствие указанным критериям квалификации обычно достаточно для одобрения, в редких случаях запрос на обновление может быть отклонен на основании других факторов, выявленных в процессе проверки.
Эта система помогает обеспечить безопасность и целостность платформы Gemini API для всех пользователей.
Текущие ограничения по ставкам
Бесплатный уровень
Модель | Обороты в минуту | ТРМ | РПД |
---|---|---|---|
Gemini 2.5 Flash-превью 05-20 | 10 | 250,000 | 500 |
Gemini 2.5 Flash Предварительный просмотр TTS | 3 | 10,000 | 15 |
Gemini 2.5 Pro Предварительный просмотр 06-05 | -- | -- | -- |
Gemini 2.5 Pro Предварительный просмотр TTS | -- | -- | -- |
Gemini 2.5 Pro Экспериментальный 03-25 | 5 | 250 000 ТО/МИН 1 000 000 ТПД | 25 |
Близнецы 2.0 Флэш | 15 | 1,000,000 | 1500 |
Генерация изображений предварительного просмотра Flash Gemini 2.0 | 10 | 200,000 | 100 |
Gemini 2.0 Flash Экспериментальный | 10 | 250,000 | 1000 |
Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 1500 |
Близнецы 1.5 Флэш | 15 | 250,000 | 500 |
Близнецы 1.5 Флэш-8Б | 15 | 250,000 | 500 |
Близнецы 1.5 Про | -- | -- | -- |
Вео 2 | -- | -- | -- |
Изображение 3 | -- | -- | -- |
Джемма 3 | 30 | 15000 | 14,400 |
Джемма 3н | 30 | 15000 | 14,400 |
Gemini Embedding Experimental 03-07 | 5 | -- | 100 |
Уровень 1
Модель | Обороты в минуту | ТРМ | РПД |
---|---|---|---|
Gemini 2.5 Flash-превью 05-20 | 1000 | 1,000,000 | 10,000 |
Gemini 2.5 Flash Предварительный просмотр TTS | 10 | 10,000 | 100 |
Gemini 2.5 Pro Предварительный просмотр 06-05 | 150 | 2,000,000 | 1000 |
Gemini 2.5 Pro Предварительный просмотр TTS | 10 | 10,000 | 50 |
Близнецы 2.0 Флэш | 2000 | 4,000,000 | -- |
Генерация изображений предварительного просмотра Flash Gemini 2.0 | 1000 | 1,000,000 | 10,000 |
Gemini 2.0 Flash Экспериментальный | 10 | 4,000,000 | -- |
Gemini 2.0 Flash-Lite | 4000 | 4,000,000 | -- |
Близнецы 1.5 Флэш | 2000 | 4,000,000 | -- |
Близнецы 1.5 Флэш-8Б | 4000 | 4,000,000 | -- |
Близнецы 1.5 Про | 1000 | 4,000,000 | -- |
Изображение 3 | -- | 20 изображений в минуту (IPM) | -- |
Вео 2 | 2 видео в минуту (VPM) | -- | 50 видео в день (VPD) |
Джемма 3 | 30 | 15000 | 14,400 |
Джемма 3н | 30 | 15000 | 14,400 |
Gemini Embedding Experimental 03-07 | 10 | -- | 1000 |
Уровень 2
Модель | Обороты в минуту | ТРМ | РПД |
---|---|---|---|
Gemini 2.5 Flash-превью 05-20 | 2000 | 3,000,000 | 100,000 |
Gemini 2.5 Flash Предварительный просмотр TTS | 1000 | 100,000 | 10,000 |
Gemini 2.5 Pro Предварительный просмотр 06-05 | 1000 | 5,000,000 | 50,000 |
Gemini 2.5 Pro Предварительный просмотр TTS | 100 | 25,000 | 1000 |
Gemini 2.5 Pro Экспериментальный 03-25 | -- | -- | -- |
Близнецы 2.0 Флэш | 10,000 | 10,000,000 | -- |
Генерация изображений предварительного просмотра Flash Gemini 2.0 | 2000 | 3,000,000 | 100,000 |
Gemini 2.0 Flash Экспериментальный | 10 | 4,000,000 | -- |
Gemini 2.0 Flash-Lite | 20,000 | 10,000,000 | -- |
Близнецы 1.5 Флэш | 2000 | 4,000,000 | -- |
Близнецы 1.5 Флэш-8Б | 4000 | 4,000,000 | -- |
Близнецы 1.5 Про | 1000 | 4,000,000 | -- |
Изображение 3 | -- | 20 изображений в минуту (IPM) | -- |
Вео 2 | -- | -- | -- |
Джемма 3 | 30 | 15000 | 14,400 |
Джемма 3н | 30 | 15000 | 14,400 |
Gemini Embedding Experimental 03-07 | 10 | -- | 1000 |
Уровень 3
Модель | Обороты в минуту | ТРМ | РПД |
---|---|---|---|
Gemini 2.5 Flash-превью 05-20 | 10,000 | 8,000,000 | -- |
Gemini 2.5 Pro Предварительный просмотр 06-05 | 2000 | 8,000,000 | -- |
Близнецы 2.0 Флэш | 30,000 | 30,000,000 | -- |
Генерация изображений предварительного просмотра Flash Gemini 2.0 | 5000 | 5,000,000 | -- |
Gemini 2.0 Flash-Lite | 30,000 | 30,000,000 | -- |
Указанные ограничения по скорости не гарантируются, и фактическая пропускная способность может отличаться.
Ограничения скорости API в реальном времени
Бесплатный уровень
Имя | Одновременные сеансы | ТРМ | РПД |
---|---|---|---|
API в реальном времени | 3 | 1,000,000 | -- |
Gemini 2.5 Flash Preview Собственный аудиодиалог | 1 | 25,000 | 5 |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 | 10,000 | 5 |
Уровень 1
Имя | Одновременные сеансы | ТРМ | РПД |
---|---|---|---|
API в реальном времени | 50 | 4,000,000 | -- |
Gemini 2.5 Flash Preview Собственный аудиодиалог | 3 | 50,000 | 50 |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | 1 | 25,000 | 50 |
Уровень 2
Имя | Одновременные сеансы | ТРМ | РПД |
---|---|---|---|
API в реальном времени | 1000 | 10,000,000 | -- |
Gemini 2.5 Flash Preview Собственный аудиодиалог | 100 | 1,000,000 | Неограниченный |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | -- | -- | -- |
Уровень 3
Имя | Одновременные сеансы | ТРМ | РПД |
---|---|---|---|
API в реальном времени | Пока недоступно | Пока недоступно | -- |
Gemini 2.5 Flash Preview Собственный аудиодиалог | -- | -- | -- |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | -- | -- | -- |
Указанные ограничения по скорости не гарантируются, и фактическая пропускная способность может отличаться.
Как перейти на следующий уровень
API Gemini использует Cloud Billing для всех биллинговых услуг. Чтобы перейти с бесплатного уровня на платный, сначала необходимо включить Cloud Billing для вашего проекта Google Cloud.
Как только ваш проект будет соответствовать указанным критериям, он станет подходящим для обновления до следующего уровня. Чтобы запросить обновление, выполните следующие действия:
- Перейдите на страницу ключей API в AI Studio.
- Найдите проект, который вы хотите обновить, и нажмите «Обновить». Опция «Обновить» будет отображаться только для проектов, которые соответствуют квалификациям следующего уровня .
После быстрой проверки проект будет повышен до следующего уровня.
Запросить увеличение лимита ставки
Каждая вариация модели имеет связанный с ней предел скорости (запросов в минуту, RPM). Подробности об этих пределах скорости см. в разделе Модели Gemini .
Запросить увеличение лимита платной ставки
Мы не даем никаких гарантий относительно увеличения вашего лимита скорости, но мы сделаем все возможное, чтобы рассмотреть ваш запрос и свяжемся с вами, если сможем удовлетворить ваши потребности в емкости.