2.5 Pro
Nasz najbardziej zaawansowany model myślący o maksymalnej dokładności odpowiedzi i najnowocześniejszej wydajności
- Wprowadzanie dźwięku, obrazów, wideo i tekstu oraz otrzymywanie odpowiedzi tekstowych
- Rozwiązywanie trudnych problemów, analizowanie dużych baz danych i wiele więcej
- Najlepszy do złożonego kodowania, rozumowania i rozumienia multimodalnego
2.5 Flash
Nasz najlepszy model pod względem stosunku ceny do wydajności, oferujący wszechstronne możliwości.
- Wprowadzać dźwięk, obrazy, filmy i tekst oraz otrzymywać odpowiedzi tekstowe
- Model myśli w miarę potrzeby lub możesz skonfigurować budżet na myślenie.
- Najlepiej sprawdza się w przypadku zadań o dużym natężeniu wymagających zastanowienia i niskiego opóźnienia
2.0 Flash
Nasz najnowszy model multimodalny z funkcjami nowej generacji i ulepszonymi możliwościami
- Wprowadzanie dźwięku, obrazów, wideo i tekstu oraz otrzymywanie odpowiedzi tekstowych
- generować kod i obrazy, wyodrębniać dane, analizować pliki, generować wykresy itp.
- Niski poziom opóźnień, ulepszona wydajność, obsługa funkcji agenta
Warianty modelu
Gemini API udostępnia różne modele zoptymalizowane pod kątem konkretnych zastosowań. Oto krótkie omówienie dostępnych wariantów Gemini:
Wariant modelu | Dane wejściowe | Wyniki | Zoptymalizowany dla |
---|---|---|---|
Gemini 2.5 Flash Preview 05-20
gemini-2.5-flash-preview-05-20 |
Dźwięk, obrazy, filmy i tekst | Tekst | Elastyczne myślenie, opłacalność |
Gemini 2.5 Flash Native Audio
gemini-2.5-flash-preview-native-audio-dialog &
gemini-2.5-flash-exp-native-audio-thinking-dialog |
Dźwięk, filmy i tekst | Tekst i dźwięk, przeplatane | wysokiej jakości dźwięk z naturalnym brzmieniem rozmów z opcją włączenia lub wyłączenia funkcji myślenia; |
Gemini 2.5 Flash Preview TTS
gemini-2.5-flash-preview-tts |
Tekst | Audio | generowanie dźwięku z zawartością tekstową w jednym lub wielu głośnikach z niskim opóźnieniem i możliwością kontroli; |
Podgląd Gemini 2.5 Pro
gemini-2.5-pro-preview-06-05 |
Dźwięk, obrazy, filmy i tekst | Tekst | Ulepszone myślenie i rozumowanie, zrozumienie multimodalne, zaawansowane kodowanie i inne funkcje |
Gemini 2.5 Pro podgląd TTS
gemini-2.5-pro-preview-tts
| Tekst | Audio | generowanie dźwięku z zawartością tekstową w jednym lub wielu głośnikach z niskim opóźnieniem i możliwością kontroli; |
Gemini 2.0 Flash
gemini-2.0-flash |
Dźwięk, obrazy, filmy i tekst | Tekst | Funkcje nowej generacji, szybkość, myślenie i transmisje w czasie rzeczywistym. |
Generowanie obrazów w ramach Gemini 2.0 Flash Preview
gemini-2.0-flash-preview-image-generation |
Dźwięk, obrazy, filmy i tekst | Tekst, obrazy | Generowanie i edytowanie obrazów w trybie konwersacyjnym |
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite |
Dźwięk, obrazy, filmy i tekst | Tekst | Opłacalność i niskie opóźnienie |
Gemini 1.5 Flash
gemini-1.5-flash |
Dźwięk, obrazy, filmy i tekst | Tekst | szybkie i wszechstronne działanie w różnych zastosowaniach; |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
Dźwięk, obrazy, filmy i tekst | Tekst | Zadania o dużej liczbie i mniejszym zaawansowaniu |
Gemini 1.5 Pro
gemini-1.5-pro |
Dźwięk, obrazy, filmy i tekst | Tekst | złożone zadania wymagające większej inteligencji; |
Umieszczanie Gemini
gemini-embedding-exp |
Tekst | Wektory dystrybucyjne tekstu | Pomiar podobieństwa ciągów tekstowych |
Obraz 3
imagen-3.0-generate-002 |
Tekst | Obrazy | Nasz najbardziej zaawansowany model do generowania obrazów |
Veo 2
veo-2.0-generate-001 |
Tekst, obrazy | Wideo | generowanie filmów o wysokiej jakości; |
Gemini 2.0 Flash Live
gemini-2.0-flash-live-001 |
Dźwięk, obraz i tekst | Tekst, dźwięk | Dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami |
Limity stawek dla poszczególnych modeli możesz sprawdzić na stronie z limitami stawek.
Gemini 2.5 Flash Preview 05-20
Nasz najlepszy model pod względem stosunku ceny do wydajności, który oferuje wszechstronne możliwości. Limity szybkości Gemini 2.5 Flash są bardziej restrykcyjne, ponieważ jest to model eksperymentalny / w wersji wstępnej.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.5-flash-preview-05-20 |
Obsługiwane typy danych |
Wejścia tekst, obrazy, filmy, pliki dźwiękowe Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 65 536 |
– umiejętności |
Generowanie dźwięku Nieobsługiwane Pamięć podręczna Obsługiwane Wykonanie kodu Obsługiwane Wywoływanie funkcji Obsługiwane Generowanie obrazów Nieobsługiwane Wyszukiwanie groundingu Obsługiwane Wyjścia uporządkowane Obsługiwane Myślę Obsługiwane Dostrajanie Nieobsługiwane |
wersje |
|
Ostatnia aktualizacja | Maj 2025 r. |
Granica wiedzy | Styczeń 2025 r. |
Dźwięk natywny w Gemini 2.5 Flash
Nasze natywne modele dialogów audio z myśleniem i bez myślenia, dostępne za pomocą interfejsu Live API. Te modele zapewniają interaktywne i nieustrukturyzowane rozmowy, a także prompty dotyczące stylu i sterowania.
Wypróbuj natywny dźwięk w Google AI Studio
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.5-flash-preview-native-audio-dialog i models/gemini-2.5-flash-exp-native-audio-thinking-dialog |
Obsługiwane typy danych |
Wejścia Dźwięk, obraz, tekst Dane wyjściowe Dźwięk i tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 128 000 Limit tokenów wyjściowych 8000 |
– umiejętności |
Generowanie dźwięku Obsługiwane Pamięć podręczna Nieobsługiwane Wykonanie kodu Nieobsługiwane Wywoływanie funkcji Obsługiwane Generowanie obrazów Nieobsługiwane Wyszukiwanie groundingu Obsługiwane Wyjścia uporządkowane Nieobsługiwane Myślę Obsługiwane Dostrajanie Nieobsługiwane |
wersje |
|
Ostatnia aktualizacja | Maj 2025 r. |
Granica wiedzy | Styczeń 2025 r. |
Podgląd Zamiany tekstu na mowę w Gemini 2.5 Flash
Gemini 2.5 Flash Preview TTS to nasz model konwersji tekstu na mowę o wysokiej jakości i przystępnej cenie. Zapewnia on dużą kontrolę i przejrzystość w ramach sformalizowanych procesów, takich jak tworzenie podcastów, audiobooków czy obsługa klienta. Limity szybkości Gemini 2.5 Flash są bardziej restrykcyjne, ponieważ jest to model eksperymentalny / wstępny.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.5-flash-preview-tts |
Obsługiwane typy danych |
Wejścia Tekst Dane wyjściowe Audio |
[*] | Limity tokenów
Limit tokenów wejściowych 8000 Limit tokenów wyjściowych 16 000 |
– umiejętności |
Wyjścia uporządkowane Nieobsługiwane Pamięć podręczna Nieobsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Wykonanie kodu Nieobsługiwane Wyszukiwarka Nieobsługiwane Generowanie dźwięku Obsługiwane Live API Nieobsługiwane Myślę Nieobsługiwane |
wersje |
|
Ostatnia aktualizacja | Maj 2025 r. |
Gemini 2.5 Pro (wersja poglądowa)
Gemini 2.5 Pro to nasz najnowocześniejszy model myślenia, który potrafi rozwiązywać złożone problemy związane z kodem, matematyką i naukami ścisłymi, a także analizować duże zbiory danych, bazy kodu i dokumenty, korzystając z długiego kontekstu. W przypadku Gemini 2.5 Pro limity szybkości są bardziej restrykcyjne, ponieważ jest to model w wersji wstępnej.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | gemini-2.5-pro-preview-06-05 |
Obsługiwane typy danych |
Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 65 536 |
– umiejętności |
Wyjścia uporządkowane Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Wyszukiwanie groundingu Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Nieobsługiwane Live API Nieobsługiwane Myślę Obsługiwane |
wersje |
|
Ostatnia aktualizacja | Maj 2025 r. |
Granica wiedzy | Styczeń 2025 r. |
Podgląd Zamiany tekstu na mowę w Gemini 2.5 Pro
Gemini 2.5 Pro Preview TTS to nasz najmocniejszy model konwersji tekstu na mowę, który zapewnia dużą kontrolę i przejrzystość w ramach ustrukturyzowanych procesów, takich jak tworzenie podcastów, audiobooków, obsługa klienta itp. Limity szybkości Gemini 2.5 Pro są bardziej restrykcyjne, ponieważ jest to model eksperymentalny / wstępny.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.5-pro-preview-tts |
Obsługiwane typy danych |
Wejścia Tekst Dane wyjściowe Audio |
[*] | Limity tokenów
Limit tokenów wejściowych 8000 Limit tokenów wyjściowych 16 000 |
– umiejętności |
Wyjścia uporządkowane Nieobsługiwane Pamięć podręczna Nieobsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Wykonanie kodu Nieobsługiwane Wyszukiwarka Nieobsługiwane Generowanie dźwięku Obsługiwane Live API Nieobsługiwane Myślę Nieobsługiwane |
wersje |
|
Ostatnia aktualizacja | Maj 2025 r. |
Gemini 2.0 Flash
Gemini 2.0 Flash zapewnia funkcje nowej generacji i ulepszone możliwości, w tym większą szybkość, korzystanie z natywnego narzędzia i okno kontekstu z milionem tokenów.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.0-flash |
Obsługiwane typy danych |
Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192 |
– umiejętności |
Wyjścia uporządkowane Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Wyszukiwarka Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Nieobsługiwane Live API Obsługiwane Myślę eksperymentalna, |
wersje |
|
Ostatnia aktualizacja | Luty 2025 r. |
Granica wiedzy | Sierpień 2024 r. |
Generowanie obrazów do podglądu w Gemini 2.0 Flash
Generowanie obrazów w ramach funkcji podglądu Flash w Gemini 2.0 zapewnia ulepszone funkcje generowania obrazów, w tym generowanie i edytowanie obrazów w ramach konwersacji.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.0-flash-preview-image-generation |
Obsługiwane typy danych |
Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst i obrazy |
[*] | Limity tokenów
Limit tokenów wejściowych 32 000 Limit tokenów wyjściowych 8192 |
– umiejętności |
Wyjścia uporządkowane Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Wykonanie kodu Nieobsługiwane Wyszukiwarka Nieobsługiwane Generowanie obrazów Obsługiwane Generowanie dźwięku Nieobsługiwane Live API Nieobsługiwane Myślę Nieobsługiwane |
wersje |
gemini-2.0-flash-preview-image-generation nie jest obecnie obsługiwana w wielu krajach Europy, Bliskiego Wschodu i Afryki |
Ostatnia aktualizacja | Maj 2025 r. |
Granica wiedzy | Sierpień 2024 r. |
Gemini 2.0 Flash-Lite
Model Gemini 2.0 Flash zoptymalizowany pod kątem niskich kosztów i małej latencji.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.0-flash-lite |
Obsługiwane typy danych |
Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192 |
– umiejętności |
Wyjścia uporządkowane Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Nieobsługiwane Wyszukiwarka Nieobsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Nieobsługiwane Live API Nieobsługiwane |
wersje |
|
Ostatnia aktualizacja | Luty 2025 r. |
Granica wiedzy | Sierpień 2024 r. |
Gemini 1.5 Flash
Gemini 1.5 Flash to szybki i wszechstronny model multimodalny do skalowania w różnych zadaniach.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-1.5-flash |
Obsługiwane typy danych |
Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192 |
Specyfikacja audiowizualna |
Maksymalna liczba obrazów na prompt 3,600 Maksymalna długość filmu 1 godzina Maksymalna długość dźwięku Około 9,5 godziny |
Uprawnienia |
Instrukcje dotyczące systemu Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Obsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Live API Nieobsługiwane |
wersje |
|
Ostatnia aktualizacja | Wrzesień 2024 r. |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B to mały model przeznaczony do wykonywania zadań wymagających mniejszej inteligencji.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-1.5-flash-8b |
Obsługiwane typy danych |
Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192 |
Specyfikacja audiowizualna |
Maksymalna liczba obrazów na prompt 3,600 Maksymalna długość filmu 1 godzina Maksymalna długość dźwięku Około 9,5 godziny |
Uprawnienia |
Instrukcje dotyczące systemu Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Obsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Live API Nieobsługiwane |
wersje |
|
Ostatnia aktualizacja | Październik 2024 r. |
Gemini 1.5 Pro
Wypróbuj Gemini 2.5 Pro w wersji podglądowej, nasz najbardziej zaawansowany model Gemini do tej pory.
Gemini 1.5 Pro to średniej wielkości multimodalny model zoptymalizowany do wykonywania wielu zadań związanych z wyciąganiem wniosków. Wersja 1.5 Pro może przetwarzać duże ilości danych jednocześnie, w tym 2 godziny filmu, 19 godzin dźwięku, bazy kodu zawierające 60 tys. linii kodu lub 2000 stron tekstu.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-1.5-pro |
Obsługiwane typy danych |
Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst |
[*] | Limity tokenów
Limit tokenów wejściowych 2 097 152 Limit tokenów wyjściowych 8192 |
Specyfikacja audiowizualna |
Maksymalna liczba obrazów na prompt 7200 Maksymalna długość filmu 2 godziny Maksymalna długość dźwięku Około 19 godzin |
– umiejętności |
Instrukcje dotyczące systemu Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Live API Nieobsługiwane |
wersje |
|
Ostatnia aktualizacja | Wrzesień 2024 r. |
Imagen 3
Imagen 3 to nasz model do zamiany tekstu na grafikę najwyższej jakości, który potrafi generować obrazy o jeszcze lepszych szczegółach, bogatszym oświetleniu i mniejszej liczbie rozpraszających artefaktów niż nasze poprzednie modele.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu |
Gemini API
|
Obsługiwane typy danych |
Wejście Tekst Dane wyjściowe Obrazy |
[*] | Limity tokenów
Limit tokenów wejściowych Nie dotyczy Wyjście – obrazy Do 4 |
Ostatnia aktualizacja | Luty 2025 r. |
Veo 2
Veo 2 to nasz model do tworzenia wysokiej jakości filmów na podstawie tekstu i obrazów, który potrafi generować szczegółowe filmy, zachowując artystyczne niuanse promptów.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu |
Gemini API
|
Obsługiwane typy danych |
Wejście Tekst, obraz Dane wyjściowe Wideo |
Ograniczenia |
Tekst Nie dotyczy Wejście obrazowe dowolna rozdzielczość i współczynnik proporcji obrazu o rozmiarze do 20 MB; Film wyjściowy Do 2 |
Ostatnia aktualizacja | Kwiecień 2025 r. |
Gemini 2.0 Flash Live
Model Gemini 2.0 Flash Live współpracuje z interfejsem Live API, aby umożliwić dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami dzięki Gemini. Model może przetwarzać dane wejściowe w postaci tekstu, dźwięku i obrazu oraz generować dane wyjściowe w postaci tekstu i dźwięku.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/gemini-2.0-flash-live-001 |
Obsługiwane typy danych |
Wejścia Dźwięk, obraz i tekst Dane wyjściowe tekst i dźwięk; |
[*] | Limity tokenów
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192 |
– umiejętności |
Wyjścia uporządkowane Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Wyszukiwarka Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Obsługiwane Myślę Nieobsługiwane |
wersje |
|
Ostatnia aktualizacja | Kwiecień 2025 r. |
Granica wiedzy | Sierpień 2024 r. |
Gemini Embedding Experimental
Gemini embedding
osiąga najwyższą skuteczność w wielu kluczowych wymiarach, w tym w zakresie kodu, wielojęzyczności i wyszukiwania.
Limity szybkości umieszczania treści w Gemini są bardziej restrykcyjne, ponieważ jest to model eksperymentalny.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu |
Gemini API
|
Obsługiwane typy danych |
Wejście Tekst Dane wyjściowe Wektory dystrybucyjne tekstu |
[*] | Limity tokenów
Limit tokenów wejściowych 8192 Rozmiar wymiaru wyjściowego Elastyczne, obsługuje: 3072, 1536 lub 768 |
Ostatnia aktualizacja | Marzec 2025 r. |
Wektory dystrybucyjne tekstu
Wektory dystrybucyjne tekstu
Wypróbuj nasz nowy eksperymentalny model osadzania Gemini, który osiąga najnowocześniejsze wyniki.
Wkłady tekstowe służą do pomiaru podobieństwa ciągów znaków i są powszechnie stosowane w wielu zastosowaniach AI.
text-embedding-004
osiąga lepszą skuteczność wyszukiwania i przewyższa wyniki dotychczasowych modeli
przy porównywalnych wymiarach w ramach standardowych testów porównawczych MTEB.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu |
Gemini API
|
Obsługiwane typy danych |
Wejście Tekst Dane wyjściowe Wektory dystrybucyjne tekstu |
[*] | Limity tokenów
Limit tokenów wejściowych 2048 Rozmiar wymiaru wyjściowego 768 |
[**] | Limity oceny1500 żądań na minutę |
ustawienia bezpieczeństwa | Nieobsługiwane |
Ostatnia aktualizacja | Kwiecień 2024 r. |
Umieszczanie
Możesz użyć modelu wektorów dystrybucyjnych, aby wygenerować wektory dystrybucyjne tekstu dla tekstu wejściowego.
Model wektorów dystrybucyjnych jest zoptymalizowany pod kątem tworzenia wektorów dystrybucyjnych o 768 wymiarach w przypadku tekstu zawierającego do 2048 tokenów.
Szczegóły modelu wektora dystrybucyjnego
Właściwość | Opis |
---|---|
Kod modelu |
models/embedding-001
|
Obsługiwane typy danych |
Wejście Tekst Dane wyjściowe Wektory dystrybucyjne tekstu |
[*] | Limity tokenów
Limit tokenów wejściowych 2048 Rozmiar wymiaru wyjściowego 768 |
[**] | Limity oceny1500 żądań na minutę |
ustawienia bezpieczeństwa | Nieobsługiwane |
Ostatnia aktualizacja | Grudzień 2023 r. |
AQA
Model AQA możesz wykorzystać do wykonywania zadań związanych z przypisanym odpowiadaniem na pytania (AQA) na podstawie dokumentu, korpusie lub zbioru fragmentów. Model AQA zwraca odpowiedzi na pytania oparte na podanych źródłach wraz z oszacowaniem prawdopodobieństwa odpowiedzi.
Szczegóły modelu
Właściwość | Opis |
---|---|
Kod modelu | models/aqa |
Obsługiwane typy danych |
Wejście Tekst Dane wyjściowe Tekst |
Obsługiwany język | angielski |
[*] | Limity tokenów
Limit tokenów wejściowych 7168 Limit tokenów wyjściowych 1024 |
[**] | Limity oceny1500 żądań na minutę |
ustawienia bezpieczeństwa | Obsługiwane |
Ostatnia aktualizacja | Grudzień 2023 r. |
Aby poznać możliwości tych wariantów modeli, zapoznaj się z przykładami.
[*] Token ma około 4 znaków w przypadku modeli Gemini. 100 tokenów to około 60–80 słów po angielsku.
Wzorce nazw wersji modelu
Modele Gemini są dostępne w wersjach stabilnej, testowej i eksperymentalnej. W kodzie możesz użyć jednego z tych formatów nazwy modelu, aby określić, którego modelu i której wersji chcesz użyć.
Najnowsza stabilna
Wskazuje najnowszą stabilną wersję opublikowaną dla określonego modelu, generacji i wariantu.
Aby określić najnowszą stabilną wersję, użyj tego wzoru:
<model>-<generation>-<variation>
. Na przykład: gemini-2.0-flash
.
Stabilny
Wskazuje konkretny stabilny model. Stabilne modele zwykle się nie zmieniają. Większość aplikacji produkcyjnych powinna używać konkretnego stabilnego modelu.
Aby określić wersję stabilną, użyj tego wzoru:
<model>-<generation>-<variation>-<version>
. Na przykład:
gemini-2.0-flash-001
.
Podgląd
Wskazuje model podglądu, który może nie nadawać się do użytku produkcyjnego, może mieć bardziej restrykcyjne limity stawek, ale może mieć włączone płatności.
Aby określić wersję podglądu, użyj tego wzoru:<model>-<generation>-<variation>-<version>
. Na przykład:
gemini-2.5-pro-preview-06-05
.
Wersja eksperymentalna
Wskazuje na model eksperymentalny, który może nie być odpowiedni do użytku produkcyjnego i być objęty bardziej restrykcyjnymi limitami stawek. Udostępniamy modele eksperymentalne, aby zbierać opinie i szybko przekazywać najnowsze aktualizacje deweloperom.
Aby określić wersję eksperymentalną, użyj tego wzoru:<model>-<generation>-<variation>-<version>
. Na przykład:
gemini-2.0-pro-exp-02-05
.
Modele eksperymentalne
Oprócz stabilnych modeli Gemini API oferuje modele eksperymentalne, które mogą nie nadawać się do użytku produkcyjnego i mieć bardziej restrykcyjne limity szybkości.
Stale udostępniamy modele eksperymentalne, aby zbierać opinie, szybko przekazywać deweloperom najnowsze aktualizacje i pokazywać tempo wprowadzania innowacji w Google. Dzięki opiniom użytkowników możemy wprowadzać kolejne ulepszenia, a udostępniając wcześniej modele eksperymentalne, możemy lepiej przygotować się na ich szersze wdrożenie. Model eksperymentalny może zostać zastąpiony innym bez wcześniejszego powiadomienia. Nie możemy zagwarantować, że model eksperymentalny stanie się w przyszłości modelem stabilnym.
Wcześniejsze modele eksperymentalne
Gdy pojawiają się nowe wersje lub stabilne wydania, usuwamy eksperymentalne modele i zastępujemy je nowymi. W sekcji poniżej znajdziesz poprzednie eksperymentalne modele wraz z wersją zastępczą:
Kod modelu | Model podstawowy | Wersja zastępcza |
---|---|---|
gemini-2.5-flash-preview-04-17 |
Gemini 2.5 Flash | gemini-2.5-flash-preview-05-20 |
gemini-2.0-flash-exp-image-generation |
Gemini 2.0 Flash | gemini-2.0-flash-preview-image-generation |
gemini-2.5-pro-preview-05-06 |
Gemini 2.5 Pro (wersja poglądowa) | gemini-2.5-pro-preview-06-05 |
gemini-2.5-pro-preview-03-25 |
Gemini 2.5 Pro (wersja poglądowa) | gemini-2.5-pro-preview-05-06 |
gemini-2.0-flash-thinking-exp-01-21 |
Gemini 2.5 Flash | gemini-2.5-flash-preview-04-17 |
gemini-2.0-pro-exp-02-05 |
Gemini 2.0 Pro Experimental | gemini-2.5-pro-preview-03-25 |
gemini-2.0-flash-exp |
Gemini 2.0 Flash | gemini-2.0-flash |
gemini-exp-1206 |
Gemini 2.0 Pro | gemini-2.0-pro-exp-02-05 |
gemini-2.0-flash-thinking-exp-1219 |
Gemini 2.0 Flash Thinking | gemini-2.0-flash-thinking-exp-01-21 |
gemini-exp-1121 |
Gemini | gemini-exp-1206 |
gemini-exp-1114 |
Gemini | gemini-exp-1206 |
gemini-1.5-pro-exp-0827 |
Gemini 1.5 Pro | gemini-exp-1206 |
gemini-1.5-pro-exp-0801 |
Gemini 1.5 Pro | gemini-exp-1206 |
gemini-1.5-flash-8b-exp-0924 |
Gemini 1.5 Flash-8B | gemini-1.5-flash-8b |
gemini-1.5-flash-8b-exp-0827 |
Gemini 1.5 Flash-8B | gemini-1.5-flash-8b |
Obsługiwane języki
Modele Gemini są trenowane pod kątem tych języków:
- arabski (
ar
), - bengali (
bn
) - bułgarski (
bg
), - chiński uproszczony i tradycyjny (
zh
), - Chorwacki (
hr
) - czeski (
cs
) - duński (
da
), - Holenderski (
nl
) - Angielski (
en
) - estoński (
et
), - fiński (
fi
), - Francuski (
fr
) - Niemiecki (
de
) - grecki (
el
), - hebrajski (
iw
), - hindi (
hi
), - węgierski (
hu
), - indonezyjski (
id
), - włoski (
it
), - japoński (
ja
) - koreański (
ko
), - łotewski (
lv
), - litewski (
lt
) - norweski (
no
), - Polski (
pl
) - portugalski (
pt
), - rumuński (
ro
) - Rosyjski (
ru
) - serbski (
sr
) - słowacki (
sk
) - słoweński (
sl
), - hiszpański (
es
), - suahili (
sw
), - szwedzki (
sv
) - tajski (
th
), - turecki (
tr
), - ukraiński (
uk
) - wietnamski (
vi
)