Ta strona została przetłumaczona przez Cloud Translation API.

Modele Gemini

2.5 Pro

Nasz najbardziej zaawansowany model myślący o maksymalnej dokładności odpowiedzi i najnowocześniejszej wydajności

Wprowadzanie dźwięku, obrazów, wideo i tekstu oraz otrzymywanie odpowiedzi tekstowych
Rozwiązywanie trudnych problemów, analizowanie dużych baz danych i wiele więcej
Najlepszy do złożonego kodowania, rozumowania i rozumienia multimodalnego

2.5 Flash

Nasz najlepszy model pod względem stosunku ceny do wydajności, oferujący wszechstronne możliwości.

Wprowadzać dźwięk, obrazy, filmy i tekst oraz otrzymywać odpowiedzi tekstowe
Model myśli w miarę potrzeby lub możesz skonfigurować budżet na myślenie.
Najlepiej sprawdza się w przypadku zadań o dużym natężeniu wymagających zastanowienia i niskiego opóźnienia

2.0 Flash

Nasz najnowszy model multimodalny z funkcjami nowej generacji i ulepszonymi możliwościami

Wprowadzanie dźwięku, obrazów, wideo i tekstu oraz otrzymywanie odpowiedzi tekstowych
generować kod i obrazy, wyodrębniać dane, analizować pliki, generować wykresy itp.
Niski poziom opóźnień, ulepszona wydajność, obsługa funkcji agenta

Warianty modelu

Gemini API udostępnia różne modele zoptymalizowane pod kątem konkretnych zastosowań. Oto krótkie omówienie dostępnych wariantów Gemini:

Wariant modelu	Dane wejściowe	Wyniki	Zoptymalizowany dla
Gemini 2.5 Flash Preview 05-20 `gemini-2.5-flash-preview-05-20`	Dźwięk, obrazy, filmy i tekst	Tekst	Elastyczne myślenie, opłacalność
Gemini 2.5 Flash Native Audio `gemini-2.5-flash-preview-native-audio-dialog` & `gemini-2.5-flash-exp-native-audio-thinking-dialog`	Dźwięk, filmy i tekst	Tekst i dźwięk, przeplatane	wysokiej jakości dźwięk z naturalnym brzmieniem rozmów z opcją włączenia lub wyłączenia funkcji myślenia;
Gemini 2.5 Flash Preview TTS `gemini-2.5-flash-preview-tts`	Tekst	Audio	generowanie dźwięku z zawartością tekstową w jednym lub wielu głośnikach z niskim opóźnieniem i możliwością kontroli;
Podgląd Gemini 2.5 Pro `gemini-2.5-pro-preview-06-05`	Dźwięk, obrazy, filmy i tekst	Tekst	Ulepszone myślenie i rozumowanie, zrozumienie multimodalne, zaawansowane kodowanie i inne funkcje
Gemini 2.5 Pro podgląd TTS `gemini-2.5-pro-preview-tts`	Tekst	Audio	generowanie dźwięku z zawartością tekstową w jednym lub wielu głośnikach z niskim opóźnieniem i możliwością kontroli;
Gemini 2.0 Flash `gemini-2.0-flash`	Dźwięk, obrazy, filmy i tekst	Tekst	Funkcje nowej generacji, szybkość, myślenie i transmisje w czasie rzeczywistym.
Generowanie obrazów w ramach Gemini 2.0 Flash Preview `gemini-2.0-flash-preview-image-generation`	Dźwięk, obrazy, filmy i tekst	Tekst, obrazy	Generowanie i edytowanie obrazów w trybie konwersacyjnym
Gemini 2.0 Flash-Lite `gemini-2.0-flash-lite`	Dźwięk, obrazy, filmy i tekst	Tekst	Opłacalność i niskie opóźnienie
Gemini 1.5 Flash `gemini-1.5-flash`	Dźwięk, obrazy, filmy i tekst	Tekst	szybkie i wszechstronne działanie w różnych zastosowaniach;
Gemini 1.5 Flash-8B `gemini-1.5-flash-8b`	Dźwięk, obrazy, filmy i tekst	Tekst	Zadania o dużej liczbie i mniejszym zaawansowaniu
Gemini 1.5 Pro `gemini-1.5-pro`	Dźwięk, obrazy, filmy i tekst	Tekst	złożone zadania wymagające większej inteligencji;
Umieszczanie Gemini `gemini-embedding-exp`	Tekst	Wektory dystrybucyjne tekstu	Pomiar podobieństwa ciągów tekstowych
Obraz 3 `imagen-3.0-generate-002`	Tekst	Obrazy	Nasz najbardziej zaawansowany model do generowania obrazów
Veo 2 `veo-2.0-generate-001`	Tekst, obrazy	Wideo	generowanie filmów o wysokiej jakości;
Gemini 2.0 Flash Live `gemini-2.0-flash-live-001`	Dźwięk, obraz i tekst	Tekst, dźwięk	Dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami

Limity stawek dla poszczególnych modeli możesz sprawdzić na stronie z limitami stawek.

Gemini 2.5 Flash Preview 05-20

Nasz najlepszy model pod względem stosunku ceny do wydajności, który oferuje wszechstronne możliwości. Limity szybkości Gemini 2.5 Flash są bardziej restrykcyjne, ponieważ jest to model eksperymentalny / w wersji wstępnej.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.5-flash-preview-05-20`
Obsługiwane typy danych	Wejścia tekst, obrazy, filmy, pliki dźwiękowe Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 65 536
– umiejętności	Generowanie dźwięku Nieobsługiwane Pamięć podręczna Obsługiwane Wykonanie kodu Obsługiwane Wywoływanie funkcji Obsługiwane Generowanie obrazów Nieobsługiwane Wyszukiwanie groundingu Obsługiwane Wyjścia uporządkowane Obsługiwane Myślę Obsługiwane Dostrajanie Nieobsługiwane
wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Podgląd: `gemini-2.5-flash-preview-05-20`
Ostatnia aktualizacja	Maj 2025 r.
Granica wiedzy	Styczeń 2025 r.

Dźwięk natywny w Gemini 2.5 Flash

Nasze natywne modele dialogów audio z myśleniem i bez myślenia, dostępne za pomocą interfejsu Live API. Te modele zapewniają interaktywne i nieustrukturyzowane rozmowy, a także prompty dotyczące stylu i sterowania.

Wypróbuj natywny dźwięk w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.5-flash-preview-native-audio-dialog` i `models/gemini-2.5-flash-exp-native-audio-thinking-dialog`
Obsługiwane typy danych	Wejścia Dźwięk, obraz, tekst Dane wyjściowe Dźwięk i tekst
Limity tokenów^[*]	Limit tokenów wejściowych 128 000 Limit tokenów wyjściowych 8000
– umiejętności	Generowanie dźwięku Obsługiwane Pamięć podręczna Nieobsługiwane Wykonanie kodu Nieobsługiwane Wywoływanie funkcji Obsługiwane Generowanie obrazów Nieobsługiwane Wyszukiwanie groundingu Obsługiwane Wyjścia uporządkowane Nieobsługiwane Myślę Obsługiwane Dostrajanie Nieobsługiwane
wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Podgląd: `gemini-2.5-flash-preview-05-20` Experimental: `gemini-2.5-flash-exp-native-audio-thinking-dialog`
Ostatnia aktualizacja	Maj 2025 r.
Granica wiedzy	Styczeń 2025 r.

Podgląd Zamiany tekstu na mowę w Gemini 2.5 Flash

Gemini 2.5 Flash Preview TTS to nasz model konwersji tekstu na mowę o wysokiej jakości i przystępnej cenie. Zapewnia on dużą kontrolę i przejrzystość w ramach sformalizowanych procesów, takich jak tworzenie podcastów, audiobooków czy obsługa klienta. Limity szybkości Gemini 2.5 Flash są bardziej restrykcyjne, ponieważ jest to model eksperymentalny / wstępny.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.5-flash-preview-tts`
Obsługiwane typy danych	Wejścia Tekst Dane wyjściowe Audio
Limity tokenów^[*]	Limit tokenów wejściowych 8000 Limit tokenów wyjściowych 16 000
– umiejętności	Wyjścia uporządkowane Nieobsługiwane Pamięć podręczna Nieobsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Wykonanie kodu Nieobsługiwane Wyszukiwarka Nieobsługiwane Generowanie dźwięku Obsługiwane Live API Nieobsługiwane Myślę Nieobsługiwane
wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. `gemini-2.5-flash-preview-tts`
Ostatnia aktualizacja	Maj 2025 r.

Gemini 2.5 Pro (wersja poglądowa)

Gemini 2.5 Pro to nasz najnowocześniejszy model myślenia, który potrafi rozwiązywać złożone problemy związane z kodem, matematyką i naukami ścisłymi, a także analizować duże zbiory danych, bazy kodu i dokumenty, korzystając z długiego kontekstu. W przypadku Gemini 2.5 Pro limity szybkości są bardziej restrykcyjne, ponieważ jest to model w wersji wstępnej.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`gemini-2.5-pro-preview-06-05`
Obsługiwane typy danych	Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 65 536
– umiejętności	Wyjścia uporządkowane Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Wyszukiwanie groundingu Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Nieobsługiwane Live API Nieobsługiwane Myślę Obsługiwane
wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. `gemini-2.5-pro-preview-06-05`
Ostatnia aktualizacja	Maj 2025 r.
Granica wiedzy	Styczeń 2025 r.

Podgląd Zamiany tekstu na mowę w Gemini 2.5 Pro

Gemini 2.5 Pro Preview TTS to nasz najmocniejszy model konwersji tekstu na mowę, który zapewnia dużą kontrolę i przejrzystość w ramach ustrukturyzowanych procesów, takich jak tworzenie podcastów, audiobooków, obsługa klienta itp. Limity szybkości Gemini 2.5 Pro są bardziej restrykcyjne, ponieważ jest to model eksperymentalny / wstępny.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.5-pro-preview-tts`
Obsługiwane typy danych	Wejścia Tekst Dane wyjściowe Audio
Limity tokenów^[*]	Limit tokenów wejściowych 8000 Limit tokenów wyjściowych 16 000
– umiejętności	Wyjścia uporządkowane Nieobsługiwane Pamięć podręczna Nieobsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Wykonanie kodu Nieobsługiwane Wyszukiwarka Nieobsługiwane Generowanie dźwięku Obsługiwane Live API Nieobsługiwane Myślę Nieobsługiwane
wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. `gemini-2.5-pro-preview-tts`
Ostatnia aktualizacja	Maj 2025 r.

Gemini 2.0 Flash

Gemini 2.0 Flash zapewnia funkcje nowej generacji i ulepszone możliwości, w tym większą szybkość, korzystanie z natywnego narzędzia i okno kontekstu z milionem tokenów.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.0-flash`
Obsługiwane typy danych	Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
– umiejętności	Wyjścia uporządkowane Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Wyszukiwarka Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Nieobsługiwane Live API Obsługiwane Myślę eksperymentalna,
wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Najnowsze: `gemini-2.0-flash` Stabilny: `gemini-2.0-flash-001` Experimental: `gemini-2.0-flash-exp`
Ostatnia aktualizacja	Luty 2025 r.
Granica wiedzy	Sierpień 2024 r.

Generowanie obrazów do podglądu w Gemini 2.0 Flash

Generowanie obrazów w ramach funkcji podglądu Flash w Gemini 2.0 zapewnia ulepszone funkcje generowania obrazów, w tym generowanie i edytowanie obrazów w ramach konwersacji.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.0-flash-preview-image-generation`
Obsługiwane typy danych	Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst i obrazy
Limity tokenów^[*]	Limit tokenów wejściowych 32 000 Limit tokenów wyjściowych 8192
– umiejętności	Wyjścia uporządkowane Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Wykonanie kodu Nieobsługiwane Wyszukiwarka Nieobsługiwane Generowanie obrazów Obsługiwane Generowanie dźwięku Nieobsługiwane Live API Nieobsługiwane Myślę Nieobsługiwane
wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Podgląd: `gemini-2.0-flash-preview-image-generation` gemini-2.0-flash-preview-image-generation nie jest obecnie obsługiwana w wielu krajach Europy, Bliskiego Wschodu i Afryki
Ostatnia aktualizacja	Maj 2025 r.
Granica wiedzy	Sierpień 2024 r.

Gemini 2.0 Flash-Lite

Model Gemini 2.0 Flash zoptymalizowany pod kątem niskich kosztów i małej latencji.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.0-flash-lite`
Obsługiwane typy danych	Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
– umiejętności	Wyjścia uporządkowane Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Nieobsługiwane Wyszukiwarka Nieobsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Nieobsługiwane Live API Nieobsługiwane
wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Najnowsze: `gemini-2.0-flash-lite` Stabilny: `gemini-2.0-flash-lite-001`
Ostatnia aktualizacja	Luty 2025 r.
Granica wiedzy	Sierpień 2024 r.

Gemini 1.5 Flash

Gemini 1.5 Flash to szybki i wszechstronny model multimodalny do skalowania w różnych zadaniach.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-1.5-flash`
Obsługiwane typy danych	Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
Specyfikacja audiowizualna	Maksymalna liczba obrazów na prompt 3,600 Maksymalna długość filmu 1 godzina Maksymalna długość dźwięku Około 9,5 godziny
Uprawnienia	Instrukcje dotyczące systemu Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Obsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Live API Nieobsługiwane
wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Najnowsze: `gemini-1.5-flash-latest` Najnowsza stabilna wersja: `gemini-1.5-flash` Stabilny: `gemini-1.5-flash-001` `gemini-1.5-flash-002`
Ostatnia aktualizacja	Wrzesień 2024 r.

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B to mały model przeznaczony do wykonywania zadań wymagających mniejszej inteligencji.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-1.5-flash-8b`
Obsługiwane typy danych	Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
Specyfikacja audiowizualna	Maksymalna liczba obrazów na prompt 3,600 Maksymalna długość filmu 1 godzina Maksymalna długość dźwięku Około 9,5 godziny
Uprawnienia	Instrukcje dotyczące systemu Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Obsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Live API Nieobsługiwane
wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Najnowsze: `gemini-1.5-flash-8b-latest` Najnowsza stabilna wersja: `gemini-1.5-flash-8b` Stabilny: `gemini-1.5-flash-8b-001`
Ostatnia aktualizacja	Październik 2024 r.

Gemini 1.5 Pro

Wypróbuj Gemini 2.5 Pro w wersji podglądowej, nasz najbardziej zaawansowany model Gemini do tej pory.

Gemini 1.5 Pro to średniej wielkości multimodalny model zoptymalizowany do wykonywania wielu zadań związanych z wyciąganiem wniosków. Wersja 1.5 Pro może przetwarzać duże ilości danych jednocześnie, w tym 2 godziny filmu, 19 godzin dźwięku, bazy kodu zawierające 60 tys. linii kodu lub 2000 stron tekstu.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-1.5-pro`
Obsługiwane typy danych	Wejścia Dźwięk, obraz, film i tekst Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 2 097 152 Limit tokenów wyjściowych 8192
Specyfikacja audiowizualna	Maksymalna liczba obrazów na prompt 7200 Maksymalna długość filmu 2 godziny Maksymalna długość dźwięku Około 19 godzin
– umiejętności	Instrukcje dotyczące systemu Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa Obsługiwane Pamięć podręczna Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Live API Nieobsługiwane
wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Najnowsze: `gemini-1.5-pro-latest` Najnowsza stabilna wersja: `gemini-1.5-pro` Stabilny: `gemini-1.5-pro-001` `gemini-1.5-pro-002`
Ostatnia aktualizacja	Wrzesień 2024 r.

Imagen 3

Imagen 3 to nasz model do zamiany tekstu na grafikę najwyższej jakości, który potrafi generować obrazy o jeszcze lepszych szczegółach, bogatszym oświetleniu i mniejszej liczbie rozpraszających artefaktów niż nasze poprzednie modele.

Szczegóły modelu

Właściwość	Opis
Kod modelu	Gemini API `imagen-3.0-generate-002`
Obsługiwane typy danych	Wejście Tekst Dane wyjściowe Obrazy
Limity tokenów^[*]	Limit tokenów wejściowych Nie dotyczy Wyjście – obrazy Do 4
Ostatnia aktualizacja	Luty 2025 r.

Veo 2

Veo 2 to nasz model do tworzenia wysokiej jakości filmów na podstawie tekstu i obrazów, który potrafi generować szczegółowe filmy, zachowując artystyczne niuanse promptów.

Szczegóły modelu

Właściwość	Opis
Kod modelu	Gemini API `veo-2.0-generate-001`
Obsługiwane typy danych	Wejście Tekst, obraz Dane wyjściowe Wideo
Ograniczenia	Tekst Nie dotyczy Wejście obrazowe dowolna rozdzielczość i współczynnik proporcji obrazu o rozmiarze do 20 MB; Film wyjściowy Do 2
Ostatnia aktualizacja	Kwiecień 2025 r.

Gemini 2.0 Flash Live

Model Gemini 2.0 Flash Live współpracuje z interfejsem Live API, aby umożliwić dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami dzięki Gemini. Model może przetwarzać dane wejściowe w postaci tekstu, dźwięku i obrazu oraz generować dane wyjściowe w postaci tekstu i dźwięku.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.0-flash-live-001`
Obsługiwane typy danych	Wejścia Dźwięk, obraz i tekst Dane wyjściowe tekst i dźwięk;
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
– umiejętności	Wyjścia uporządkowane Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Wyszukiwarka Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Obsługiwane Myślę Nieobsługiwane
wersje	Aby dowiedzieć się więcej, zapoznaj się z wzorami wersji modelu. Podgląd: `gemini-2.0-flash-live-001`
Ostatnia aktualizacja	Kwiecień 2025 r.
Granica wiedzy	Sierpień 2024 r.

Gemini Embedding Experimental

Gemini embedding osiąga najwyższą skuteczność w wielu kluczowych wymiarach, w tym w zakresie kodu, wielojęzyczności i wyszukiwania. Limity szybkości umieszczania treści w Gemini są bardziej restrykcyjne, ponieważ jest to model eksperymentalny.

Szczegóły modelu

Właściwość	Opis
Kod modelu	Gemini API `gemini-embedding-exp-03-07`
Obsługiwane typy danych	Wejście Tekst Dane wyjściowe Wektory dystrybucyjne tekstu
Limity tokenów^[*]	Limit tokenów wejściowych 8192 Rozmiar wymiaru wyjściowego Elastyczne, obsługuje: 3072, 1536 lub 768
Ostatnia aktualizacja	Marzec 2025 r.

Wektory dystrybucyjne tekstu

Wypróbuj nasz nowy eksperymentalny model osadzania Gemini, który osiąga najnowocześniejsze wyniki.

Wkłady tekstowe służą do pomiaru podobieństwa ciągów znaków i są powszechnie stosowane w wielu zastosowaniach AI.

text-embedding-004 osiąga lepszą skuteczność wyszukiwania i przewyższa wyniki dotychczasowych modeli przy porównywalnych wymiarach w ramach standardowych testów porównawczych MTEB.

Szczegóły modelu

Właściwość	Opis
Kod modelu	Gemini API `models/text-embedding-004`
Obsługiwane typy danych	Wejście Tekst Dane wyjściowe Wektory dystrybucyjne tekstu
Limity tokenów^[*]	Limit tokenów wejściowych 2048 Rozmiar wymiaru wyjściowego 768
Limity oceny^[**]	1500 żądań na minutę
ustawienia bezpieczeństwa	Nieobsługiwane
Ostatnia aktualizacja	Kwiecień 2024 r.

Umieszczanie

Możesz użyć modelu wektorów dystrybucyjnych, aby wygenerować wektory dystrybucyjne tekstu dla tekstu wejściowego.

Model wektorów dystrybucyjnych jest zoptymalizowany pod kątem tworzenia wektorów dystrybucyjnych o 768 wymiarach w przypadku tekstu zawierającego do 2048 tokenów.

Szczegóły modelu wektora dystrybucyjnego

Właściwość	Opis
Kod modelu	`models/embedding-001`
Obsługiwane typy danych	Wejście Tekst Dane wyjściowe Wektory dystrybucyjne tekstu
Limity tokenów^[*]	Limit tokenów wejściowych 2048 Rozmiar wymiaru wyjściowego 768
Limity oceny^[**]	1500 żądań na minutę
ustawienia bezpieczeństwa	Nieobsługiwane
Ostatnia aktualizacja	Grudzień 2023 r.

AQA

Model AQA możesz wykorzystać do wykonywania zadań związanych z przypisanym odpowiadaniem na pytania (AQA) na podstawie dokumentu, korpusie lub zbioru fragmentów. Model AQA zwraca odpowiedzi na pytania oparte na podanych źródłach wraz z oszacowaniem prawdopodobieństwa odpowiedzi.

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/aqa`
Obsługiwane typy danych	Wejście Tekst Dane wyjściowe Tekst
Obsługiwany język	angielski
Limity tokenów^[*]	Limit tokenów wejściowych 7168 Limit tokenów wyjściowych 1024
Limity oceny^[**]	1500 żądań na minutę
ustawienia bezpieczeństwa	Obsługiwane
Ostatnia aktualizacja	Grudzień 2023 r.

Aby poznać możliwości tych wariantów modeli, zapoznaj się z przykładami.

[*] Token ma około 4 znaków w przypadku modeli Gemini. 100 tokenów to około 60–80 słów po angielsku.

Wzorce nazw wersji modelu

Modele Gemini są dostępne w wersjach stabilnej, testowej i eksperymentalnej. W kodzie możesz użyć jednego z tych formatów nazwy modelu, aby określić, którego modelu i której wersji chcesz użyć.

Najnowsza stabilna

Wskazuje najnowszą stabilną wersję opublikowaną dla określonego modelu, generacji i wariantu.

Aby określić najnowszą stabilną wersję, użyj tego wzoru: <model>-<generation>-<variation>. Na przykład: gemini-2.0-flash.

Stabilny

Wskazuje konkretny stabilny model. Stabilne modele zwykle się nie zmieniają. Większość aplikacji produkcyjnych powinna używać konkretnego stabilnego modelu.

Aby określić wersję stabilną, użyj tego wzoru: <model>-<generation>-<variation>-<version>. Na przykład: gemini-2.0-flash-001.

Podgląd

Wskazuje model podglądu, który może nie nadawać się do użytku produkcyjnego, może mieć bardziej restrykcyjne limity stawek, ale może mieć włączone płatności.

Aby określić wersję podglądu, użyj tego wzoru:<model>-<generation>-<variation>-<version>. Na przykład: gemini-2.5-pro-preview-06-05.

Wersja eksperymentalna

Wskazuje na model eksperymentalny, który może nie być odpowiedni do użytku produkcyjnego i być objęty bardziej restrykcyjnymi limitami stawek. Udostępniamy modele eksperymentalne, aby zbierać opinie i szybko przekazywać najnowsze aktualizacje deweloperom.

Aby określić wersję eksperymentalną, użyj tego wzoru:<model>-<generation>-<variation>-<version>. Na przykład: gemini-2.0-pro-exp-02-05.

Modele eksperymentalne

Oprócz stabilnych modeli Gemini API oferuje modele eksperymentalne, które mogą nie nadawać się do użytku produkcyjnego i mieć bardziej restrykcyjne limity szybkości.

Stale udostępniamy modele eksperymentalne, aby zbierać opinie, szybko przekazywać deweloperom najnowsze aktualizacje i pokazywać tempo wprowadzania innowacji w Google. Dzięki opiniom użytkowników możemy wprowadzać kolejne ulepszenia, a udostępniając wcześniej modele eksperymentalne, możemy lepiej przygotować się na ich szersze wdrożenie. Model eksperymentalny może zostać zastąpiony innym bez wcześniejszego powiadomienia. Nie możemy zagwarantować, że model eksperymentalny stanie się w przyszłości modelem stabilnym.

Wcześniejsze modele eksperymentalne

Gdy pojawiają się nowe wersje lub stabilne wydania, usuwamy eksperymentalne modele i zastępujemy je nowymi. W sekcji poniżej znajdziesz poprzednie eksperymentalne modele wraz z wersją zastępczą:

Kod modelu	Model podstawowy	Wersja zastępcza
`gemini-2.5-flash-preview-04-17`	Gemini 2.5 Flash	`gemini-2.5-flash-preview-05-20`
`gemini-2.0-flash-exp-image-generation`	Gemini 2.0 Flash	`gemini-2.0-flash-preview-image-generation`
`gemini-2.5-pro-preview-05-06`	Gemini 2.5 Pro (wersja poglądowa)	`gemini-2.5-pro-preview-06-05`
`gemini-2.5-pro-preview-03-25`	Gemini 2.5 Pro (wersja poglądowa)	`gemini-2.5-pro-preview-05-06`
`gemini-2.0-flash-thinking-exp-01-21`	Gemini 2.5 Flash	`gemini-2.5-flash-preview-04-17`
`gemini-2.0-pro-exp-02-05`	Gemini 2.0 Pro Experimental	`gemini-2.5-pro-preview-03-25`
`gemini-2.0-flash-exp`	Gemini 2.0 Flash	`gemini-2.0-flash`
`gemini-exp-1206`	Gemini 2.0 Pro	`gemini-2.0-pro-exp-02-05`
`gemini-2.0-flash-thinking-exp-1219`	Gemini 2.0 Flash Thinking	`gemini-2.0-flash-thinking-exp-01-21`
`gemini-exp-1121`	Gemini	`gemini-exp-1206`
`gemini-exp-1114`	Gemini	`gemini-exp-1206`
`gemini-1.5-pro-exp-0827`	Gemini 1.5 Pro	`gemini-exp-1206`
`gemini-1.5-pro-exp-0801`	Gemini 1.5 Pro	`gemini-exp-1206`
`gemini-1.5-flash-8b-exp-0924`	Gemini 1.5 Flash-8B	`gemini-1.5-flash-8b`
`gemini-1.5-flash-8b-exp-0827`	Gemini 1.5 Flash-8B	`gemini-1.5-flash-8b`

Obsługiwane języki

Modele Gemini są trenowane pod kątem tych języków:

arabski (ar),
bengali (bn)
bułgarski (bg),
chiński uproszczony i tradycyjny (zh),
Chorwacki (hr)
czeski (cs)
duński (da),
Holenderski (nl)
Angielski (en)
estoński (et),
fiński (fi),
Francuski (fr)
Niemiecki (de)
grecki (el),
hebrajski (iw),
hindi (hi),
węgierski (hu),
indonezyjski (id),
włoski (it),
japoński (ja)
koreański (ko),
łotewski (lv),
litewski (lt)
norweski (no),
Polski (pl)
portugalski (pt),
rumuński (ro)
Rosyjski (ru)
serbski (sr)
słowacki (sk)
słoweński (sl),
hiszpański (es),
suahili (sw),
szwedzki (sv)
tajski (th),
turecki (tr),
ukraiński (uk)
wietnamski (vi)