AI žetoni so najmanjša enota, ki jo Veliki Jezikovni Modeli (LLM) uporabljajo za obdelavo besedila. Za razliko od števila znakov se štetje žetonov razlikuje glede na jezik in model.
Definicija Žetona
Žetoni so enote besed, deli besed, ločila ali simboli. V angleščini je "Hello" = 1 žeton; v japonščini je "こんにちは" = običajno 2-3 žetoni. Presledki in prelomi vrstic se tudi štejejo kot žetoni.
Razlika Med Žetoni in Znaki
Angleščina: ~4 znaki = 1 žeton, Japonščina: ~1,5-2 znaka = 1 žeton, Koda: se razlikuje glede na sintakso. Primer: "Hello World" (11 znakov) = 2 žetona, "こんにちは世界" (7 znakov) = 4-5 žetonov.
Zakaj je Število Žetonov Pomembno
Cene AI API temeljijo na številu žetonov (npr. GPT-4: 0,03 $ na 1000 žetonov). Vsak model ima omejitve žetonov (GPT-4 8K = 8192 žetonov), njihovo preseganje pa povzroči napake. Razumevanje števila žetonov je bistveno za učinkovito zasnovo pozivov.
Omejitve Žetonov po Glavnih AI Modelih
GPT-4 (8K): 8.192 žetonov, GPT-4 (32K): 32.768 žetonov, GPT-4 Turbo: 128.000 žetonov, GPT-3.5 Turbo: 16.385 žetonov, Claude 3: 200.000 žetonov, Gemini Pro: 32.768 žetonov, Gemini Ultra: 100.000 žetonov (načrtovano).
Primerjava Cen po Glavnih AI Modelih
GPT-4: vhod 0,03 $/1K, izhod 0,06 $/1K, GPT-4 Turbo: vhod 0,01 $/1K, izhod 0,03 $/1K, GPT-3.5 Turbo: vhod 0,0005 $/1K, izhod 0,0015 $/1K, Claude 3 Opus: vhod 0,015 $/1K, izhod 0,075 $/1K, Claude 3 Sonnet: vhod 0,003 $/1K, izhod 0,015 $/1K, Gemini Pro: brezplačna raven na voljo (glejte uradno dokumentacijo).
Kako Deluje Tokenizacija
AI modeli razdelijo besedilo na žetone z algoritmi, kot sta BPE (Byte Pair Encoding) ali WordPiece. Pogoste besede postanejo 1 žeton; redke besede se razdelijo na več žetonov. Emoji in posebni znaki so lahko več žetonov na znak.
Vhodni Žetoni vs Izhodni Žetoni
AI API-ji različno zaračunavajo vhod (pozive) in izhod (generirano besedilo). Izhodni žetoni so običajno dražji (npr. GPT-4 izhod stane 2-krat več kot vhod). Za optimizacijo stroškov omejite izhodne žetone z uporabo parametra max_tokens.
Natančnost Tega Orodja
To orodje simulira uradne tokenizatorje za vsak model, vendar ne jamči popolne natančnosti. Za natančno število žetonov uporabite uradna orodja (OpenAI-jev tiktoken, Anthropic-ov Claude Tokenizer itd.). Zagotavlja zadostno natančnost za namene ocenjevanja.