Токени AI - це найменша одиниця, що використовується великими мовними моделями (LLM) для обробки тексту. На відміну від кількості символів, підрахунок токенів відрізняється залежно від мови та моделі.
Визначення токена
Токени - це одиниці слів, частин слів, пунктуації або символів. В англійській мові "Hello" = 1 токен; в японській "こんにちは" = зазвичай 2-3 токени. Пробіли та переноси рядків також вважаються токенами.
Різниця між токенами та символами
Англійська: ~4 символи = 1 токен, японська: ~1,5-2 символи = 1 токен, код: відрізняється залежно від синтаксису. Приклад: "Hello World" (11 символів) = 2 токени, "こんにちは世界" (7 символів) = 4-5 токенів.
Чому важлива кількість токенів
Ціноутворення API AI базується на кількості токенів (наприклад, GPT-4: $0.03 за 1000 токенів). Кожна модель має ліміти токенів (GPT-4 8K = 8192 токени), і перевищення призводить до помилок. Розуміння кількості токенів є необхідним для ефективного проектування промптів.
Ліміти токенів основних моделей AI
GPT-4 (8K): 8192 токени, GPT-4 (32K): 32 768 токенів, GPT-4 Turbo: 128 000 токенів, GPT-3.5 Turbo: 16 385 токенів, Claude 3: 200 000 токенів, Gemini Pro: 32 768 токенів, Gemini Ultra: 100 000 токенів (планується).
Порівняння цін основних моделей AI
GPT-4: вхід $0.03/1K, вихід $0.06/1K, GPT-4 Turbo: вхід $0.01/1K, вихід $0.03/1K, GPT-3.5 Turbo: вхід $0.0005/1K, вихід $0.0015/1K, Claude 3 Opus: вхід $0.015/1K, вихід $0.075/1K, Claude 3 Sonnet: вхід $0.003/1K, вихід $0.015/1K, Gemini Pro: доступний безкоштовний рівень (див. офіційну документацію).
Як працює токенізація
Моделі AI розділяють текст на токени за допомогою алгоритмів, таких як BPE (Byte Pair Encoding) або WordPiece. Поширені слова стають 1 токеном; рідкісні слова розділяються на кілька токенів. Емодзі та спеціальні символи можуть бути кількома токенами на символ.
Вхідні токени проти вихідних токенів
API AI стягують різну плату за вхід (промпти) та вихід (згенерований текст). Вихідні токени зазвичай дорожчі (наприклад, вихід GPT-4 коштує в 2 рази дорожче входу). Для оптимізації витрат обмежте вихідні токени за допомогою параметра max_tokens.
Точність цього інструменту
Цей інструмент імітує офіційні токенізатори для кожної моделі, але не гарантує ідеальну точність. Для точного підрахунку токенів використовуйте офіційні інструменти (tiktoken від OpenAI, Claude Tokenizer від Anthropic тощо). Забезпечує достатню точність для оціночних цілей.