LLM, токены, температуры — что это за магия, но человеческим языком

18/05/2025Курсы и уроки, Промпты

Большинство объяснений про LLM звучат так, будто вы случайно открыли учебник по лингвистике, статистике и программированию — одновременно. Но на самом деле, чтобы понимать, как работает ИИ вроде ChatGPT, не нужно быть инженером. Достаточно представить, что перед вами очень сообразительный попугай, который отлично угадывает, что вы хотели бы услышать дальше. Давайте разберёмся, что внутри этой магии — по-простому.

LLM: не больно и не страшно

LLM — это Large Language Model, то есть большая языковая модель. Большая — потому что прочитала полинтернета. Языковая — потому что работает со словами. Модель — потому что строит предположения, какой ответ подойдёт в данном контексте.

Она не «знает» ничего в привычном смысле. Она не читала «Мастера и Маргариту» в дождливый вечер и не плакала над ним. Она просто встречала похожие тексты тысячи раз и умеет предсказывать, какое слово будет следующим — как очень усидчивый предсказатель автозамены.

Мысленно уберите из фразы слово «интеллект» и добавьте «статистический угадыватель» — и сразу становится проще.

Токены: ломаем слова, чтобы собрать предложение

Токен — это не слово. И не буква. Это кусочек текста. Например, слово «котик» может быть одним токеном, а слово «нейросеточка» может быть разбито на два или три.

Почему это важно? Потому что LLM работает с токенами — не с образами, не с мыслями, а именно с этими текстовыми обломками. Она получает на вход токены, смотрит на них как на комбинации чисел и выдает новый токен, который с точки зрения статистики туда хорошо вписывается.

Чем больше токенов в запросе и ответе, тем дороже и медленнее становится генерация. Это как такси: платите не только за поездку, но и за багаж.

Температура: жарко — значит случайно

Температура — это параметр, который управляет тем, насколько ИИ будет… креативен.

Если совсем просто:

Температура 0 — ИИ будет суперпредсказуемым. Отвечает чётко, без полётов фантазии. Подходит для инструкций, программирования, формальных документов.
Температура 1 — включается легкое вдохновение. Ответы разнообразнее, может предложить что-то неожиданное.
Температура 2 и выше — начинается поэзия в стиле «я сегодня в ударе». Метафоры, сюр, оторванные ассоциации. Хорошо, если вы пишете сказку или ищете безумные идеи. Не очень, если генерите договор аренды.

Важно: высокая температура — это не «лучше». Это просто более случайно.

А где всё это происходит?

Когда вы пишете промт, ваш текст превращается в токены и уходит на сервер, где его обрабатывает языковая модель. Модель смотрит на каждый токен и выбирает следующий на основе вероятностей. Один токен — один шаг. Вот почему генерация длинного текста может занимать время — ИИ по сути пишет по одной фишке из мешка, раз за разом.

Почему всё это полезно знать

Во-первых, вы начинаете понимать границы возможностей модели. Она не «думает» — она угадывает. Во-вторых, вам будет проще формулировать запросы, если вы понимаете, как работает кухня. Ну и в-третьих, теперь вы сможете не моргать, если кто-то скажет: «там, наверное, слишком высокая температура, вот и глючит».