sinchro

Иллюстрация параметров n_batch и n_ubatch в HTTP-запросах к LLM

Параметры n_batch n_ubatch

Опытным путём выяснил, что увеличение n_batch больше чем в 2 раза от n_ubatch только увеличивает время обработки запроса, то есть большой num_batch увеличивает потребление памяти, но не ускоряет, а замедляет работу llm.

llama_context: n_batch = 2048
llama_context: n_ubatch = 1024

Теги: ai, llm, ollama, оптимизация, производительность

sinchro

записки записки

/

мысли мысли

/

книги книги

Параметры n_batch n_ubatch

(отменить ответ)

Параметры n_batch n_ubatch

(отменить ответ)

n8n connect ECONNREFUSED

Сертификат lets encrypt

Ollama and Radeon 9070