llm: Enable flash attention for mistral3 by default

2025-12-04 12:16:52 -08:00 · 2025-12-04 12:16:52 -08:00 · 9191dfaf05
parent 1108d8b34e
commit 9191dfaf05
1 changed files with 1 additions and 0 deletions
--- a/fs/ggml/ggml.go
+++ b/fs/ggml/ggml.go
@ -831,6 +831,7 @@ func (f GGML) FlashAttention() bool {
 	return slices.Contains([]string{
 		"gemma3",
 		"gptoss", "gpt-oss",
 		"mistral3",
 		"qwen3", "qwen3moe",
 		"qwen3vl", "qwen3vlmoe",
 	}, f.KV().String("general.architecture"))