fix: select provider AFTER routing resolves model groups

Previously, provider selection happened on the raw client-requested model name (e.g. 'dispatcher') which defaulted to OpenAI. After routing resolved it to 'deepseek-v4-flash', the provider was never re-selected. Now prefix-stripping + routing runs first, then selectProvider() picks the correct provider based on the resolved concrete model.
2026-05-07 13:54:42 -04:00
parent 330eaa57d1
commit 4aea7a3b4c
1 changed files with 8 additions and 32 deletions
@@ -533,38 +533,7 @@ func (s *Server) handleChatCompletions(c *gin.Context) {
 		return
 	}

-	// Select provider based on model name
-	providerName := "openai" // default
-	modelLower := strings.ToLower(req.Model)
-	if strings.HasPrefix(modelLower, "gemini/") || strings.Contains(modelLower, "gemini") || strings.HasPrefix(modelLower, "google/") {
-		providerName = "gemini"
-	} else if strings.HasPrefix(modelLower, "deepseek/") || (strings.Contains(modelLower, "deepseek") && !strings.Contains(modelLower, "ollama")) {
-		// Only use deepseek provider if it's not explicitly tagged for ollama
-		providerName = "deepseek"
-	} else if strings.HasPrefix(modelLower, "moonshot/") || strings.Contains(modelLower, "kimi") || strings.Contains(modelLower, "moonshot") {
-		providerName = "moonshot"
-	} else if strings.HasPrefix(modelLower, "grok/") || strings.Contains(modelLower, "grok") {
-		providerName = "grok"
-	} else if strings.HasPrefix(modelLower, "ollama/") ||
-		strings.Contains(modelLower, "glm-") ||
-		strings.Contains(modelLower, "qwen") ||
-		strings.Contains(modelLower, "gemma") ||
-		strings.Contains(modelLower, "llama") ||
-		strings.Contains(modelLower, "mistral") ||
-		strings.Contains(modelLower, "phi") ||
-		strings.Contains(modelLower, "yi") ||
-		strings.Contains(modelLower, "codellama") ||
-		strings.Contains(modelLower, "command-r") {
-		providerName = "ollama"
-	}
-
-	provider, ok := s.providers[providerName]
-	if !ok {
-		c.JSON(http.StatusInternalServerError, gin.H{"error": fmt.Sprintf("Provider %s not enabled or supported", providerName)})
-		return
-	}
-
-	// Strip common prefixes
+	// Strip common prefixes and prepare model ID
 	modelID := req.Model
 	prefixes := []string{"gemini/", "google/", "openai/", "deepseek/", "moonshot/", "grok/", "ollama/"}
 	for _, p := range prefixes {
@@ -590,6 +559,13 @@ func (s *Server) handleChatCompletions(c *gin.Context) {
 		log.Printf("[ROUTER] %s (%s: %s)", modelID, decision.Strategy, decision.Reason)
 	}

+	// Select provider based on the resolved model name
+	provider, providerName, err := s.selectProvider(modelID)
+	if err != nil {
+		c.JSON(http.StatusInternalServerError, gin.H{"error": err.Error()})
+		return
+	}
+
 	// Convert ChatCompletionRequest to UnifiedRequest
 	unifiedReq := &models.UnifiedRequest{
 		Model:            modelID,