Cohere MCP Server
Acceda modelos Cohere AI vía API — converse con modelos Command, genere embeddings, reranquee documentos y tokenice texto desde cualquier agente.
Pregúntale a la IA sobre este MCP Server
Vinkius AI Gateway soporta streamable HTTP y SSE.

Funciona con todos los agentes de IA que ya usas
…y cualquier cliente compatible con MCP


















¿Qué es el Cohere MCP Server?
El Cohere MCP Server da a agentes de IA como Claude, ChatGPT y Cursor acceso directo a Cohere. Acceda modelos Cohere AI vía API — converse con modelos Command, genere embeddings, reranquee documentos y tokenice texto desde cualquier agente. Potenciado por el Vinkius AI Gateway — sin claves API, sin infraestructura, conecta en menos de 2 minutos.
Cohere MCP Server: mira tu AI Agent en acción
Capacidades integradas (6)
chat
Requires the model ID (e.g. "command-r-plus", "command-r", "command-r7b") and messages array in JSON format. Each message must have a "role" ("user", "assistant", "system" or "tool") and "content" (text or array of content blocks). Optionally set max_tokens, temperature (0-1), p (nucleus sampling 0-1) and tools array for function calling. Returns the model's response with text, citations and tool calls. Send a chat message to a Cohere model
detokenize
Requires the token IDs array. Returns the reconstructed text. Useful for debugging and verifying tokenization. Detokenize token IDs back to text using Cohere
embed
Requires the model ID (e.g. "embed-v4", "embed-v3"), texts array and input_type ("search_document", "search_query", "classification", "clustering"). Returns embedding vectors for each input text. Useful for semantic search, similarity comparison and vector database storage. Generate embeddings using Cohere
list_models
Each model returns its name (e.g. "command-r-plus", "command-r", "embed-v4", "rerank-v3.5"), endpoint compatibility, context length and tokenization info. Use this to discover which models are available and their capabilities. List all available Cohere models
rerank
Requires the model ID (e.g. "rerank-v3.5", "rerank-english-v3.0"), query text and documents array. Optionally set top_n to return only the top N results. Returns ranked documents with relevance scores. Rerank documents by relevance to a query
tokenize
Requires the text to tokenize and optionally the model. Returns the list of token IDs and token strings. Useful for estimating token counts before sending to chat or embed endpoints. Tokenize text using Cohere
Lo que este conector desbloquea
Conecte su cuenta de Cohere a cualquier agente de IA y aproveche modelos de IA enterprise mediante conversación natural.
Qué puede hacer
- Descubrimiento de Modelos — Liste todos los modelos Cohere disponibles con sus nombres, capacidades y longitudes de contexto
- Chat API — Envíe conversaciones a modelos Command (command-r-plus, command-r, command-r7b) y reciba respuestas con citas y soporte de tool calls
- Embeddings — Genere embeddings vectoriales para búsqueda semántica con múltiples tipos de embedding (float, int8, uint8, binary)
- Reranking — Reranquee documentos por relevancia a una query de búsqueda usando modelos de reranking líderes de la industria
- Tokenización — Tokenice y detokenice texto para estimar conteos de tokens y debug
Cómo funciona
1. Suscríbase a este servidor
2. Ingrese su Cohere API Key
3. Comience a usar modelos Cohere desde Claude, Cursor o clientes compatibles con MCP
¿Para quién es?
- Developers — envíen rápidamente mensajes a modelos Command, generen embeddings y reranqueen resultados de búsqueda sin escribir código HTTP
- ML Engineers — descubran modelos disponibles, comparen capacidades y generen embeddings con múltiples tipos (float, int8, binary)
- Search Teams — reranqueen documentos por relevancia, tokenizen texto y generen embeddings para construcción de índice de búsqueda
Preguntas frecuentes
Dale a tus agentes de IA el poder de Cohere
Accede a Cohere y a 2.500+ servidores MCP — listos para que tus agentes los usen, ahora mismo. Sin código pegamento. Sin integraciones personalizadas. Solo conecta el Vinkius AI Gateway y deja que tus agentes trabajen.
