Volcengine Speech Synthesis MCP Server
A massiva API de voz do 'TikTok' — gere fala natural com os modelos de voz icônicos da ByteDance.
Pergunte à IA sobre este MCP Server
Vinkius AI Gateway suporta streamable HTTP e SSE.

Funciona com todos os agentes de IA que você já usa
…e qualquer cliente compatível com MCP


















O que é o Volcengine Speech Synthesis MCP Server?
O Volcengine Speech MCP Server dá a agentes de IA como Claude, ChatGPT e Cursor acesso direto ao Volcengine Speech. A massiva API de voz do 'TikTok' — gere fala natural com os modelos de voz icônicos da ByteDance. Potencializado pelo Vinkius AI Gateway — sem chaves de API, sem infraestrutura, conecte em menos de 2 minutos.
Volcengine Speech MCP Server: veja o seu AI Agent em ação
Capacidades integradas (7)
create_custom_voice
Requires 10-50 high-quality audio recordings of a single speaker. Training takes 1-3 days. Once complete, use the custom voice_type in synthesize_speech. Create a custom voice model from training audio samples
get_audio_formats
Use MP3 for web delivery, WAV for editing, OGG Opus for efficient streaming, or PCM for raw processing. List supported audio output formats
get_task_status
Returns whether processing, completed, or failed. Check status of an async TTS task
list_voices
Essential for choosing the right voice before synthesis. Includes the famous TikTok voice styles. List all available TTS voice models
synthesize_long_text
Ideal for articles, audiobooks, and lengthy documentation. Use this when your text exceeds the standard 1024 character limit. Synthesize speech from long text (over 1024 characters)
synthesize_speech
Supports multiple languages (Chinese, English, Japanese), various voice styles (female, male, child, trendy, news), and adjustable speed/volume. Returns audio data or URL. Ideal for narration, accessibility, multi-language content, and the iconic TikTok voice effects. Convert text to speech using Volcengine TTS
synthesize_ssml
Use SSML tags like <break>, <emphasis>, <prosody> for natural-sounding output with precise timing and intonation control. Convert SSML (Speech Synthesis Markup Language) to speech
O que esse conector desbloqueia
Conecte a Síntese de Fala Volcengine (plataforma TTS da ByteDance) a qualquer agente de IA e gere fala natural impressionante — incluindo as vozes icônicas do TikTok.
O que você pode fazer
- Texto para Fala — Converta texto em fala natural
- Vozes do TikTok — Use os mesmos modelos de voz dos efeitos virais do TikTok
- Multi-idioma — Sintetize em chinês, inglês, japonês
- SSML — Controle fino com pausas, ênfase e prosódia
Para quem é?
- Criadores de Conteúdo — Gerem voiceovers para vídeos e TikToks
- Equipes de Acessibilidade — Adicionem fala a apps e sites
- Desenvolvedores — Integrem TTS de qualidade TikTok
Perguntas frequentes
Dê aos seus agentes de IA o poder do Volcengine Speech
Acesse o Volcengine Speech e 2.500+ servidores MCP — prontos para seus agentes usarem, agora mesmo. Sem código cola. Sem integrações customizadas. Apenas plugue o Vinkius AI Gateway e deixe seus agentes trabalharem.
