Google disponibiliza função Text-to-Speech para todos os clientes do Google Cloud Plataform

O Google Cloud anunciou recentemente no Google Cloud Next’ 18, as novas funções do Cloud Text-to-Speech, com novas vozes WaveNet – produto inovador de pesquisa de síntese de voz da DeepMind. A novidade reafirma os esforços do Google em tornar a inteligência artificial (AI) de qualidade cada vez mais acessível para todos.

Com as novidades do Cloud Text-to-Speech (conversão de texto para voz) os clientes têm acesso multilíngüe a falas geradas por meio do WaveNet, capazes de imitar entonações de voz e até mesmo aparentar estresse. São 17 novas vozes, dentre elas inglês (EUA), português e espanhol, que permitem a criação de aplicativos em idiomas variados. Hoje, a API oferece o total de 56 vozes (26 delas WaveNet, capazes de imitar vozes humanas e sons naturais, o que permite uma experiência melhor aos usuários) em 14 idiomas e variantes.

Outro destaque é o Audio ProfilesBeta. Dos fones de ouvido a alto-falantes e linhas telefônicas, agora os usuários podem otimizar o Cloud Text-to-Speech para reprodução em diferentes tipos de hardware, podendo selecionar a opção ideal para o seu uso.

O Cloud Speech-to-Text, ferramenta de conversão de voz para texto, também ganhou atualizações beta. Agora, a API permite o reconhecimento multicanal, diarização de alto-falante e detecção automática de idioma. As novas funções possibilitam a transcrição de vários canais de áudio com identificação de vozes, capaz de registrar quais palavras foram ditas por quem. Além disso, para as amostras de áudio que não são separadas em canais, como em uma palestra, por exemplo, o Google disponibiliza a diarização. Basta inserir o número de pessoas falantes como parâmetro à API e, por meio de aprendizagem de máquina, a ferramenta elabora uma categoria de cada palavra com um número e, na transcrição, consegue identificar o falante de maneira assertiva.

Google disponibiliza função Text-to-Speech para todos os clientes do Google Cloud Plataform

Converter PDF em Word para editar arquivos facilmente

TDC Floripa 2026 reúne 3,3 mil participantes e debate inteligência artificial corporativa

Santa Catarina protagoniza o início do avanço das cidades inteligentes no Brasil

Com aquisição da Atendo, Dinamize acelera estratégia de expansão

Fundo Garantidor da ACATE fortalece crédito para empresas de tecnologia

Nova solução da Unifique reduz impactos de falhas na internet

Google disponibiliza função Text-to-Speech para todos os clientes do Google Cloud Plataform

+ veja também

Infraestrutura em nuvem impulsiona avanço do setor de tecnologia em SC

ARTIGO | Orçamento de TI e maturidade digital: o que explica o descompasso no Brasil

IA e excesso de anúncios reduzem uso do Google entre brasileiros

Converter PDF em Word para editar arquivos facilmente

TDC Floripa 2026 reúne 3,3 mil participantes e debate inteligência artificial corporativa

Santa Catarina protagoniza o início do avanço das cidades inteligentes no Brasil

Com aquisição da Atendo, Dinamize acelera estratégia de expansão

Fundo Garantidor da ACATE fortalece crédito para empresas de tecnologia

Nova solução da Unifique reduz impactos de falhas na internet