Estudantes de Stanford criam aplicativo para alterar sotaques em tempo real

Shawn Zhang, Maxim Serebryakov e Andrés Pérez Soderi criam aplicativo para estrangeiros

Estudantes de Stanford criam aplicativo que altera sotaques. Maxim Serebryakov, da Rússia; Andrés Pérez Soderi, da Venezuela, e Shawn Zhang, da China, testam um software movido a inteligência artificial que visa eliminar falhas de comunicação

Da Redação

Uma verdadeira façanha foi conquistada por três ex-alunos da Universidade de Stanford, nos EUA – todos eles de origem estrangeira –, ao perceberem a tristeza na voz de um amigo quando ele contou que iria deixar o seu emprego em um call center porque o seu sotaque, ao falar inglês, confundia os clientes. As barreiras do idioma o deixava constrangido, pois ouvia insultos pela forma como falava.

Os três amigos, Maxim Serebryakov, que é da Rússia; Andrés Pérez Soderi, da Venezuela, e Shawn Zhang, da China, ficaram surpresos ao ouvir o desabafo do colega. Precisavam fazer algo. Os alunos perceberam que o problema era ainda maior do que a experiência do amigo. Então, eles fundaram uma startup para resolver isso. O trio criou um aplicativo para alterar sotaques. 

“Todos nós viemos de origens internacionais. Vimos em primeira mão como as pessoas o tratam de maneira diferente apenas por causa da maneira como você fala”, disse Serebryakov. “É de partir o coração às vezes”.

Hoje, os ex-alunos da Universidade de Stanford, vão indo muito bem com a empresa “Startup Sana” – aberta na Califórnia –, que vem ajudando estrangeiros com o inglês. Maxim Serebryakov, agora o CEO, Andrés Pérez Soderi, agora diretor financeiro, e Shawn Zhang, agora diretor de tecnologia. A “Sanas” já arrecadou mais de US$ 5 milhões em uma rodada de investimentos, e busca facilitar a comunicação entre pessoas.

A “Sanas” está testando um software movido a inteligência artificial que visa eliminar falhas de comunicação alterando o sotaque das pessoas em tempo real. Um funcionário de call center nas Filipinas, por exemplo, poderia falar normalmente ao microfone com um sotaque parecido de alguém do estado de Kansas para um cliente do outro lado da linha.

Os call centers, dizem os fundadores da startup, são apenas o começo. O site da empresa anuncia seus planos como “Discurso, reimaginado”.

Eventualmente, eles esperam que o aplicativo que estão desenvolvendo seja usado por uma variedade de setores e indivíduos. Poderia ajudar os médicos a entender melhor os pacientes, dizem eles, ou ajudar os netos a entender melhor seus avós.

Fácil de pronunciar

Os rapazes lançaram a empresa no ano passado, e deram a ela um nome que pode ser facilmente pronunciado em vários idiomas “para destacar nossa missão global e desejar aproximar as pessoas”, diz Pérez. Com o passar dos anos, os três dizem que experimentaram como os sotaques podem atrapalhar a comunicação.

Zhang diz que sua mãe, que veio da China para os EUA há mais de 20 anos, ainda o faz falar com o caixa quando vão fazer compras juntos porque ela fica envergonhada.

Serebryakov diz que viu como seus pais são tratados em hotéis quando o visitam nos Estados Unidos – como as pessoas fazem suposições quando ouvem seu sotaque. “Eles falam um pouco mais alto. Eles mudam seu comportamento”, diz ele.

Pérez diz que, depois de frequentar uma escola britânica, no início ele teve dificuldade em entender o sotaque americano quando chegou aos Estados Unidos. Ele também cita a dificuldade do pai quando ele tenta usar o assistente de voz da Amazon, Alexa, que sua família deu a ele no Natal.

Idioma mais falado

O inglês é o idioma mais usado no mundo. Cerca de 1,5 bilhão de pessoas falam – e a maioria delas não são falantes nativos. Só nos EUA, milhões de pessoas falam inglês como segunda língua.

Isso criou um mercado crescente para aplicativos que ajudam os usuários a praticar a pronúncia do inglês. Mas a Sanas está usando inteligência artificial para fazer uma abordagem diferente.

A premissa é que, em vez de aprender a pronunciar palavras de maneira diferente, a tecnologia pode fazer isso por você. Não haveria mais a necessidade de um treinamento de redução de sotaque caro ou demorado. E a compreensão seria quase instantânea.

Atualmente, o algoritmo da “Sanas” pode converter o inglês de e para os sotaques americano, australiano, britânico, filipino, indiano e espanhol, e a equipe está planejando adicionar mais. Eles podem adicionar um novo sotaque ao sistema treinando uma rede neural com gravações de áudio de atores profissionais e outros dados – um processo que leva várias semanas.

O investimento permitiu que a Sanas aumentasse seu quadro de funcionários. A maioria dos funcionários da empresa, com sede em Palo Alto, Califórnia, vem de experiências internacionais. E isso não é coincidência, diz Serebryakov.

“O que estamos construindo ressoou com tantas pessoas, até mesmo as pessoas que contratamos. É realmente emocionante de ver”, diz ele. Enquanto a empresa está crescendo, ainda pode demorar um pouco até que a “Sanas” apareça em uma loja de aplicativos ou em um telefone celular perto de você.