De Samsung Galaxy S23 nu extra scherp geprijsd!

Googles AI kan super realistische stemmen produceren

Erwin Vogelaar
11 september 2016, 19:33
2 min leestijd
Googles AI kan super realistische stemmen produceren

Googles gesproken diensten worden een stuk prettiger, want inmiddels kan Googles DeepMind realistische stemmen fabriceren. Niet langer klinkt het alsof er een robot tegen je praat, hoewel dat stiekem wel zo is.

Lees verder na de advertentie.

DeepMind realistische stemmen

Het neurale netwerk van DeepMind wordt bij Google voor allerlei toepassingen gebruikt. We lezen voornamelijk hoe de kunstmatige intelligentie getraind wordt, zoals met potjes Go, maar de praktische toepassingen zijn niet altijd even zichtbaar naast diensten als Google Foto’s, de vooropgestelde reacties voor e-mails in Inbox en binnenkort de Google Assistent.

Een punt waar DeepMind nu indrukwekkende vooruitgang in maakt, zijn realistische kunstmatige stemmen. De kunstmatige intelligentie hierachter wordt WaveNet genoemd, een neuraal netwerk dat gesproken menselijke tekst analyseert om daar nieuwe tekst van te maken. Het verschil met hoe stemmen nu klinken is enorm.

deepmind realistische stemmen

Op dit moment hoor je heel duidelijk dat een tekst die voorgelezen wordt, door bijvoorbeeld Google Translate of de Google-app, nep is. Met de technologie van WaveNet klinkt het alsof er echt een mens tegen je praat. Dat huidige gesproken tekst onrealistisch klinkt, komt doordat het bestaat uit geknipte stukjes van opnames, terwijl de technologie van WaveNet leert en imiteert. De gesproken teksten komen dus echt volledig van de AI. Om deze zinnen extra realistisch te maken, voegt WaveNet zelfs geluiden van mondbewegingen en ademhalingen toe voor meer emotie of voor accenten.

Op de website van DeepMind kun je naar voorbeelden luisteren van hoe de kwaliteit van de stemmen beetje bij beetje verbeterd wordt. Je moet hiervoor wel een stukje naar beneden scrollen, of je moet graag in de materie van DeepMind duiken. Je kunt in de geluidsfragmenten onder andere horen hoe WaveNet gebruikt wordt om dezelfde tekst op verschillende manieren met verschillende stemmen uit te spreken. De technologie werkt op dit moment met Engels, maar ook met Mandarijn.

Lees het laatste nieuws over Google

Bron: DeepMind
Heeft dit artikel je geholpen?
Reageer

Lezersreacties

Deel je kennis of stel een vraag. Dat kan anoniem of met een Disqus account.

Het laatste nieuws, tips en meer Android in je inbox

Menu