Terug

AI Heroes Dagboek #1

Een muziekmaker maken - spraak omzetten in zang

Hoofdpagina van het hulpmiddel

Welkom bij het eerste bericht in ons ontwikkelingsdagboek, waarin we de reis achter ons nieuwste project willen delen: een spraak-naar-lied generator. Met deze tool kun je jouw gesproken woorden omzetten in unieke liedjes, waarbij de technische mogelijkheden van AI worden gecombineerd met een creatief tintje. Als je je ooit hebt afgevraagd hoe AI muziek kan maken of hoe het is om een project als dit te ontwikkelen, dan zit je hier goed.

Waar het allemaal begon: Van idee tot actie

Het begon met een vraag die ons nieuwsgierig maakte: Wat als we iemands woorden in muziek konden omzetten? Het voelde als een van die ideeën met een groot potentieel, maar we wisten dat het een reis zou worden om de technische details in elkaar te passen. We wisten dat AI taal kon verwerken en melodieën kon maken, maar de uitdaging was om die twee te combineren tot iets dat mensen echt zouden willen gebruiken - niet alleen als gimmick, maar als ervaring.

Het idee groeide al snel uit tot iets groters: Zouden we een tool kunnen maken die persoonlijk en creatief aanvoelt, terwijl we toch gebruik maken van de sterke punten van AI? Dit werd de drijvende kracht achter ons project - AI gebruiken om samen met de gebruiker muziek te maken, niet alleen voor hem.

Een ervaring ontwerpen, niet alleen een product

Toen we eenmaal het concept hadden, was de volgende stap het ontwerpen van een gebruikerservaring die leuk en intuïtief aanvoelde, niet ingewikkeld of kil. Onze ontwerper, Demi, bracht dit tot leven door zich te richten op hoe het proces aanvoelt. We wilden dat het kleurrijk, speels en gebruiksvriendelijk zou zijn - iets dat je uitnodigt en je betrokken houdt.

Dit is wat we hebben bedacht:

  • Een heldere, regenboogkleurige interface die de creatieve energie van muziek maken weerspiegelt
  • Een vriendelijke AI-bot om gebruikers te begeleiden, zodat het voelt als een samenwerking
  • Visuele effecten waarmee je in realtime kunt zien hoe het nummer wordt gemaakt, zodat het proces een deel van het plezier wordt

De flow is eenvoudig:

  1. Je wordt begroet met een warm welkom door onze AI-mascotte.
  2. Je beantwoordt een paar leuke, interactieve vragen over wat voor liedje je wilt.
  3. Terwijl je nummer wordt gegenereerd, zie je dynamische visuals die het proces tot leven brengen.
  4. Tot slot kun je luisteren naar je aangepaste nummer en het delen als je wilt.

Hoe AI ons helpt slimmer te bouwen

Achter de schermen gebruikten we AI niet alleen om het eindproduct te maken, maar ook om vorm te geven aan de manier waarop we het bouwden. We vertrouwden op AI-modellen om ons te helpen mogelijke wegversperringen te doordenken en nieuwe ideeën voor functies te verkennen, wat het hele proces sneller en flexibeler maakte. In plaats van uren te discussiëren over hoe de gebruikerservaring eruit zou kunnen zien, konden we het simuleren en zien hoe het voelde.

Met deze aanpak kunnen we:

  • Potentiële problemen vroegtijdig opsporen, zodat we later geen tijd verspilden aan het oplossen ervan.
  • Experimenteer met een heleboel ideeën voordat je beslist welke het beste werken.
  • Dingen snel in beweging houden, waardoor we sneller konden testen, aanpassen en verbeteren.

We hebben bijvoorbeeld AI gebruikt om alle pagina's te identificeren die we moesten ontwerpen:


PROJECT CASE: We maken een spraak-naar-lied app, waarbij gebruikers een vooraf gedefinieerd aantal vragen beantwoorden, waarna het model een begeleidend liedje genereert. Welke schermen en tussenliggende pagina's moeten we ontwikkelen voor deze tool?


Om een app te maken die spraak-naar-liedjes genereert, hebben we verschillende schermen en tussenliggende pagina's nodig om gebruikers door het proces te leiden. Hier is een suggestie voor de flow van de app:
  1. Welkom/Home scherm
  2. Vragenreeks pagina's
  3. Generatielaadscherm
  4. Resultaten Pagina
  5. Nummers afspelen en regelaars
  6. Opties opslaan/delen
  7. Geschiedenis/bibliotheekpagina
Laten we deze uitsplitsen:
  1. Welkom/Home scherm:
    • App-titel en korte beschrijving
    • "Knop "Nieuw nummer starten
    • Toegang tot geschiedenis/bibliotheek
    • Instellingen of gebruikersaccount (indien van toepassing)
  2. Vragenreeks Pagina's:
    • Reeks pagina's met elk één vraag
    • Voortgangsindicator (bijv. "Vraag 3 van 7")
    • Invoerveld voor het antwoord van de gebruiker (tekst, meerkeuze, enz.)
    • "Knoppen "Volgende" en "Terug
    • Optie om vragen over te slaan
  3. Generatie laadscherm:
    • Geanimeerde laadindicator
    • Statusupdates (bijv. "Reacties analyseren", "Melodie componeren", "Tekst toevoegen")
    • Geschatte resterende tijd
  4. Resultaten Pagina:
    • Gegenereerde songtitel
    • Korte samenvatting van het thema of de stijl van het nummer
    • Optie om het nummer af te spelen
    • Weergave songteksten (indien van toepassing)
  5. Nummers afspelen en regelaars:
    • Knop afspelen/pauzeren
    • Bar zoeken
    • Volumeregelaar
    • Herhaal optie
  6. Opties voor opslaan/delen:
    • Knop Opslaan in bibliotheek
    • Deelknoppen (sociale media, berichten, e-mail)
    • Downloadopties (bijv. MP3, songtekst als tekst)
  7. Geschiedenis/bibliotheekpagina:
    • Lijst met eerder gegenereerde nummers
    • Zoek- en filteropties
    • Mogelijkheid om opgeslagen nummers opnieuw af te spelen, te bewerken of te verwijderen
Extra overwegingen:
  • Tutorial- of inloopschermen voor nieuwe gebruikers
  • Foutbehandelingspagina's (bijv. als het genereren mislukt)
  • Feedback/beoordelingssysteem voor gegenereerde nummers
  • Instellingenpagina voor app-voorkeuren
Wil je dat ik dieper inga op een van deze schermen of de gebruikersstroom gedetailleerder bespreek?

Wat is de volgende stap?

Op dit moment werken we aan het verfijnen van de AI-modellen om de nummers nog genuanceerder en gevarieerder te maken. We duiken dieper in natuurlijke taalverwerking om de subtiliteiten van wat gebruikers willen beter te begrijpen. We verbeteren ook de muziekgeneratie zelf, zodat de nummers dynamischer aanvoelen, en we upgraden het tekst-naar-spraaksysteem zodat de zang natuurlijker klinkt.

Aan de voorkant verfijnen we het ontwerp om ervoor te zorgen dat de interface soepel werkt op alle apparaten en dat de ervaring zo snel en responsief is als we willen.

Maak deel uit van de reis

We zijn erg enthousiast over waar dit project naartoe gaat en we willen graag dat jij er deel van uitmaakt. Houd een oogje in het zeil voor updates in toekomstige dev diaries, waarin we meer vertellen over de technische kant van de zaak, nieuwe functies die we aan het testen zijn en hoe je betrokken kunt raken bij bètatests.

Bij AI Heroes bouwen we niet alleen AI-tools, we onderzoeken ook nieuwe manieren om ermee te creëren. Als je nieuwsgierig bent naar wat we doen of wilt praten over hoe AI deel kan uitmaken van je volgende idee, neem dan contact met ons op.

Ralitsa Todorova
Ralitsa Todorova

We gebruiken cookies om je de beste ervaring te geven. Cookiebeleid

Preloader-afbeelding