Stability AI lansează un generator open source de text-în-audio antrenat pe biblioteci de muzică gratuită pentru a “respecta drepturile creatorilor”
Autor: Mihai Preda
Data actualizării:
Data publicării:
Stability AI, compania din spatele generatorului de imagini AI, Stable Diffusion, a lansat Stable Audio Open, un model open source pentru generarea de mostre audio scurte, efecte sonore și elemente de producție utilizând comenzi text.

Noul model a fost antrenat folosind date audio din biblioteci de muzică gratuită precum Freesound și Free Music Archive. „Acest lucru ne-a permis să creăm un model audio deschis respectând în același timp drepturile creatorilor”, a declarat Stability AI. Compania adaugă că pregătirea specializată a modelului Stable Audio Open îl face ideal pentru crearea de ritmuri de tobe, riff-uri de instrumente, sunete ambientale, înregistrări foley și alte mostre audio pentru producția muzicală și designul sonor, scrie Music Tech.

Utilizatorii pot genera până la 47 de secunde de date audio introducând descrieri text precum „arpegii calde pe un sintetizator analogic cu un filtru în creștere graduală și o coadă de reverb” și „beat rock jucat într-un studio tratat, tobe de sesiune pe un kit acustic”.

Un avantaj cheie al lansării open source este că utilizatorii pot ajusta fin modelul pe date audio personalizate. De exemplu, un baterist ar putea să își ajusteze modelul pe mostre din propriile înregistrări de tobe pentru a genera noi ritmuri.

Cu toate acestea, deși Stable Audio Open poate genera clipuri muzicale scurte, nu este optimizat pentru piese complete, melodii sau voci, spre deosebire de serviciul principal al companiei, Stable Audio. Acesta din urmă poate produce piese cu structură muzicală coerentă de până la trei minute și oferă capacități avansate precum generarea audio-în-audio și compoziții muzicale multi-parte coerente.

Potrivit Stability AI, modelul open source „oferă o privire asupra AI generativă pentru designul sonor, prioritizând în același timp dezvoltarea responsabilă alături de comunitățile creative.”

Noua direcție a companiei privind „generarea responsabilă de audio” urmează plecarea de profil înalt a vicepreședintelui său pentru audio generativ, Ed Newton-Rex, în noiembrie anul trecut, care a demisionat din cauza dezacordurilor cu firma în ceea ce privește ce constituie „utilizarea echitabilă” a lucrărilor protejate de drepturi de autor.

Fostul executiv a declarat că nu este de acord „cu opinia companiei că antrenarea modelelor AI generative pe lucrări protejate de drepturi de autor este corectă.” Newton-Rex a spus, de asemenea, pentru BBC că a considerat „exploatativ” ca dezvoltatorii să folosească lucrări creative fără consimțământ – o poziție pe care a susținut că multe firme AI, inclusiv Stability AI, ar fi în dezacord.

Articole similare

Selena Gomez este oficial miliardară

Valoarea netă a Selenei Gomez a depășit 1 miliard de...

Concertele din acest WEEKEND de la RADIODCNEWS

Vă invităm să ascultați cele mai electrizante și...

Doliu în lumea muzicii. A murit Sérgio Mendes

Muzicianul brazilian Sérgio Mendes a murit.


Top citite
FOTO: Agerpres

Filmul atât de lung încât spectatorii au primit o pauză de 15 minute la premieră

Selena Gomez este oficial miliardară

Selena Gomez este oficial miliardară

Captura Instagram

Michele Morrone a scris un story în limba română: Fac un apel la televiziuni

Sursa - Pexels

Clătite proteice fără făină – micul dejun perfect pentru un boost de energie

Nicușor Dan

Capitala sărbătorește 565 de ani. Nicușor Dan: Va avea loc cel mai mare eveniment de video mapping din lume

FOTO: Pexels

Mierea românească de salcâm, vedeta Festivalului European BIO și al Tradițiilor Locale


DC Media Group Audience

Cele mai noi articole

Selena Gomez este oficial miliardară

Valoarea netă a Selenei Gomez a depășit 1 miliard de...

Concertele din acest WEEKEND de la RADIODCNEWS

Vă invităm să ascultați cele mai electrizante și...

pixel