Stability AI lansează un generator open source de text-în-audio antrenat pe biblioteci de muzică gratuită pentru a “respecta drepturile creatorilor”
Autor: Mihai Preda
Data actualizării:
Data publicării:
Stability AI, compania din spatele generatorului de imagini AI, Stable Diffusion, a lansat Stable Audio Open, un model open source pentru generarea de mostre audio scurte, efecte sonore și elemente de producție utilizând comenzi text.

Noul model a fost antrenat folosind date audio din biblioteci de muzică gratuită precum Freesound și Free Music Archive. „Acest lucru ne-a permis să creăm un model audio deschis respectând în același timp drepturile creatorilor”, a declarat Stability AI. Compania adaugă că pregătirea specializată a modelului Stable Audio Open îl face ideal pentru crearea de ritmuri de tobe, riff-uri de instrumente, sunete ambientale, înregistrări foley și alte mostre audio pentru producția muzicală și designul sonor, scrie Music Tech.

Utilizatorii pot genera până la 47 de secunde de date audio introducând descrieri text precum „arpegii calde pe un sintetizator analogic cu un filtru în creștere graduală și o coadă de reverb” și „beat rock jucat într-un studio tratat, tobe de sesiune pe un kit acustic”.

Un avantaj cheie al lansării open source este că utilizatorii pot ajusta fin modelul pe date audio personalizate. De exemplu, un baterist ar putea să își ajusteze modelul pe mostre din propriile înregistrări de tobe pentru a genera noi ritmuri.

Cu toate acestea, deși Stable Audio Open poate genera clipuri muzicale scurte, nu este optimizat pentru piese complete, melodii sau voci, spre deosebire de serviciul principal al companiei, Stable Audio. Acesta din urmă poate produce piese cu structură muzicală coerentă de până la trei minute și oferă capacități avansate precum generarea audio-în-audio și compoziții muzicale multi-parte coerente.

Potrivit Stability AI, modelul open source „oferă o privire asupra AI generativă pentru designul sonor, prioritizând în același timp dezvoltarea responsabilă alături de comunitățile creative.”

Noua direcție a companiei privind „generarea responsabilă de audio” urmează plecarea de profil înalt a vicepreședintelui său pentru audio generativ, Ed Newton-Rex, în noiembrie anul trecut, care a demisionat din cauza dezacordurilor cu firma în ceea ce privește ce constituie „utilizarea echitabilă” a lucrărilor protejate de drepturi de autor.

Fostul executiv a declarat că nu este de acord „cu opinia companiei că antrenarea modelelor AI generative pe lucrări protejate de drepturi de autor este corectă.” Newton-Rex a spus, de asemenea, pentru BBC că a considerat „exploatativ” ca dezvoltatorii să folosească lucrări creative fără consimțământ – o poziție pe care a susținut că multe firme AI, inclusiv Stability AI, ar fi în dezacord.

Articole similare

Concertele din acest WEEKEND de la RADIODCNEWS

Radio DC News vă invită la o serie de concerte...


Top citite
Foto: Pexels

Celine Dion și Lady Gaga vor cânta la ceremonia de deschidere a Jocurilor Olimpice din Paris

Foto: Pexels

Fanii Sabrinei Carpenter denunță costurile exorbitante ale biletelor pentru turneul arenelor

Captura Instagram

Victor Cornea, gest superb față de fetițele Andreei Bălan

Foto: Pexels

Interpol reflectează asupra scenei iconice din "Friends" în timp ce începe turneul aniversar de 20 de ani

Captura Youtube

Janet Jackson și-a amintit cum și unde a scris piesa "Scream" alături de Michael Jackson

Captura Youtube

Smiley a lansat melodia "Cum te văd eu"


DC Media Group Audience

Cele mai noi articole

Concertele din acest WEEKEND de la RADIODCNEWS

Radio DC News vă invită la o serie de concerte...

pixel