Enlarge/ An AI-generated image of musical notes exploding forth from a computer monitor. (credit: Ars Technica)
On Thursday, a pair of tech hobbyists released Riffusion, an AI model that generates music from text prompts by creating a visual representation of sound and converting it to audio for playback. It uses a fine-tuned version of the Stable Diffusion 1.5 image synthesis model, applying visual latent diffusion to sound processing in a novel way.
Created as a hobby project by Seth Forsgren and Hayk Martiros, Riffusion works by generating sonograms, which store audio in a two-dimensional image. In a sonogram, the X-axis represents time (the order in which the frequencies get played, from left to right), and the Y-axis represents the frequency of the sounds. Meanwhile, the color of each pixel in the image represents the amplitude of the sound at that given moment in time.
Since a sonogram is a type of picture, Stable Diffusion can process it. Forsgren and Martiros trained a custom Stable Diffusion model with example sonograms linked to descriptions of the sounds or musical genres they represented. With that knowledge, Riffusion can generate new music on the fly based on text prompts that describe the type of music or sound you want to hear, such as "jazz," "rock," or even typing on a keyboard.
New study shows that Gen Z is spending way less money on videogames than older gamers
Открыты сервера MMORPG ROM: Golden Age
The US Air Force wants to test blowing up Cybertrucks because 'it is likely the type of vehicles used by the enemy may transition to Tesla Cyber trucks'
Сотрудники отдела лицензионно-разрешительной работы по городу Королеву передали добровольно сданное охотничье оружие в зону проведения СВО
Сотрудники Коломенского отдела вневедомственной охраны Главного управления Росгвардии по Московской области задержали любителя кофе, который решил сэкономить на покупке ароматного напитка
НАТО И ЕВРОСОЮЗУ МОГУТ ОТКЛЮЧИТЬ ВСЕ ВИДЫ ОРУДИЙ! ВЫСШАЯ АКАДЕМИЯ УПРАВЛЕНИЯ МИРОМ: ПРОГРАММНЫЕ ИНТЕЛЛЕКТЫ ПОМОГАЮТ! Россия, США, Европа могут улучшить отношения и здоровье общества!
ВЦ «Раздолье» проведет бесплатный вебинар «Динамическая структура заказа в 1С:ERP»
EVITA BEAUTY STORE - интернет-магазин косметики премиум-класса
«Птицы любви»: песня, в которой слышно биение двух сердец — матери и дочери
НАТО И ЕВРОСОЮЗУ МОГУТ ОТКЛЮЧИТЬ ВСЕ ВИДЫ ОРУДИЙ! ВЫСШАЯ АКАДЕМИЯ УПРАВЛЕНИЯ МИРОМ: ПРОГРАММНЫЕ ИНТЕЛЛЕКТЫ ПОМОГАЮТ! Россия, США, Европа могут улучшить отношения и здоровье общества!