মার্কিন প্রযুক্তি জায়ান্ট গুগলের গবেষকরা এমন এক এআই মডেল তৈরি করেছেন যা লেখা থেকে কয়েক মিনিট দীর্ঘ মিউজিক তৈরি করতে পারে।
এটি হুইসেল যুক্ত বা হামড মেলোডিকে অন্যান্য বাদ্যযন্ত্রের মিউজিকে রূপান্তর করতে পারে। যেভাবে ডিএএলএএল-ই এর মতো সিস্টেমগুলো লিখিত প্রম্পট থেকে ইমেজ তৈরি করে থাকে।
দ্য আউটলেটের মতে, এই মডেলের নাম দেওয়া হয়েছে মিউজকএলএম। এই মডেল ব্যবহার করে তৈরি কয়েকটি স্যাম্পল আপলোড করেছে গুগল।
গুগলের এক গবেষণায় বলা হয়েছে, আমরা নিয়ে এসেছি মিউজিক এআই। যা লেখা মিউজিকে রূপান্তরিত করতে পারে। এটি বিকৃত গিটারের সুরকে শান্ত ভায়োলিনের মিউজিকে পরিণত করতে পারে। সেই সঙ্গে 24 kHz এ মিউজিক জেনারেট করে। যা কয়েক মিনিট ধরে সামঞ্জস্যপূর্ণ থাকে।
গুগলের প্রকাশিত এই স্যাম্পলগুলো বেশ আকর্ষণীয়। এটি টেক্সটের বর্ণনা অনুযায়ী জনরা, ভাইব এমনকী নির্দিষ্ট বাদ্যযন্ত্রের মিউজিক তৈরি করতে সক্ষম এবং এক বা দুই শব্দের মেলোডিক টেকনো থেকে পাঁচ মিনিটের মিউজিক তৈরি করতে পারে।
ডেমো সাইটে প্রদর্শিত উদাহরণগুলো দিয়ে দেখানো হয়েছে, মডেলটি যে কোন ধরনের মিউজিক তৈরি করতে পারে। এটি ১০ সেকেন্ডের সেলো বা মারাকাস, ৮ সেকেন্ডের নির্দিষ্ট জনরার মিউজিক এমনকি এটি যেকোনো লেভেলের পিয়ানোর মিউজিক তৈরি করতে পারে। এতে ফিউচারিস্টিক ক্লাব এবং অ্যাকর্ডিয়ন ডেথ মেটাল-এর ব্যাখ্যাও রয়েছে।
মিউজিক এলএম মানুষের আওয়াজেরও অনুকরণ করতে পারে। তবে এর আওয়াজ এবং টোন ঠিক থাকলেও এর কোয়ালিটিতে ঘাটতি রয়েছে।
দ্য ভার্জের মতে, এআই-উত্পাদিত মিউজিকের কয়েক দশকের দীর্ঘ ইতিহাস রয়েছে। এমন সিস্টেম রয়েছে যা পপ গান রচনা, ৯০ এর দশকে মানুষের চেয়ে স্ট্রিমকে আরও ভালোভাবে অনুলিপি করতে এবং লাইভ পারফরম্যান্সের সঙ্গেও কাজ করতে পারে।