میتسوبیشی و دانشگاه ایندیانا یک مدل جدید و همچنین مجموعه داده جدیدی منتشر کرده اند که وظیفه شناسایی موسیقی متن مناسب را بر عهده دارد. مشکل در اینجا جدا کردن هر منبع صوتی مستقل از یک صحنه آکوستیک پیچیده مانند یک صحنه فیلم یا یک ویدیوی یوتیوب است که در آن برخی صداها به خوبی متعادل نیستند. اگر با موفقیت دستههای مختلف را در یک موسیقی متن جدا کنید، به این معنی است که میتوانید فقط یکی از آنها را کم یا زیاد کنید، مثلاً برای شنیدن صحیح همه بازیگران، موسیقی را کمی کم کنید.
لوئیس بوچارد
من اصطلاحات و اخبار هوش مصنوعی را برای افراد غیر متخصص توضیح می دهم.
آیا تا به حال در یک ویدیو یا یک برنامه تلویزیونی کوک کرده اید که بازیگران کاملاً نامفهوم باشند یا موسیقی خیلی بلند باشد؟ خب، این مشکل که مشکل کوکتل پارتی نیز نامیده می شود، ممکن است دیگر هرگز تکرار نشود. میتسوبیشی و دانشگاه ایندیانا به تازگی یک مدل جدید و همچنین مجموعه داده جدیدی منتشر کرده اند که وظیفه شناسایی موسیقی متن مناسب را بر عهده دارد. به عنوان مثال، اگر همان کلیپ صوتی را که فقط با صدای خیلی بلند اجرا کردیم، بگیریم، میتوانید به سادگی آهنگ صوتی را که میخواهید به سخنرانی اهمیت بیشتری بدهید تا موسیقی، کم یا زیاد کنید.
مشکل در اینجا جدا کردن هر منبع صوتی مستقل از یک صحنه آکوستیک پیچیده مانند یک صحنه فیلم یا یک ویدیوی یوتیوب است که در آن برخی صداها خوب نیستند…