مدل هوش مصنوعی جدید برای تولید ویدئو با وضوح بالا

مدل هوش مصنوعی جدید برای تولید ویدئو با وضوح بالا

سرگرمی کامپیوتری: مدل هوش مصنوعی جدید محققان چینی که می تواند ویدئوهایی را با وضوح بالا تولید نماید، در قالب یک نرم افزار منبع باز در دسترس قرار گرفته است.


به گزارش سرگرمی کامپیوتری به نقل از ایسنا، گروهی از محققان هوش مصنوعی «دانشگاه پکن»(Peking University)، شرکت «کوایشو تکنولوژی»(Kuaishou Technology) و «دانشگاه پست و مخابرات پکن»(BUPT) یک مدل هوش مصنوعی جدید را به نام «پیرامید فلو»(Pyramid Flow) ابداع نموده اند که می توان از آن برای تولید ویدئوهای با وضوح بالا در حد 768p بهره برد.
به نقل از تک اکسپلور، طی چند سال گذشته، چندین نهاد شامل خصوصی و عمومی کوشیده اند تا مدلهای هوش مصنوعی مولد ویدیو را بسازند برای اینکه چنین مدل هایی را می توان برای ایجاد اپلیکیشن هایی با قابلیت تولید محتوای ویدیویی بمنظور استفاده در تلویزیون و تصاویر متحرک با هزینه بسیار کمتر از فیلم برداری صحنه های واقعی بهره برد.
این بدان معناست که ارزش مدلهای هوش مصنوعی به سرعت در حال افزایش می باشد. محققان چینی در این تلاش جدید تصمیم گرفتند که مدل خودرا بصورت منبع باز بسازند؛ به این مفهوم که همه بدون پرداخت هزینه بتوانند یک اپلیکیشن را برای آن توسعه دهند و آنرا بصورت محلی همچون جهت استفاده تجاری اجرا کنند.
سازندگان پیرامید فلو، قابلیت های جدیدی را به مدلهای تولید ویدیو با هوش مصنوعی اضافه کرده اند. این مدل قبل از تولید نتیجه نهایی پردازش، ویدیو را در چندین مرحله با وضوح پایین تولید می کند. بگفته این گروه پژوهشی، اپلیکیشن مجهز به این مدل می تواند یک ویدیوی پنج ثانیه ای را در ۵۶ ثانیه تولید نماید که نتیجه آن وضوح 384p خواهد بود.
محققان خاطرنشان کردند که روش آنها ویدیو را با استفاده از قدرت محاسباتی بسیار کمتر تولید می کند و این موجب می شود که هزینه کمتری داشته باشد. همچنین، تعداد ورودی های مورد نیاز برای تولید ویدیو را بطور شایان توجهی می کاهد و آنرا کارآمدتر می کند.
این گروه پژوهشی تحت مجوز دانشگاه «ام آی تی»(MIT) کد پیرامید فلو را به همراه نمونه ویدیوهایی که نتایج بسیار واقعی را از مدل نشان می دهند، در پلت فرم «گیت هاب»(GitHub) فرستاده اند. همچنین، آنها مجموعه داده های منبع باز را که برای آموزش مدل خود به کار برده اند، لیست کرده اند و مجموعا ۱۰ میلیون ویدیوی کوتاه را به آن افزوده اند.
این گروه پژوهشی درباره ی ادعاهای مطرح شده توسط کسانیکه ارسال ویدئوهای مجازی به پایگاه های داده منبع باز را نقض قانون کپی رایت می دانند، صحبتی نکردند. در هر حال، آنها معتقدند پیرامید فلو می تواند یک فناوری مناسب برای تنظیم دقیق داده های منبع باز بدون نیاز به پرداخت به شخص ثالث باشد.



1403/07/27
13:22:18
0.0 / 5
223
تگهای خبر: آموزش , تكنولوژی , شركت , فناوری
این مطلب را می پسندید؟
(0)
(0)

تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب
لطفا شما هم نظر دهید
= ۹ بعلاوه ۳
مجله سرگرمی

pcfun.ir - حقوق مادی و معنوی سایت سرگرمی كامپیوتری محفوظ است

سرگرمی كامپیوتری

فناوری اطلاعات و بازیهای کامپیوتری