سیاست و بازاریابی

آخرين مطالب

هوش مصنوعی EMO برای تبدیل عکس به ویدیو توسط علی‌بابا معرفی شد نکات خواندني

هوش مصنوعی EMO برای تبدیل عکس به ویدیو توسط علی‌بابا معرفی شد
  بزرگنمايي:

سیاست و بازاریابی - دیجیاتو / این مدل می‌تواند عکس‌های شما را به ویدیوهای واقعی تبدیل کند که در آن‌ها در حال صحبت‌کردن یا آوازخواندن هستید.
محققان شرکت چینی علی‌بابا (Alibaba)، سیستم هوش مصنوعی جدیدی به نام «EMO» (مخفف Emote Portrait Alive) را توسعه داده‌اند که می‌تواند یک عکس پرتره را به ویدیو تبدیل کند. به‌طور خلاصه، این مدل می‌تواند عکس‌های شما را به ویدیوهای واقعی تبدیل کند که در آن‌ها در حال صحبت‌کردن یا آوازخواندن هستید.
براساس مقاله تحقیقاتی علی‌بابا، این مدل می‌تواند حرکات اجزای صورت و حالت‌های سر کاربران را به‌صورتی ایجاد کند که دقیقا با آهنگ صوتی ارائه‌شده مطابقت داشته باشد. همچنین از این مدل به‌عنوان یک پیشرفت بزرگ در زمینه تولید ویدیو براساس صدا یاد شده است، حوزه‌ای که محققان هوش مصنوعی سال‌ها آن را به چالش کشیده‌‌اند.
«لینروی تیان»، محقق اصلی این سیستم می‌گوید:
«تکنیک‌های سنتی اغلب نمی‌توانند طیف کاملی از حالات انسانی و منحصر‌به‌فردبودن سبک‌های صورت اشخاص را به تصوی بکشند. برای حل این مشکل، ما EMO را پیشنهاد می کنیم، یک چارچوب جدید که از رویکرد مستقیم صوتی به تصویر استفاده می‌کند و به مدل‌های سه‌بعدی متوسط یا نشانه‌های چهره نیازی ندارد.»
نحوه کار مدل تبدیل عکس به ویدیو علی‌بابا

سیاست و بازاریابی

مدل تبدیل عکس به ویدیو EMO از یک تکنیک هوش مصنوعی معروف به مدل انتشار استفاده می‌کند که از نظر تولید تصاویر واقعی، پتانسیل بسیار خوبی از خود نشان داده است. محققان این مدل را با مجموعه داده‌ای متشکل از 250 ساعت ویدیو‌های مربوط به سخنرانی‌ها، فیلم‌ها، نمایش‌های تلویزیونی و اجرای آواز آموزش داده‌اند.
برخلاف مدل‌های سنتی که بر مدل‌های سه‌بعدی صورت یا ترکیب اشکال برای تقریب حرکات صورت تکیه دارند، EMO می‌تواند مستقیما شکل موج صوتی را به فریم‌های ویدیویی تبدیل کند. این امر به آن اجازه می‌دهد تا حرکات ظریف و ویژگی‌های پیچیده هویتی مرتبط با گفتار طبیعی را نمایش دهد.
طبق آزمایش‌هایی که در مقاله توضیح داده شده، EMO به طور قابل‌توجهی از روش‌های پیشرفته موجود در معیارهای اندازه‌گیری کیفیت ویدیو، حفظ هویت و بیان بهتر استفاده می‌کند. محققان همچنین یک مطالعه روی کاربران انجام دادند که نشان داد ویدیوهای تولید شده توسط EMO طبیعی‌تر و احساسی‌تر از ویدیوهای تولیدشده توسط سایر سیستم‌ها هستند.

supports HTML5 video

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/736101/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

قابلیت‌های ChatGPT به آیفون می آید

دانشگاه استنفورد، آینده عینک‌های واقعیت افزوده را به‌نمایش گذاشت

ویدیویی از قوی‌ترین شراره خورشیدی منتشر شده تا به امروز

ثبت نام ترم دوم بهار آموزش زبان های خارجی در موسسه علوم و فنون کیش

تصاویر بیشتری از ساعت هوشمند اپل واچ ایکس کانسپت منتشر شد

شبیه‌‌سازی ناسا از سقوط در سیاهچاله

لپتاپ های مجهز به پردازنده اسنپدراگون X قبل از عرضه به بیرون درز کردند

موتور هواپیما چگونه کار می‌کند؟

صندوق اشتغال، حامی کارآفرینی جامعۀ ایثارگری است

کامپیوتر جیبی که همانند گوشی می‌توانید آن را همیشه همراه خود داشته باشید

پهپاد ساخت آماتورها رکورد سرعت را در گینس ثبت کرد

با دکتر احمد شیخی، یکی از چهره‌های برجسته علمی کشور آشنا شوید

کشف بقایای یک سیاره مدفون در اعماق زمین

ناسا لباس فضانوردی نسوز می‌سازد

بازگشت غیرمنتظره میزو؛ میزو 21 نوت با مشخصات قدرتمند در راه است!

محققان ایرانی داربست طلایی برای مهندسی بافت قلب ساختند

اسپری کردن اکسیدگرافن روی ماسک پوشش ضدویروسی ایجاد می‌کند

چین اولین ماهواره رقیب «استارلینک» ایلان ماسک را به فضا پرتاب کرد

کشف سیاره‌ای که همسایه‌ها آن را تحت فشار گذاشته‌اند!

دوربین شیائومی 14 و 14 اولترا یک مشکل جدی دارد

ارز دیجیتال نات کوین به صرافی‌ها می‌آید؛ وقتی شوخی، جدی می‌شود

شرکت Xbox یک فروشگاه بازی‌های موبایل در ماه جولای راه‌اندازی می‌کند

خروج فضاپیمای استارشیپ از آشیانه، برای آخرین تست های قبل از پرتاب

طراحی ماژول دوربین OnePlus 13 و OnePlus 13R متفاوت از نسل قبل است

کنسول دستی ROG Ally X ایسوس با مشخصات جذاب معرفی شد

گوشی پرچمدار 2024 سونی در حوزه دوربین قدرت‌نمایی خواهد کرد

اپل جنجال تبلیغ جدیدش را گردن ال‌جی انداخت!

تصویر روز ناسا؛ معروف‌ترین سیاهچاله جهان

جانبازان سرمایه‌های ارزشمند نظام اسلامی و دانش آموختگان مکتب دفاع مقدس هستند

قلم لمسی اپل پنسل پرو چه قابلیت‌های جدیدی دارد؟

چیزهایی که دوست نداریم در GTA 6 شاهد آن‌ها باشیم

به‌لطف هوش مصنوعی، انویدیا برترین طراح تراشه در دنیا شد

ساخت نقشه سه‌بعدی جدید مغز انسان توسط دانشمندان هاروارد و گوگل

اپل برای آیفون های تاشوی خود دست به دامان سامسونگ شد!

«دست خدا» در اعماق فضا

عینک اسپیکردار 2024 هواوی در راه است

تصویر ⁧هابل ⁩ از ESO 422-41 با فاصله ی 34 میلیون سالِ نوری از زمین

MSI کارت گرافیک RTX 4070 Ti SUPER Shadow 3X را معرفی کرد؛ ایده‌آل برای عاشقان بازی

درمان افسردگی بدون دارو با کمک یک هدبند

آپدیت پوکو F6 Pro پیش از رونمایی این گوشی منتشر شد!

پردازنده‌های نسل بعد اینتل احتمالا 2 تغییر بزرگ تجربه می‌کنند

موتو جی استایلوس فایو جی (2024) با قلم بهبود یافته معرفی شد

ابرنواخته واقعی چه شگلی است؟

Assassin’s Creed Infinity ممکن است اشتراک ماهیانه داشته باشد

نسخه PC بازی God of War Ragnarok به‌زودی معرفی خواهد شد

مایکروسافت تغییر مهمی در منو استارت ویندوز 11 اعمال کرد

هوش مصنوعی سلول‌های قاتل سرطان را شناسایی می‌کند

عرضه دسترسی زودهنگام The Rogue Prince of Persia با تاخیر مواجه شد

بازی/ Middle East Empire؛ امپراتوری خاورمیانه را به دست بگیرید

خالق ChatGPT، رقیب جستجوگر گوگل را می‌سازد