سیاست و بازاریابی

آخرين مطالب

هوش مصنوعی EMO برای تبدیل عکس به ویدیو توسط علی‌بابا معرفی شد نکات خواندني

هوش مصنوعی EMO برای تبدیل عکس به ویدیو توسط علی‌بابا معرفی شد
  بزرگنمايي:

سیاست و بازاریابی - دیجیاتو / این مدل می‌تواند عکس‌های شما را به ویدیوهای واقعی تبدیل کند که در آن‌ها در حال صحبت‌کردن یا آوازخواندن هستید.
محققان شرکت چینی علی‌بابا (Alibaba)، سیستم هوش مصنوعی جدیدی به نام «EMO» (مخفف Emote Portrait Alive) را توسعه داده‌اند که می‌تواند یک عکس پرتره را به ویدیو تبدیل کند. به‌طور خلاصه، این مدل می‌تواند عکس‌های شما را به ویدیوهای واقعی تبدیل کند که در آن‌ها در حال صحبت‌کردن یا آوازخواندن هستید.
براساس مقاله تحقیقاتی علی‌بابا، این مدل می‌تواند حرکات اجزای صورت و حالت‌های سر کاربران را به‌صورتی ایجاد کند که دقیقا با آهنگ صوتی ارائه‌شده مطابقت داشته باشد. همچنین از این مدل به‌عنوان یک پیشرفت بزرگ در زمینه تولید ویدیو براساس صدا یاد شده است، حوزه‌ای که محققان هوش مصنوعی سال‌ها آن را به چالش کشیده‌‌اند.
«لینروی تیان»، محقق اصلی این سیستم می‌گوید:
«تکنیک‌های سنتی اغلب نمی‌توانند طیف کاملی از حالات انسانی و منحصر‌به‌فردبودن سبک‌های صورت اشخاص را به تصوی بکشند. برای حل این مشکل، ما EMO را پیشنهاد می کنیم، یک چارچوب جدید که از رویکرد مستقیم صوتی به تصویر استفاده می‌کند و به مدل‌های سه‌بعدی متوسط یا نشانه‌های چهره نیازی ندارد.»
نحوه کار مدل تبدیل عکس به ویدیو علی‌بابا

سیاست و بازاریابی

مدل تبدیل عکس به ویدیو EMO از یک تکنیک هوش مصنوعی معروف به مدل انتشار استفاده می‌کند که از نظر تولید تصاویر واقعی، پتانسیل بسیار خوبی از خود نشان داده است. محققان این مدل را با مجموعه داده‌ای متشکل از 250 ساعت ویدیو‌های مربوط به سخنرانی‌ها، فیلم‌ها، نمایش‌های تلویزیونی و اجرای آواز آموزش داده‌اند.
برخلاف مدل‌های سنتی که بر مدل‌های سه‌بعدی صورت یا ترکیب اشکال برای تقریب حرکات صورت تکیه دارند، EMO می‌تواند مستقیما شکل موج صوتی را به فریم‌های ویدیویی تبدیل کند. این امر به آن اجازه می‌دهد تا حرکات ظریف و ویژگی‌های پیچیده هویتی مرتبط با گفتار طبیعی را نمایش دهد.
طبق آزمایش‌هایی که در مقاله توضیح داده شده، EMO به طور قابل‌توجهی از روش‌های پیشرفته موجود در معیارهای اندازه‌گیری کیفیت ویدیو، حفظ هویت و بیان بهتر استفاده می‌کند. محققان همچنین یک مطالعه روی کاربران انجام دادند که نشان داد ویدیوهای تولید شده توسط EMO طبیعی‌تر و احساسی‌تر از ویدیوهای تولیدشده توسط سایر سیستم‌ها هستند.

supports HTML5 video

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/736101/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

جشنواره قرآن و عترت مرکز مقاومت بسیج بنیاد شهید و امور ایثارگران برگزار می‌شود

مجله علمی «شفای خاتم» وابسته به بنیاد شهید و امور ایثارگران در پایگاه اسکوپوس نمایه شد

عنوان بعدی ناتی داگ تصورات از دنیای بازی های ویدئویی را تغییر می‌دهد

تصاویر عجیب از جراحی پیوند سر با استفاده از ربات ها و هوش مصنوعی

تبدیل دی اکسید کربن به سوخت پاک با بازده 100 درصد

معرفی دبیران اجرایی رویدادهای فرهنگی و هنری جزیره کیش/ هدفمند شدن رویدادهای فرهنگی و هنری در جزیره کیش

دیدار با جامعه ایثارگری برای مسئولان امید آفرین است

جمع آوری 480 هزار سند از آثار شهدای فارس توسط بنیاد شهید و امور ایثارگران استان

مک‌بوک تاشو اپل با تراشه M5 در سال 2026 از راه می‌رسد

کلاه گشادی که اسپاتیفای با فروش این گجت سر مردم گذاشت

اولین ربات جراحی سازگار با ام‌آرآی وارد آزمایش انسانی شد

پیام تسلیت رئیس بنیاد شهید و امور ایثارگران در پی درگذشت مادر شهیدان والامقام «آبرومند»

گوگل برای تولید تراشه Tensor G5 خود با TSMC همکاری می‌کند

این شیشه نیازی به تمیز کردن ندارد

کشف سیاره‌ای «بالقوه قابل سکونت» در فاصله تنها 40 سال نوری از زمین!

مایکروسافت باردیگر مرگ ویندوز 10 را به کاربران یادآوری کرد

اولین ماهواره کشف اسرار قطب‌های زمین پرتاب شد

این گوشی مقاوم دوربین حرارتی و دید در شب را یکجا به همراه دارد!

اینترنت ماهواره‌ای استارلینک در یک کشور آفریقایی فعال می‌شود

پلی استیشن در حال راه‌اندازی بخش موبایل گیمینگ است

من یک «آدم فضایی» هستم ولی هیچکس حرفم را باور نمی‌کند!

​​​​​​​دیدار سرپرست بنیاد آذربایجان شرقی با 8 عضو جامعۀ ایثارگری در تبریز

اولین جزئیات از گوشی ردمی نوت 14 پرو افشا شد

ایکس‌باکس بعدی در راه است؛ اما نه آنطور که فکرش را می‌کنید

ربات معجزه‌گری که غیرممکن را ممکن کرد!

شکرگزار توفیق خدمت به جامعه ایثارگری هستیم

بازی پرهیجان DOOM با سفر به «عصرهای تاریک» برمی‌گردد

تسلای مریخی ایلان ماسک شاید به زمین برخورد کند!

پیام‌رسان پیش‌فرض اندروید سرانجام به هوش مصنوعی مجهز شد

با ادامه محبوبیت هوش مصنوعی، سهام دل رکوردشکنی کرد

پنجمین ماه کامل سال نمایان شد

بررسی 350 پرونده ایثارگر در کمیسیون پزشکی بنیاد کرمانشاه

به سوی 6G و فراتر از آن!

ادعای عجیب یک استارتاپ: پیوند سر انسان حدود یک دهه دیگر ممکن می‌شود

نگاه نزدیک به دقیق‌ترین ماکت آیفون 16 با چیدمان جدید دوربین

قابلیت هوش مصنوعی Recall ویندوز روی پردازنده‌های ناسازگار هم قابل‌اجراست

سامسونگ ظاهراً توسعه تراشه 2 نانومتری خود را آغاز کرده است

دستور کانادا برای انحلال دو شرکت فناوری

اتحادیه اروپا: ChatGPT با اطلاعات نادرست خود هنوز استانداردهای ما را رعایت نمی‌کند

این گجت عجیب اپل واچ را به گوشی تبدیل می‌کند

اپل احتمالاً در macOS 15 بخش تنظیمات سیستم را بهبود می‌بخشد

جهت پذیری موتور های رپتور فضاپیمای Starship

آمریکا برای مقابله با موشک‌های بالستیک، موشک دیجیتال ساخت

واتس‌اپ ظاهراً به‌زودی امکان تغییر رنگ حباب چت‌ها را فراهم می‌کند

کالبدشکافی آیپد ایر 2024 از سخت‌بودن تعمیر این تبلت خبر می‌دهد

پردازنده تنسور G5 گوگل برای پیکسل 10 احتمالاً توسط TSMC ساخته خواهد شد

نام ربات ژاپنی با حل مکعب روبیک در 0.305 ثانیه در گینس ثبت شد

ژاپنی ها برای کاهش استفاده از نمک قاشق با طعم نمک ساختند!

تصویری جدید و ترسناک از فعالیت خورشید

تورم سالانه بخش ارتباطات به 18٫9 درصد رسید؛ تورم 16٫5 درصدی اینترنت در اردیبهشت‌ماه