سیاست و بازاریابی

آخرين مطالب

الگوریتم ردیابی دست گوگل؛ نویدبخش تشخیص زبان اشاره بازاريابي

  بزرگنمايي:

سیاست و بازاریابی - پژوهشگران هوش مصنوعی گوگل الگوریتمی ابداع کرده‌اند که بدون نیاز به سخت‌افزارهای قدرتمند برای تجزیه‌وتحلیل داده‌های حجیم، امکان ردیابی حرکات دست را صرفا با استفاده از گوشی هوشمند مجهز به دوربین فراهم می‌آورد.

مقاله‌های مرتبط:
پروژه یوفونیای گوگل؛ تشخیص گفتار مبتلایان به اختلالات تکلم به کمک هوش مصنوعی گوگل با Geasture زبان اشاره را به تکلم ترجمه می‌کند
با‌ اینکه میلیون‌ها نفر از زبان اشاره برای برقراری ارتباط استفاده‌ می‌کنند، پژوهش‌هایی با هدف تشخیص حرکات پیچیده‌ی دست در این زبان و تبدیل آن به گفتار تا‌به‌امروز موفقیت چندانی را شاهد نبوده‌اند. در این میان، شاید پیشرفت‌های اخیر آزمایشگاه‌های هوش مصنوعی گوگل درزمینه‌ی ردیابی زمان‌ واقعی حرکات دست، مقدمه همان دستاورد بزرگی باشد که مدت‌ها است در انتظار آن هستیم. این تکنیک جدید با به‌کارگیری چند روش میان‌بر هوشمندانه و بازدهی رو‌به‌رشد سیستم‌های مبتنی‌بر یادگیری ماشین ، به‌صورت درلحظه (real-time) نقشه‌ای از دست و تمام انگشتان آن‌ را تنها با استفاده از گوشی هوشمند و دوربین آن ترسیم‌ می‌کند. در وبلاگ گوگل ، مطلبی به‌قلم والنتین بازارفسکی ( Valentin Bazarevsky) و فن ژانگ ( Fan Zhang)، پژوهشگران این پروژه، آمده‌ است: درحالی‌که رویکردهای پژوهشی حاضر برای نتیجه‌گیری نهایی عمدتا نیازمند به‌کارگیری سیستم‌های رومیزی قدرتمند هستند، در این روش به عملکردی درلحظه صرفا با استفاده از گوشی هوشمند دست‌ یافته‌ایم که حتی در مقیاس وسیع‌تر، می‌تواند برای تشخیص حرکات چند دست نیز به‌کار‌ رود. درک حرکات دست به‌صورت درلحظه، قطعا از موضوعات چالش‌برانگیز در حوزه‌ی بینایی کامپیوتر است؛ چراکه هنگام حرکت، انگشتان اغلب کف دست را می‌پوشانند یا دست‌ها روی یکدیگر قرار می‌گیرند و حرکات دست فاقد الگویی با کنتراست زیاد است. علاوه‌براین‌، از‌آنجا‌که حرکات دست اغلب سریع و جزئی هستند، تشخیص صحیح آن‌ها کار آسانی نیست و سرعت زیاد موردنیاز در اپلیکیشن زمان‌ واقعی، تشخیص صحیح را به‌مراتب دشوارتر نیز خواهد کرد. حتی در سیستم‌های چند‌دوربینه‌ی مجهز به حسگرهای تشخیص عمق مشابه آنچه در پروژه‌ی SignAll (پروژه‌ای با هدف تشخیص زبان اشاره با بهره‌گیری از هوش مصنوعی و بینایی کامپیوتر) استفاده شده‌ است، ردگیری تمامی حرکات دست امکان‌پذیر نیست؛ هرچند این دشواری‌ها باعث توقف پروژه نشده‌ است.


بخشی از هدف پژوهشگران گوگل در این پروژه، کاستن از حجم داده‌هایی است که الگوریتم باید برای بررسی گزینش‌ کند؛ چراکه داده‌ی کمتر به‌معنای پردازش کمتر و به‌تبع آن، نتیجه‌گیری سریع‌تر است. به‌عنوان مثال، آن‌ها با صرف‌نظر از ایده‌ی الزام سیستم به تشخیص ابعاد و موقعیت کل دست، تنها کف دست را ملاک قرار دادند. بدین‌ترتیب، علاوه‌بر آنکه ردیابی کف دست به‌دلیل شکل ثابت و مشخصش چندان دشوار نخواهد بود، نگرانی‌ای درباره‌ی ناتوانی سیستم در بررسی و پردازش تصاویر مستطیل‌شکل در ابعاد مختلف نیز وجود نخواهد‌ داشت. برای آموزش‌‌دادن سیستم یادگیری ماشینی، پژوهشگران 21 نقطه را به‌صورت دستی به حدود 30 هزار تصویر مختلف از دست اضافه کردند
طبیعتا وقتی کف دست تشخیص داده‌ شد، انگشتانی که از آن خارج شده‌اند می‌توانند به‌صورت جداگانه تجزیه‌و‌تحلیل شوند. الگوریتمی مجزا محل قرارگیری بندها و سر انگشتان دست را تشخیص می‌دهد و در هر تصویر، مختصاتی به این 21 نقطه‌ی تخمینی نسبت می‌دهد. این مختصات فاصله‌ی تقریبی نقاط از محل عکس‌برداری را نیز شامل می‌شود (الگوریتم با توجه به اندازه و زاویه‌ی کف دست و داده‌های دیگر، این فاصله را تخمین می‌زند). در مرحله‌ی تشخیص انگشتان دست و به‌منظور جمع‌آوری داده برای فراگیری سیستم یادگیری ماشین، پژوهشگران ناچار بودند در ابتدا 21 نقطه مذکور را به‌صورت دستی به حدود 30 هزار تصویر گرفته‌شده از حالات مختلف دست در نورهای متفاوت اضافه کنند. مثل همیشه، هوش مصنوعی فقط با تکیه بر سخت‌کوشی بشر قادر به پیش‌روی است. وقتی حالت قرارگیری دست مشخص‌ شد، با انبوهی از حالات شناخته‌شده در زبان اشاره مقایسه می‌شود و نتیجه، الگوریتم ردیابی دست سریع و دقیقی خواهد بود که نه الزاما روی کامپیوتر ارتقایافته یا سیستم ابری که در عمل کامپیوتر ارتقایافته شخص دیگری است؛ بلکه روی گوشی هوشمند معمولی هم اجرا‌شدنی است. این اپلیکیشن تماما در فریم‌ورک مدیاپایپ، فریم‌‌ورک یادگیری ماشین با قابلیت ساخت اپلیکیشن‌های چند‌سکویی (Cross Platform) با محوریت داده‌های ویدئویی و صوتی، اجرا می‌شود.
تشخیص درلحظه‌ی (real-time) دست در اپلیکیشن موبایل طراحی‌شده با استفاده از فریم‌ورک مدیاپایپ. الگوریتم ارائه‌شده به‌کمک یادگیری ماشین، 21 نقطه‌ی سه‌بعدی را در هر فریم تشخیص‌ می‌دهد. بُعد سوم یا عمق نقاط (فاصله‌ی نقاط از دوربین)، به‌صورت خاکستری‌مقیاس (grayscale) در تصویر مشاهده می‌شود. با نزدیک‌شدن نقاط به دوربین، رنگ آن‌ها به سفید و با دورشدن از دوربین به سیاه متمایل‌ می‌شود.
خوشبختانه دیگر پژوهشگران نیز قادر خواهند بود از نتایج این تحقیقات استفاده کنند و سیستم‌های موجود را ارتقا بخشند که شاید برای اجرای روش‌های دیگر تشخیص دست، به سخت‌افزارهای قدرتمندی نیاز داشته باشند. بااین‌حال، تا تشخیص واقعی زبان اشاره که علاوه‌بر هر دو دست، از حالات چهره نیز برای برقراری ارتباط بهره‌‌ می‌گیرد، راهی طولانی در پیش داریم. ازآنجاکه نتایج این تحقیقات تابه‌حال در هیچ‌یک از محصولات گوگل استفاده نشده، امکان دسترسی به منبع‌ پروژه در گیت‌هاب برای عموم فراهم است: امیدواریم ارائه این عملکرد تشخیص دست به عموم توسعه‌دهندگان و محققان، مقدمه‌ای برای استفاده‌ی خلاقانه و یافتن کاربردهای جدید و هیجان‌انگیز برای آن باشد و پیدایش مسیرهای پژوهشی نوینی را سبب شود.

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/84207/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

گوشی ارزان جدید موتورولا با باتری پرظرفیت در راه است

گوگل کارمندان معترض به همکاری با رژیم صهیونیستی را اخراج کرد

ارتش سوسک‌های رباتیک مجهز به کوله‌پشتی رایانه‌ای در بیابان

اخترشناسان پرجرم‌ترین سیاه‌چاله ستاره‌ای کهکشان راه شیری را کشف کردند

مانیتور 27 اینچ جدید ازراک آنتن وای‌فای دارد

از روبوتاکسی تا مریخ؛ نگاهی به بدترین پیش‌بینی‌ها و وعده‌های ایلان ماسک در 15 سال اخیر

هکرهای چینی برای حمله به زیرساخت‌های آمریکا آماده می‌شوند

هوش مصنوعی متا رسماً به اینستاگرام، واتس‌اپ و فیسبوک اضافه شد

تصویر روز ناسا؛ روبه‌روی NGC 1232

تکریم خانواده شهدا و  ترویج فرهنگ ایثار و شهادت امر بزرگی است که باید از دل جریان‌های مردمی بجوشد

کمک آمریکا به تراشه‌سازان؛ مایکرون 6 میلیارد دلار بودجه دریافت می‌کند

مدل تلسکوپ فضایی جیمز وب با اندازه واقعی به نمایش در می‌آید

نکاتی درباره آیین‌نامه عرضه اینترنتی دارو

نسخه‌ آیفون واتساپ با دستور دولت چین از اپ استور حذف شد

مواد شیمیایی در پارکینگ ها احتمال ابتلا به ALS را افزایش می دهد

آیفون 17 پلاس ظاهراً با نمایشگر کوچک‌تر از گوشی‌های فعلی پلاس معرفی می‌شود

پیشرفت صنعت تراشه چین در سایه تحریم‌ها؛ تولید 40 درصد رشد کرد

ساخت تصویر متحرک 3 ثانیه‌ای در پیام‌رسان پیش‌فرض اندروید امکان‌پذیر می‌شود

طراحی جلویی شیائومی Civi 4 در کنسول گوگل پلی مشاهده شد

زومی حیرت آور درون صورت فلکی اوریون

دیدار مشاور رئیس جمهور در امور روحانیت با خانواده شهدا در سمنان

وزیر ارتباطات: یک‌سوم کشور به زیرساخت‌های فیبرنوری مجهز شدند

با بزرگترین ستاره شناخته شده آشنا شوید

شهدا بهترین الگو برای انسان در مسیر الله هستند

آیفون 16 پرو به پوشش ویژه لنز دوربین برای بهبود کیفیت تصویر مجهز خواهد شد

عملیاتی شدن 5 فروند زیردریایی هوشمند با قابلیت تعقیب هدف و نشت‌یابی

تاریخ رونمایی گوشی پرچمدار 2024 سونی لو رفت

اپل بیش‌از 250 میلیون دلار در پردیس سنگاپور سرمایه‌گذاری می‌کند

با این ابرسازه فضایی، یک میلیارد انسان میتونن در فضا زندگی کنن!

اندروید 15 احتمالاً برای افزایش امنیت اقدام به قرنطینه اپلیکیشن‌های مشکوک می‌کند

امروز در فضا ؛ کشف اولین سیارات فراخورشیدی در اندازه زمین توسط تلسکوپ کپلر

آنر 200 لایت به زودی برای عرضه در بازار جهانی رونمایی می‌شود

گوشی پرچمدار 2024 هواوی از اندروید 12 استفاده می‌کند

دیدار رئیس بنیاد شهید و امور ایثارگران با خانواده شهید نادر مهدوی

برخی گوشی‌های سری گلکسی S21 سامسونگ با مشکل نمایشگر مواجه شده‌اند

صداهای وحشتناک ثبت شده از اجرام واقعی کیهان

دیدار معاون رئیس جمهور و رئیس بنیاد شهید و امور ایثارگران با خانواده شهید نادر مهدوی

هیچ مانعی برای برنامه های فرهنگی در حوزه ترویج فرهنگ ایثار و شهادت وجود ندارد

سامسونگ احتمالاً کشوی عمودی برنامه ها را با One UI 7 ارائه خواهد کرد

موضوع ایثار و شهادت موضوع بسیار مهم دولت سیزدهم است/بکارگیری ظرفیت های مردمی از برنامه های جدی بنیاد است

نسخه جدید ربات انسان‌نما اطلس با قابلیت‌های هوش مصنوعی معرفی شد

شبیه‌ساز بازی Delta برای آیفون منتشر شد

ربات «اطلس» بازگشت!

شهدا، فرهنگ ایثار و شهادت را در جامعه زنده نگه داشته اند

توالت هوشمند 1٫5 میلیارد تومانی در هفته طراحی میلان به‌نمایش درآمد

تراشه Kirin 9010 هواوی با CPU دوازده هسته‌ای معرفی شد

ادعای کارمندان سابق تیک‌تاک: پروژه ذخیره‌سازی داده‌ها در آمریکا تا حد زیادی نمایشی است

علم منتظر معجزه نمی ماند

قابلیت جدید واتساپ: اطلاع از مخاطبانی که اخیراً آنلاین بوده‌اند

خداحافظ نبوغ!