سیاست و بازاریابی

آخرين مطالب

آمازون در حال توسعه بزرگ‌ترین مدل هوش مصنوعی تبدیل متن به گفتار است نکات خواندني

آمازون در حال توسعه بزرگ‌ترین مدل هوش مصنوعی تبدیل متن به گفتار است
  بزرگنمايي:

سیاست و بازاریابی - دیجیاتو / طبق ادعای محققان آمازون، برای آموزش بزرگ‌ترین نسخه این مدل از 100 هزار ساعت سخنرانی در حوزه عمومی استفاده شده است.
محققان آمازون ادعا کرده‌اند که بزرگ‌ترین مدل هوش مصنوعی تبدیل متن به گفتار را آموزش داده‌اند. این مدل جدید که BASE TTS نام دارد، با 100 هزار ساعت اطلاعات صوتی آموزش داده شده است و با قابلیت‌های بی‌سابقه خود، می‌تواند در حوزه مدل‌های تبدیل متن به صدا انقلابی ظاهر شود.
مدل جدید آمازون Big Adaptive Streamable TTS با قابلیت‌های نوظهور نام دارد که به‌صورت مخفف و با عنوان BASE TTS شناخته می‌شود. برای آموزش بزرگ‌ترین نسخه این مدل از 100 هزار ساعت سخنرانی در حوزه عمومی استفاده شده که 90 درصد آن به زبان انگلیسی و بخش دیگر به زبان‌های آلمانی، هلند و اسپانیایی است.

سیاست و بازاریابی


بازار
این نسخه (BASE-large) با پشتیبانی از 980 میلیون پارامتر، ظاهرا بزرگ‌ترین مدل در نوع خود محسوب می‌شود. همچنین این مدل اساساً یک تقلید کننده صدا نیست، بلکه با وجود ویژگی‌های نوظهور خود می‌تواند حتی در صورت مواجه‌شدن با جملات پیچیده، در زمینه ارائه گفتار با صدای طبیعی، بهترین عملکرد را داشته باشد. آمازون همچنین مدل‌های 400 و 150 پارامتری مدل خود را براساس 10 هزار و 1000 ساعت صدا آموزش داده است.
نمونه تولید‌شده توسط مدل هوش مصنوعی تبدیل متن به گفتار آمازون
در وب‌سایتی که برای این مدل ساخته شده است، چندین نمونه صدا وجود دارد که توسط این هوش مصنوعی براساس برخی متون دشوار ایجاد شده است.
باید به این نکته توجه داشت که این مدل هنوز در مرحله فرایند تجربی خود قرار دارد و برای اهداف تجاری یا موارد مشابه نمی‌توان از آن استفاده کرد. در تحقیقات بعدی احتمالاً توضیحات بیشتری درباره توانایی‌های نوظهوری و همچنین نحوه آموزش و استقرار مدل اعلام خواهد شد.
هرچند منابع و داده‌های مورداستفاده در BASE TTS به دلایل امنیتی فاش نشده است، اما عملکرد چشمگیر این مدل نشانه‌های روشنی از پیشرفت حوزه هوش مصنوعی است.

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/734799/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

پیام تبریک مدیرعامل سازمان منطقه آزاد کیش به مناسبت روز جهانی ارتباطات و روابط عمومی

اپل طی 4 سال جلوی 7 میلیارد دلار تراکنش کلاهبرداری بالقوه را گرفته است

تعداد دستگاه‌های مجهزبه HarmonyOS هواوی به 800 میلیون رسید

بزرگ‌ترین توفان خورشید در راه زمین / آیا در ایران بازهم شفق قطبی خواهیم دید؟

پورتال جنجالی نیویورک به‌دلیل «رفتار نامناسب مردم» موقتا تعطیل شد

بازوی کهکشان راه شیری بر فراز سبلان

آنتروپیک چت‌بات هوش مصنوعی Claude را در اروپا منتشر کرد

شکایت تولیدکنندگان محتوای آمریکایی برای جلوگیری از ممنوعیت تیک‌تاک

یک سیارک به اندازه خودرو از کنار زمین گذشت

بمب هسته ای چطور کار میکنه؟

متا از رویای بزرگ خود به نفع هوش مصنوعی چشم‌پوشی کرد

پرفروش‌ترین بازی دنیا 15 ساله شد

جایگاه انرژی‌های تجدیدپذیر در الگوی اسلامی ایرانی پیشرفت

آینده نگری تیم عمرانی کیش درخصوص مدیریت پساب

دومین سیاره پشمکی کشف شد

آینده نگری سازمان منطقه آزاد کیش درخصوص مدیریت پساب این جزیره زیبا

تصویر و مشخصات گلکسی M35 سامسونگ لو رفت

تفاله قهوه را دور نریزید؛ با آن خانه بسازید!

احیای دارالقرآن بنیاد شهید و امور ایثارگران استان ایلام در دستور کار است

وزیر ارتباطات: کیفیت و سرعت اینترنت افزایش پیدا می‌کند

برنامه‌های اندرویدی به‌زودی می‌توانند کنترل موس با حرکات چهره را ممکن کنند

تصویر روز ناسا ؛ خوشه 37

گوگل به سوءاستفاده احتمالی از یوتوب برای آموزش هوش مصنوعی OpenAI رسیدگی می‌کند

گوشی ریلمی 12 پرو پلاس به نسخه آزمایشی اندروید 15 آپدیت شد

تاریخ اولین پرواز سرنشین‌دار «بلو اوریجین» پس از وقفه طولانی

دیدار صمیمانه مدیر کل آموزش بنیاد با سرپرست معاونت دانشجویان داخل وزارت علوم، تحقیقات و فناوری

ابراز خوشحالی GPT-4o از رونمایی خودش

پنجاهمین ماموریت مداری «اسپیس‌ایکس» در سال 2024 انجام شد

دمویی از عملکرد خیره‌کننده دستیار هوش مصنوعی گوگل Astra

واکشن جالب نسخه جدید ChatGPT بعد از شناسایی سریع سگ

برگزاری میز ارتباطات مردمی در بنیاد مازندران همزمان با سفر ریاست جمهوری اسلامی ایران

6 ماه پس از اخراج نافرجام «سم آلتمن»، هم‌بنیان‌گذار OpenAI این استارتاپ را ترک می‌کند

سونی اکسپریا 1 مارک 6 با اسنپدراگون 8 نسل 3 و نمایشگر فول‌اچ‌دی معرفی شد

ابراز خوشحالی GPT-4o از رونمایی خودش!

هوش مصنوعی در مقابل فیلمسازها کم آورد

​​​​​​​دیدار سرپرست بنیاد آذربایجان شرقی با 6 خانواده شهید در عجب شیر

همزمان با دهه کرامت از دختران شهدای البرزی تجلیل شد

ادعای بزرگ: گوشی هواوی میت 70 با پردازنده 5 نانومتری عرضه می‌شود

گرمای زمین زنبورهای عسل را هم گرفتار کرد

دیدار مدیرعامل بیمه دی با استاندار فارس

عمیق‌ترین گودال آبی جهان که انتهای آن هنوز کشف نشده است

قدرتمندترین شعله خورشیدی منفجر شد

ایده‌ای رویایی برای ساخت قطار در ماه

سوژه‌های جذاب در نشر شاهد به تولیدات هنری تبدیل می‌شوند

پیام تسلیت رئیس بنیاد شهید و امور ایثارگران در پی درگذشت مادر شهیدان والامقام «جاموسی»

پیام تسلیت معاون اول رئیس‌جمهور در پی درگذشت مادر شهیدان «جاموسی»

اولین آپدیت پیکسل 8a با یک ویژگی جدید منتشر شد

معاون اپل استراتژی‌های این شرکت درباره مدل‌های مختلف آیپد را توضیح داد

هوش مصنوعی گوگل دوباره اشتباه کرد؛ پاسخ نادرست جمینای در دموی رسمی

به لطف نسخه جدید ChatGPT، افراد نابینا می‌توانند محیط اطراف خود را بررسی کنند