پروژه جدید گوگل مکالمه به زبان خارجی با صدای کاربر را میسر می‌سازد

گوگل با تکیه بر هوش مصنوعی و یادگیری ماشینی به همه کاربران امکان صحبت کردن به زبان های خارجی و با صدای خودشان را هدیه می کند.

این روش به انتقال بهتر منظور و حس کاربر کمک می‌کند

کمپانی های بزرگ فناوری تا کنون موفق به توسعه ابزارهای نسبتا دقیق و سریعی برای ترجمه متون و تصاویر شده اند. با این حال ترجمه صوتی توسط این ابزارها با تاخیر صورت می گیرد و علاوه بر این صدای خروجی غیرواقعی است. گوگل حالا قصد دارد این روند را تسریع بخشیده و امکان ترجمه صوتی با صدای خود کاربر را فراهم کند.

ابزارهای فعلی حین ترجمه صوتی ابتدا جمله کاربر را به متن تبدیل کرده و پس از ترجمه آن دوباره متن را به جملات ادا شده تبدیل می کنند. این مساله باعث تاخیر می شود اما پروژه تحقیقاتی جدید گوگل به نام Translatotron بدون نیاز به این فرایند و با تکیه بر هوش مصنوعی مستقیما جملات کاربر را به یک زبان دیگر تبدیل می کند. مزیت دیگر این پروژه بیان جملات ترجمه شده با لحن و آهنگ خود کاربر است که در انتقال دقیق منظور و حس به طرف مقابل کمک خواهد کرد.ترجمه صوتی

هرچند روش قبلی کارایی خود را ثابت کرده اما محققان هوش مصنوعی گوگل بر این باورند که حذف فرایند تبدیل صدا به متن به خاطر مزایای قابل توجه در نهایت به روش قبلی غلبه خواهد کرد. Translatotron در تست های گوگل هنوز نسبت به روش آبشاری ضعف هایی دارد اما محققان گوگل عملی بودن آن را نشان داده اند. علاوه بر این پروژه جدید مبتنی بر یادگیری ماشینی است و طبیعتا مثل مدل های دیگر با گذشت زمان بهبود پیدا می کند.

با توجه به حفظ صدای اصلی در پروژه Translatotron احتمال تعبیه آن در سیستم های هوشمند آتی گوگل چندان دور از ذهن نیست. بر اساس برخی گزارش ها آپدیت جدید گوگل ترنسلیت، تشخیص خودکار زبان‌ها در ترجمه تصویری نیز را ممکن می‌کند.

لینک منبع اصلی