بازسازی چهره از روی صدای شخص توسط هوش مصنوعی ممکن شد

حتماً برایتان پیش آمده که تنها با شنیدن صدای یک فرد، ظاهر چهره او را در  ذهن مجسم کنید. هوش مصنوعی حالا می تواند دقیقاً همین کار را انجام دهد و تنها با یک فایل صوتی کوتاه از صدای شخص، تصویری از چهره او را طراحی کند.

شبکه عصبی Speech2Face در واقع شامل کامپیوتری است که می تواند مشابه با مغز انسان فکر کند. به منظور آموزش این سیستم، محققان MIT از میلیون ها ویدیوی صحبت کردن بیش از ۱۰۰ هزار نفر استفاده کرده اند. با استفاده از این داده ها، Speech2Face قادر به تشخیص ارتباط میان صدای افراد و خصوصیات فیزیکی خاص در چهره آنها شد و هوش مصنوعی با استفاده از کلیپ های صوتی مدل سازی عکس های واقعی از چهره را آغاز کرد.

Speech2Face

در برخی موارد نژاد، محدوده سنی و جنسیت افراد در تصاویر تولید شده به درستی تشخیص داده شده است.

به گفته محققان MIT در حال حاضر این سیستم تنها یک ظاهر میانگین از چهره طرف را ایجاد می کند و نمی تواند چهره واقعی هر شخص را بازسازی کند اما تصویر تولید شده از نظر محدوده سنی، نژاد و جنسیت هر شخص معمولاً صحیح است. با این حال تفسیرهای الگوریتم مورد نظر همچنان با بی نقص بودن فاصله دارد و در شرایط روبرو شدن با تغییرات زبانی نتایج متفاوتی را ارائه می دهد. به عنوان مثال هنگامی که یک فرد آسیایی زردپوست به زبان چینی صحبت می کند تصویر یک فرد آسیایی ایجاد می شود اما اگر همان فرد به انگلیسی صحبت کند هوش مصنوعی تصویر یک فرد سفید پوست را تولید می کند.

به گفته محققان داده های محدودِ مورد استفاده برای یادگیری که از یوتیوب استخراج شده از دلایل دقت کم این سیستم است. این چنین مشکلاتی می تواند به تعصب نژادی و جنسیتی هوش مصنوعی هم منجر شود.

شاید این فناوری در آینده با پیشرفت بیشتر بتواند در زمینه شناخت مجرمان مفید باشد و البته شاید هم به ابزاری برای نقض حریم خصوصی بدل شود.

لینک منبع اصلی