ابزارهای هوش مصنوعی در برابر چشمان ما با سرعت هشدار دهنده ای در حال تکامل هستند، اما همچنان ناقص هستند. دیدن جزئیات عجیب و غریب در تصاویر تولید شده توسط هوش مصنوعی یکی از این ایرادات است که گاهی می تواند بسیار خنده دار باشد. اما یکی از مواردی که انواع مختلف هوش مصنوعی با آن مشکل دارند، شبیه سازی و ایجاد تصویر واقعی از دست انسان است! ناتوانی هوش مصنوعی در درک درست دست این روزها به یکی از موضوعات داغ تبدیل شده است و در مورد آن بسیار صحبت می شود.
اما دلیل چنین نقص عجیبی چیست و چرا دست ها برای ابزارهای تصویربرداری مبتنی بر هوش مصنوعی چالش برانگیز هستند؟ در ادامه قصد داریم این مشکل را بررسی کنیم. با ما در DJ باشید.
چرا دست های تولید شده توسط هوش مصنوعی به هم ریخته است؟
هر کسی که از ابزارهای هوش مصنوعی برای ایجاد تصاویر استفاده کرده است، ممکن است متوجه شده باشد که دست ها به ندرت درست ظاهر می شوند. با این حال، شاید هیچ کس واقعاً اهمیتی نداد تا اینکه یک سری “عکس” در توییتر منتشر شد و این موضوع به یک موضوع داغ تبدیل شد.
با نگاه دقیق تر و مشاهده دست های عجیب افراد داخل عکس به سرعت می توان متوجه شد که تصویر مورد نظر توسط هوش مصنوعی تولید شده است. اما هوش مصنوعی Midjourney به وضوح و غیرقابل انکار این مشکل را در فیلم های خود دارد که آن را جالب تر می کند.
Midgerni، یکی از بهترین ابزارهای هوش مصنوعی موجود، نتوانست با پیچیدگی دست انسان کنار بیاید، بنابراین قابلیت های این ابزار و همتایانش زیر سوال رفت. حتی DALL-E نمی تواند به طور واقع بینانه انگشتان و ناخن ها را بکشد.
با توجه به تبلیغات گسترده در مورد عدم توانایی هوش مصنوعی در کشیدن دست، توسعه دهندگان Midgerni سعی کردند با انتشار نسخه پنجم این ابزار تا حد امکان مشکل را برطرف کنند.
در نسخه جدید سیستم ترسیم دستی به طور قابل توجهی بهبود یافته است که نشان می دهد مهندسان هوش مصنوعی به این مشکل توجه کرده و تصمیم به بهبود قابلیت های نرم افزار خود گرفته اند.
با این حال، موتورهای دیگر هوش مصنوعی کمی کند هستند تا با Midgerni همگام شوند، بنابراین انجام تنظیمات بر روی تصاویر هوش مصنوعی در فتوشاپ هنوز یک مهارت ارزشمند است. در واقع، مانع اصلی که برنامه نویسان با آن روبرو هستند این است که آموزش هوش مصنوعی برای کشیدن دست های طبیعی فرآیند بسیار پیچیده ای است.
چرا ابزارهای تصویربرداری مبتنی بر هوش مصنوعی مشکلات دستی دارند؟
موتورهای هوش مصنوعی از شبکه های متخاصم مولد (GAN) یا پخش پایدار برای تولید تصاویر استفاده می کنند. هر دو فناوری برای خلق حتی ابتدایی ترین آثار هنری به منابع، آموزش و قدرت پردازش بالایی نیاز دارند.
از آنجایی که تصاویر از قبل برای آموزش هوش مصنوعی حیاتی هستند، برنامه نویسان باید هزاران یا حتی میلیون ها تصویر را در نرم افزار خود وارد کنند و فرآیند پرسش و پاسخ را بارها و بارها تکرار کنند تا هوش مصنوعی یک کلمه را بفهمد. مراجعه کنید و چگونه باید نمایش داده شود؟
اما تصاویر مرجعی که هوش مصنوعی از آنها آموزش داده میشود، عمدتاً دو بعدی هستند و دستها را در موقعیتها و اشکال مختلف نشان میدهند. به عنوان مثال، در یک تصویر دست باز است، در تصویری دیگر مشت دارد، در تصویری دیگر علامت پیروزی را نشان می دهد و غیره. بنابراین در نهایت هوش مصنوعی واقعاً مفهوم دست ها را درک نمی کند و تصاویری که از آنها می آموزد همیشه دست ها را به وضوح یا به اندازه کافی ثابت نشان نمی دهد. به همین دلیل است که دست های تولید شده توسط Midgerni می توانند بسیار زشت باشند و این به دلیل سردرگمی هوش مصنوعی است.
بنابراین به همان اندازه که امثال ایلان ماسک به توسعه روزافزون هوش مصنوعی اهمیت می دهند، واضح است که برخی از بخش های این فناوری هنوز راه درازی در پیش دارند و چیزهای زیادی برای یادگیری دارند.
بیشتر بخوانید:
- آموزش ساخت تصاویر هنری با هوش مصنوعی بینگ (Bing Image Creator)
چرا ابزارهای هوش مصنوعی به کندی پیشرفت می کنند؟
درست است که نسخه پنجم Midjourney مطابقت بهتری بین پیامک ها و تصاویر تولید شده دارد و همچنین وضوح بالاتر و ابزارهای اضافی را ارائه می دهد. اما دستیابی به چنین دستاوردهایی آسان و ارزان نیست.
آموزش هوش مصنوعی برای انجام بهتر کارها، و در این مورد خاص، طراحی با دست واقعی، مستلزم ارائه تصاویری بهتر به خصوص سه بعدی است. این بدان معناست که زمان و نیروی انسانی زیادی صرف فرآیند شکل گیری می شود. فرآیندی که شامل: ارائه تصاویر منبع کافی، بهبود رمزگذاری و تکرار آموزش تا زمانی که هوش مصنوعی به درستی برسد.
حتی پس از انجام این مراحل، نرم افزار هوش مصنوعی می تواند اشتباهات زیادی را در هنگام تولید آثار هنری منحصر به فرد و برجسته مرتکب شود. بنابراین، غیر منطقی نیست که امیدوار باشیم مبدلهای متن به تصویر رایگان مبتنی بر هوش مصنوعی بتوانند به سرعت در سطح Midger پیشرفت کنند.
به بیان ساده، مشکل موتورهای هوش مصنوعی فقط ناتوانی آنها در درک درست ظاهر یا عملکرد انسان، مانند دست ها و پاها نیست. بلکه تامین هزینه آموزش و دسترسی به تصاویر مرجع سه بعدی و همچنین تکنیک های یادگیری ماشینی نیز یکی از چالش های اصلی برای پیشرفت هوش مصنوعی است.
ابزارهای هوش مصنوعی بالاخره این مشکل را حل خواهند کرد
دست ها موضوع بسیار سخت و پیچیده ای برای هوش مصنوعی هستند، اما در شرایط فعلی راه حل هایی برای آن وجود دارد. DALL-E 2، Midgerni 5 و دیگر پلتفرم های پیشرفته بالاخره توانسته اند تولید انگشتان عجیب و غریب را در تصاویر خود به حداقل برسانند، هرچند هنوز به طور کامل این مشکل را برطرف نکرده اند.
بنابراین، پیشرفتها در زمینههای مختلف هوش مصنوعی تضمین میکند که این فناوری دائماً در حال تکامل است و توسعهدهندگان آن همیشه در حال یادگیری روشهای جدید برای آموزش و بهبود آن هستند.